Using phonetic knowledge in tools and resources for Natural Language Processing and Pronunciation Evaluation

Detalhes bibliográficos
Ano de defesa: 2016
Autor(a) principal: Almeida, Gustavo Augusto de Mendonça
Orientador(a): Não Informado pela instituição
Banca de defesa: Não Informado pela instituição
Tipo de documento: Dissertação
Tipo de acesso: Acesso aberto
Idioma: eng
Instituição de defesa: Biblioteca Digitais de Teses e Dissertações da USP
Programa de Pós-Graduação: Não Informado pela instituição
Departamento: Não Informado pela instituição
País: Não Informado pela instituição
Palavras-chave em Português:
Link de acesso: http://www.teses.usp.br/teses/disponiveis/55/55134/tde-17112016-161826/
Resumo: This thesis presents tools and resources for the development of applications in Natural Language Processing and Pronunciation Training. There are four main contributions. First, a hybrid grapheme-to-phoneme converter for Brazilian Portuguese, named Aeiouadô, which makes use of both manual transcription rules and Classification and Regression Trees (CART) to infer the phone transcription. Second, a spelling correction system based on machine learning, which uses the trascriptions produced by Aeiouadô and is capable of handling phonologically-motivated errors, as well as contextual errors. Third, a method for the extraction of phonetically-rich sentences, which is based on greedy algorithms. Fourth, a prototype system for automatic pronunciation assessment, especially designed for Brazilian-accented English.
id USP_a50e586a7720bc4c7f1281e44c7ec65d
oai_identifier_str oai:teses.usp.br:tde-17112016-161826
network_acronym_str USP
network_name_str Biblioteca Digital de Teses e Dissertações da USP
repository_id_str
spelling Using phonetic knowledge in tools and resources for Natural Language Processing and Pronunciation EvaluationUtilizando conhecimento fonético em ferramentas e recursos de Processamento de Língua Natural e Treino de PronúnciaAutomatic pronunciation assessmentAvaliação de pronúncia automáticaBalanceamento de corpusConversão grafema-fonemaCorpus balancingCorretor ortográficoNatural language processingProcessamento de língua naturalPronunciation trainingSpelling correctionText-to-speechTreino de pronúnciaThis thesis presents tools and resources for the development of applications in Natural Language Processing and Pronunciation Training. There are four main contributions. First, a hybrid grapheme-to-phoneme converter for Brazilian Portuguese, named Aeiouadô, which makes use of both manual transcription rules and Classification and Regression Trees (CART) to infer the phone transcription. Second, a spelling correction system based on machine learning, which uses the trascriptions produced by Aeiouadô and is capable of handling phonologically-motivated errors, as well as contextual errors. Third, a method for the extraction of phonetically-rich sentences, which is based on greedy algorithms. Fourth, a prototype system for automatic pronunciation assessment, especially designed for Brazilian-accented English.Esta dissertação apresenta recursos voltados para o desenvolvimento de aplicações de reconhecimento de fala e avaliação de pronúncia. São quatro as contribuições aqui discutidas. Primeiro, um conversor grafema-fonema híbrido para o Português Brasileiro, chamado Aeiouadô, o qual utiliza regras de transcrição fonética e Classification and Regression Trees (CART) para inferir os fones da fala. Segundo, uma ferramenta de correção automática baseada em aprendizado de máquina, que leva em conta erros de digitação de origem fonética, que é capaz de lidar com erros contextuais e emprega as transcrições geradas pelo Aeiouadô. Terceiro, um método para a extração de sentenças foneticamente-ricas, tendo em vista a criação de corpora de fala, baseado em algoritmos gulosos. Quarto, um protótipo de um sistema de reconhecimento e correção de fala não-nativa, voltado para o Inglês falado por aprendizes brasileiros.Biblioteca Digitais de Teses e Dissertações da USPAluisio, Sandra MariaAlmeida, Gustavo Augusto de Mendonça2016-03-21info:eu-repo/semantics/publishedVersioninfo:eu-repo/semantics/masterThesisapplication/pdfhttp://www.teses.usp.br/teses/disponiveis/55/55134/tde-17112016-161826/reponame:Biblioteca Digital de Teses e Dissertações da USPinstname:Universidade de São Paulo (USP)instacron:USPLiberar o conteúdo para acesso público.info:eu-repo/semantics/openAccesseng2017-09-04T21:05:35Zoai:teses.usp.br:tde-17112016-161826Biblioteca Digital de Teses e Dissertaçõeshttp://www.teses.usp.br/PUBhttp://www.teses.usp.br/cgi-bin/mtd2br.plvirginia@if.usp.br|| atendimento@aguia.usp.br||virginia@if.usp.bropendoar:27212017-09-04T21:05:35Biblioteca Digital de Teses e Dissertações da USP - Universidade de São Paulo (USP)false
dc.title.none.fl_str_mv Using phonetic knowledge in tools and resources for Natural Language Processing and Pronunciation Evaluation
Utilizando conhecimento fonético em ferramentas e recursos de Processamento de Língua Natural e Treino de Pronúncia
title Using phonetic knowledge in tools and resources for Natural Language Processing and Pronunciation Evaluation
spellingShingle Using phonetic knowledge in tools and resources for Natural Language Processing and Pronunciation Evaluation
Almeida, Gustavo Augusto de Mendonça
Automatic pronunciation assessment
Avaliação de pronúncia automática
Balanceamento de corpus
Conversão grafema-fonema
Corpus balancing
Corretor ortográfico
Natural language processing
Processamento de língua natural
Pronunciation training
Spelling correction
Text-to-speech
Treino de pronúncia
title_short Using phonetic knowledge in tools and resources for Natural Language Processing and Pronunciation Evaluation
title_full Using phonetic knowledge in tools and resources for Natural Language Processing and Pronunciation Evaluation
title_fullStr Using phonetic knowledge in tools and resources for Natural Language Processing and Pronunciation Evaluation
title_full_unstemmed Using phonetic knowledge in tools and resources for Natural Language Processing and Pronunciation Evaluation
title_sort Using phonetic knowledge in tools and resources for Natural Language Processing and Pronunciation Evaluation
author Almeida, Gustavo Augusto de Mendonça
author_facet Almeida, Gustavo Augusto de Mendonça
author_role author
dc.contributor.none.fl_str_mv Aluisio, Sandra Maria
dc.contributor.author.fl_str_mv Almeida, Gustavo Augusto de Mendonça
dc.subject.por.fl_str_mv Automatic pronunciation assessment
Avaliação de pronúncia automática
Balanceamento de corpus
Conversão grafema-fonema
Corpus balancing
Corretor ortográfico
Natural language processing
Processamento de língua natural
Pronunciation training
Spelling correction
Text-to-speech
Treino de pronúncia
topic Automatic pronunciation assessment
Avaliação de pronúncia automática
Balanceamento de corpus
Conversão grafema-fonema
Corpus balancing
Corretor ortográfico
Natural language processing
Processamento de língua natural
Pronunciation training
Spelling correction
Text-to-speech
Treino de pronúncia
description This thesis presents tools and resources for the development of applications in Natural Language Processing and Pronunciation Training. There are four main contributions. First, a hybrid grapheme-to-phoneme converter for Brazilian Portuguese, named Aeiouadô, which makes use of both manual transcription rules and Classification and Regression Trees (CART) to infer the phone transcription. Second, a spelling correction system based on machine learning, which uses the trascriptions produced by Aeiouadô and is capable of handling phonologically-motivated errors, as well as contextual errors. Third, a method for the extraction of phonetically-rich sentences, which is based on greedy algorithms. Fourth, a prototype system for automatic pronunciation assessment, especially designed for Brazilian-accented English.
publishDate 2016
dc.date.none.fl_str_mv 2016-03-21
dc.type.status.fl_str_mv info:eu-repo/semantics/publishedVersion
dc.type.driver.fl_str_mv info:eu-repo/semantics/masterThesis
format masterThesis
status_str publishedVersion
dc.identifier.uri.fl_str_mv http://www.teses.usp.br/teses/disponiveis/55/55134/tde-17112016-161826/
url http://www.teses.usp.br/teses/disponiveis/55/55134/tde-17112016-161826/
dc.language.iso.fl_str_mv eng
language eng
dc.relation.none.fl_str_mv
dc.rights.driver.fl_str_mv Liberar o conteúdo para acesso público.
info:eu-repo/semantics/openAccess
rights_invalid_str_mv Liberar o conteúdo para acesso público.
eu_rights_str_mv openAccess
dc.format.none.fl_str_mv application/pdf
dc.coverage.none.fl_str_mv
dc.publisher.none.fl_str_mv Biblioteca Digitais de Teses e Dissertações da USP
publisher.none.fl_str_mv Biblioteca Digitais de Teses e Dissertações da USP
dc.source.none.fl_str_mv
reponame:Biblioteca Digital de Teses e Dissertações da USP
instname:Universidade de São Paulo (USP)
instacron:USP
instname_str Universidade de São Paulo (USP)
instacron_str USP
institution USP
reponame_str Biblioteca Digital de Teses e Dissertações da USP
collection Biblioteca Digital de Teses e Dissertações da USP
repository.name.fl_str_mv Biblioteca Digital de Teses e Dissertações da USP - Universidade de São Paulo (USP)
repository.mail.fl_str_mv virginia@if.usp.br|| atendimento@aguia.usp.br||virginia@if.usp.br
_version_ 1815258201926402048