Transdutor de estados finitos para conversão de grafema para a pronúncia da variedade linguística potiguar

Detalhes bibliográficos
Ano de defesa: 2016
Autor(a) principal: Carvalho, Cid Ivan da Costa
Orientador(a): Araripe, Leonel Figueiredo de Alencar
Banca de defesa: Não Informado pela instituição
Tipo de documento: Tese
Tipo de acesso: Acesso aberto
Idioma: por
Instituição de defesa: Não Informado pela instituição
Programa de Pós-Graduação: Não Informado pela instituição
Departamento: Não Informado pela instituição
País: Não Informado pela instituição
Palavras-chave em Português:
Link de acesso: http://www.repositorio.ufc.br/handle/riufc/18202
Resumo: CARVALHO, Cid Ivan da Costa. Transdutor de estados finitos para conversão de grafema para a pronúncia da variedade linguística potiguar. 2016. 161f. – Tese (Doutorado) – Universidade Federal do Ceará, Departamento de Letras Vernáculas, Programa de Pós-graduação em Linguística, Fortaleza (CE), 2016.
id UFC-7_775a8f847ee0761aa3c686d7b4389c6b
oai_identifier_str oai:repositorio.ufc.br:riufc/18202
network_acronym_str UFC-7
network_name_str Repositório Institucional da Universidade Federal do Ceará (UFC)
repository_id_str
spelling Carvalho, Cid Ivan da CostaAraripe, Leonel Figueiredo de Alencar2016-07-07T17:10:52Z2016-07-07T17:10:52Z2016Carvalho, C. I. C.; Araripe, L. F. A. (2016)http://www.repositorio.ufc.br/handle/riufc/18202CARVALHO, Cid Ivan da Costa. Transdutor de estados finitos para conversão de grafema para a pronúncia da variedade linguística potiguar. 2016. 161f. – Tese (Doutorado) – Universidade Federal do Ceará, Departamento de Letras Vernáculas, Programa de Pós-graduação em Linguística, Fortaleza (CE), 2016.The Potigrafone is a finite-state transducer that automatically transcripts the graphic forms from the Portuguese language to the phonetic forms belonging to the“potiguar” linguistic variety. It was through the development of this system, by using of the Atlas Linguístico do Centro-Oeste Potiguar and to the Atlas Geolinguístico do Litoral Potiguar, that it has been possible to identify and separate the phonetic patterns in the linguistic variety belonging to the studied region, presenting a phonetic transcription tool while using the Speech Assessment Methods Phonetic Alphabet - SAMPA; and, in addition, a performance assessment in the corpus of written texts in Portuguese has been made through the use of two multi-level measures: Exact Match Ratio and Labelling Fscore. To do so, the identification and separation of phonological patterns present in the phonetic letters of Atlas, the definition of some relevant criteria to inputs in the system, the implementation of rules relating to underlying form with the surface form and, also, two system evaluation measures have been needed. The results have showed that the Potigrafone performance was 81% for the Exact Match Ratio measurement and 89% for the Labelling FScore, presenting thus, increased accuracy in total or partial correct attempts, when the transcript is made without stress markup and without the phonetic phenomena of nasality, the palatalization, the diphthongization, the monophthongization, the deletion, the epenthesis; another important result is that the consonant modules and the syllabic core also interfere with this performance, since the values with all modules and without these two modules are similar. The Potigrafone performs well during the phonetic transcription, but there are some occasional errors that have made necessary the creation of new rules to correct them and, consequently, help to improve the system performance, both in accuracy and in full and partial transcription match.O Potigrafone e um transdutor de estados finitos que faz a transcrição automática das formas gráficas da língua portuguesa para as formas fonéticas da variedade linguística potiguar. Com o desenvolvimento desse sistema, conseguimos identificar e separar os padrões fonéticos da variedade linguística potiguar, através do Atlas linguístico do Centro-Oeste potiguar e no Atlas Geolinguístico do Litoral Potiguar; apresentar uma ferramenta de transcrição fonética utilizando o alfabeto fonético Speech Assessment Methods Phonetic Alphabet (SAMPA) e, alem disso, conseguimos avaliar o desempenho do sistema em corpus de textos escritos de língua portuguesa por meio de duas medidas multiníveis: Exact Match Ratio e Labelling Fscore. Para isso, foram atendidos passos fundamentais: primeiro, foram necessárias a identificação e a separação dos padrões fonológicos presentes nas cartas fonéticas dos Atlas supracitados; segundo, a definição de alguns critérios pertinentes as entradas (inputs) do sistema; terceiro, a implementação das regras que relacionam a forma subjacente com a forma superficial e; por último, a escolha das duas medidas adequadas a avaliação de um sistema que apresentava mais de uma forma de transcrição. Os resultados mostram que o desempenho do Potigrafone foi de 81% para a medida Exact Match Ratio e 89% para a medida Labelling FScore, apresentando, assim, boa performance na exatidão e nos acertos totais e parciais, no que se refere a transcrição sem a marcação da silaba tônica e sem os fenômenos fonéticos da nasalidade, da palatalização, da ditongação, da monotongação, do apagamento, da epêntese; outro resultado importante e que os módulos de consoantes e de núcleo silábico também interferem no desempenho, uma vez que os valores com todos os módulos e sem esses dois módulos se assemelham. O Potigrafone apresenta bom desempenho na transcrição fonética, mas existem alguns erros pontuais que torna necessário a constituição de novas regras para corrigi-los e, consequentemente, melhorar o desempenho do sistema, tanto na exatidão quanto na correspondência total e parcial da transcrição.Linguistic variety PotiguarPotigrafoneAtlas geolinguístico do litoral PotiguarLíngua portuguesa - FonéticaLíngua portuguesa - FonologiaLíngua portuguesa - Transcrição fonéticaTransdutor de estados finitos para conversão de grafema para a pronúncia da variedade linguística potiguarFinite state transducer for the grapheme conversion of the pronunciation in the potiguar linguistic varietyinfo:eu-repo/semantics/publishedVersioninfo:eu-repo/semantics/doctoralThesisporreponame:Repositório Institucional da Universidade Federal do Ceará (UFC)instname:Universidade Federal do Ceará (UFC)instacron:UFCinfo:eu-repo/semantics/openAccessORIGINAL2016_tese_ciccarvalho.pdf2016_tese_ciccarvalho.pdfapplication/pdf2690180http://repositorio.ufc.br/bitstream/riufc/18202/1/2016_tese_ciccarvalho.pdf534323141ee66dc846d48a731de5eeb6MD51LICENSElicense.txtlicense.txttext/plain; charset=utf-81748http://repositorio.ufc.br/bitstream/riufc/18202/2/license.txt8a4605be74aa9ea9d79846c1fba20a33MD52riufc/182022017-09-01 09:58:17.21oai:repositorio.ufc.br:riufc/18202Tk9URTogUExBQ0UgWU9VUiBPV04gTElDRU5TRSBIRVJFClRoaXMgc2FtcGxlIGxpY2Vuc2UgaXMgcHJvdmlkZWQgZm9yIGluZm9ybWF0aW9uYWwgcHVycG9zZXMgb25seS4KCk5PTi1FWENMVVNJVkUgRElTVFJJQlVUSU9OIExJQ0VOU0UKCkJ5IHNpZ25pbmcgYW5kIHN1Ym1pdHRpbmcgdGhpcyBsaWNlbnNlLCB5b3UgKHRoZSBhdXRob3Iocykgb3IgY29weXJpZ2h0Cm93bmVyKSBncmFudHMgdG8gRFNwYWNlIFVuaXZlcnNpdHkgKERTVSkgdGhlIG5vbi1leGNsdXNpdmUgcmlnaHQgdG8gcmVwcm9kdWNlLAp0cmFuc2xhdGUgKGFzIGRlZmluZWQgYmVsb3cpLCBhbmQvb3IgZGlzdHJpYnV0ZSB5b3VyIHN1Ym1pc3Npb24gKGluY2x1ZGluZwp0aGUgYWJzdHJhY3QpIHdvcmxkd2lkZSBpbiBwcmludCBhbmQgZWxlY3Ryb25pYyBmb3JtYXQgYW5kIGluIGFueSBtZWRpdW0sCmluY2x1ZGluZyBidXQgbm90IGxpbWl0ZWQgdG8gYXVkaW8gb3IgdmlkZW8uCgpZb3UgYWdyZWUgdGhhdCBEU1UgbWF5LCB3aXRob3V0IGNoYW5naW5nIHRoZSBjb250ZW50LCB0cmFuc2xhdGUgdGhlCnN1Ym1pc3Npb24gdG8gYW55IG1lZGl1bSBvciBmb3JtYXQgZm9yIHRoZSBwdXJwb3NlIG9mIHByZXNlcnZhdGlvbi4KCllvdSBhbHNvIGFncmVlIHRoYXQgRFNVIG1heSBrZWVwIG1vcmUgdGhhbiBvbmUgY29weSBvZiB0aGlzIHN1Ym1pc3Npb24gZm9yCnB1cnBvc2VzIG9mIHNlY3VyaXR5LCBiYWNrLXVwIGFuZCBwcmVzZXJ2YXRpb24uCgpZb3UgcmVwcmVzZW50IHRoYXQgdGhlIHN1Ym1pc3Npb24gaXMgeW91ciBvcmlnaW5hbCB3b3JrLCBhbmQgdGhhdCB5b3UgaGF2ZQp0aGUgcmlnaHQgdG8gZ3JhbnQgdGhlIHJpZ2h0cyBjb250YWluZWQgaW4gdGhpcyBsaWNlbnNlLiBZb3UgYWxzbyByZXByZXNlbnQKdGhhdCB5b3VyIHN1Ym1pc3Npb24gZG9lcyBub3QsIHRvIHRoZSBiZXN0IG9mIHlvdXIga25vd2xlZGdlLCBpbmZyaW5nZSB1cG9uCmFueW9uZSdzIGNvcHlyaWdodC4KCklmIHRoZSBzdWJtaXNzaW9uIGNvbnRhaW5zIG1hdGVyaWFsIGZvciB3aGljaCB5b3UgZG8gbm90IGhvbGQgY29weXJpZ2h0LAp5b3UgcmVwcmVzZW50IHRoYXQgeW91IGhhdmUgb2J0YWluZWQgdGhlIHVucmVzdHJpY3RlZCBwZXJtaXNzaW9uIG9mIHRoZQpjb3B5cmlnaHQgb3duZXIgdG8gZ3JhbnQgRFNVIHRoZSByaWdodHMgcmVxdWlyZWQgYnkgdGhpcyBsaWNlbnNlLCBhbmQgdGhhdApzdWNoIHRoaXJkLXBhcnR5IG93bmVkIG1hdGVyaWFsIGlzIGNsZWFybHkgaWRlbnRpZmllZCBhbmQgYWNrbm93bGVkZ2VkCndpdGhpbiB0aGUgdGV4dCBvciBjb250ZW50IG9mIHRoZSBzdWJtaXNzaW9uLgoKSUYgVEhFIFNVQk1JU1NJT04gSVMgQkFTRUQgVVBPTiBXT1JLIFRIQVQgSEFTIEJFRU4gU1BPTlNPUkVEIE9SIFNVUFBPUlRFRApCWSBBTiBBR0VOQ1kgT1IgT1JHQU5JWkFUSU9OIE9USEVSIFRIQU4gRFNVLCBZT1UgUkVQUkVTRU5UIFRIQVQgWU9VIEhBVkUKRlVMRklMTEVEIEFOWSBSSUdIVCBPRiBSRVZJRVcgT1IgT1RIRVIgT0JMSUdBVElPTlMgUkVRVUlSRUQgQlkgU1VDSApDT05UUkFDVCBPUiBBR1JFRU1FTlQuCgpEU1Ugd2lsbCBjbGVhcmx5IGlkZW50aWZ5IHlvdXIgbmFtZShzKSBhcyB0aGUgYXV0aG9yKHMpIG9yIG93bmVyKHMpIG9mIHRoZQpzdWJtaXNzaW9uLCBhbmQgd2lsbCBub3QgbWFrZSBhbnkgYWx0ZXJhdGlvbiwgb3RoZXIgdGhhbiBhcyBhbGxvd2VkIGJ5IHRoaXMKbGljZW5zZSwgdG8geW91ciBzdWJtaXNzaW9uLgo=Repositório InstitucionalPUBhttp://www.repositorio.ufc.br/ri-oai/requestbu@ufc.br || repositorio@ufc.bropendoar:2017-09-01T12:58:17Repositório Institucional da Universidade Federal do Ceará (UFC) - Universidade Federal do Ceará (UFC)false
dc.title.pt_BR.fl_str_mv Transdutor de estados finitos para conversão de grafema para a pronúncia da variedade linguística potiguar
dc.title.en.pt_BR.fl_str_mv Finite state transducer for the grapheme conversion of the pronunciation in the potiguar linguistic variety
title Transdutor de estados finitos para conversão de grafema para a pronúncia da variedade linguística potiguar
spellingShingle Transdutor de estados finitos para conversão de grafema para a pronúncia da variedade linguística potiguar
Carvalho, Cid Ivan da Costa
Linguistic variety Potiguar
Potigrafone
Atlas geolinguístico do litoral Potiguar
Língua portuguesa - Fonética
Língua portuguesa - Fonologia
Língua portuguesa - Transcrição fonética
title_short Transdutor de estados finitos para conversão de grafema para a pronúncia da variedade linguística potiguar
title_full Transdutor de estados finitos para conversão de grafema para a pronúncia da variedade linguística potiguar
title_fullStr Transdutor de estados finitos para conversão de grafema para a pronúncia da variedade linguística potiguar
title_full_unstemmed Transdutor de estados finitos para conversão de grafema para a pronúncia da variedade linguística potiguar
title_sort Transdutor de estados finitos para conversão de grafema para a pronúncia da variedade linguística potiguar
author Carvalho, Cid Ivan da Costa
author_facet Carvalho, Cid Ivan da Costa
author_role author
dc.contributor.author.fl_str_mv Carvalho, Cid Ivan da Costa
dc.contributor.advisor1.fl_str_mv Araripe, Leonel Figueiredo de Alencar
contributor_str_mv Araripe, Leonel Figueiredo de Alencar
dc.subject.por.fl_str_mv Linguistic variety Potiguar
Potigrafone
Atlas geolinguístico do litoral Potiguar
Língua portuguesa - Fonética
Língua portuguesa - Fonologia
Língua portuguesa - Transcrição fonética
topic Linguistic variety Potiguar
Potigrafone
Atlas geolinguístico do litoral Potiguar
Língua portuguesa - Fonética
Língua portuguesa - Fonologia
Língua portuguesa - Transcrição fonética
description CARVALHO, Cid Ivan da Costa. Transdutor de estados finitos para conversão de grafema para a pronúncia da variedade linguística potiguar. 2016. 161f. – Tese (Doutorado) – Universidade Federal do Ceará, Departamento de Letras Vernáculas, Programa de Pós-graduação em Linguística, Fortaleza (CE), 2016.
publishDate 2016
dc.date.accessioned.fl_str_mv 2016-07-07T17:10:52Z
dc.date.available.fl_str_mv 2016-07-07T17:10:52Z
dc.date.issued.fl_str_mv 2016
dc.type.status.fl_str_mv info:eu-repo/semantics/publishedVersion
dc.type.driver.fl_str_mv info:eu-repo/semantics/doctoralThesis
format doctoralThesis
status_str publishedVersion
dc.identifier.citation.fl_str_mv Carvalho, C. I. C.; Araripe, L. F. A. (2016)
dc.identifier.uri.fl_str_mv http://www.repositorio.ufc.br/handle/riufc/18202
identifier_str_mv Carvalho, C. I. C.; Araripe, L. F. A. (2016)
url http://www.repositorio.ufc.br/handle/riufc/18202
dc.language.iso.fl_str_mv por
language por
dc.rights.driver.fl_str_mv info:eu-repo/semantics/openAccess
eu_rights_str_mv openAccess
dc.source.none.fl_str_mv reponame:Repositório Institucional da Universidade Federal do Ceará (UFC)
instname:Universidade Federal do Ceará (UFC)
instacron:UFC
instname_str Universidade Federal do Ceará (UFC)
instacron_str UFC
institution UFC
reponame_str Repositório Institucional da Universidade Federal do Ceará (UFC)
collection Repositório Institucional da Universidade Federal do Ceará (UFC)
bitstream.url.fl_str_mv http://repositorio.ufc.br/bitstream/riufc/18202/1/2016_tese_ciccarvalho.pdf
http://repositorio.ufc.br/bitstream/riufc/18202/2/license.txt
bitstream.checksum.fl_str_mv 534323141ee66dc846d48a731de5eeb6
8a4605be74aa9ea9d79846c1fba20a33
bitstream.checksumAlgorithm.fl_str_mv MD5
MD5
repository.name.fl_str_mv Repositório Institucional da Universidade Federal do Ceará (UFC) - Universidade Federal do Ceará (UFC)
repository.mail.fl_str_mv bu@ufc.br || repositorio@ufc.br
_version_ 1847793050500202496