Modelo de produção da voz baseado na biofísica da fonação.
Ano de defesa: | 2017 |
---|---|
Autor(a) principal: | |
Orientador(a): | , |
Banca de defesa: | , , , , |
Tipo de documento: | Tese |
Tipo de acesso: | Acesso aberto |
Idioma: | por |
Instituição de defesa: |
Universidade Federal de Campina Grande
|
Programa de Pós-Graduação: |
PÓS-GRADUAÇÃO EM ENGENHARIA ELÉTRICA
|
Departamento: |
Centro de Engenharia Elétrica e Informática - CEEI
|
País: |
Brasil
|
Palavras-chave em Português: | |
Área do conhecimento CNPq: | |
Link de acesso: | http://dspace.sti.ufcg.edu.br:8080/jspui/handle/riufcg/1550 |
Resumo: | A busca por novos modelos que representem a biofísica da fonação da voz é importante em aplicações que incluem o processamento do sinal de voz por representar uma ferramenta no conhecimento de característica dos locutores. Esta tese de doutorado apresenta uma nova abordagem para a teoria fonte-filtro de geração de voz, mais precisamente sons sonoros, que realiza a modelagem da voz por meio de três subsistemas independentes: fonte de excitação, trato vocal e radiação dos lábios e narinas. Trata-se de um modelo em que a geração da voz é feita por meio de filtros lineares e invariantes ao deslocamento no tempo e que leva em consideração a física da fonação, a partir da característica cicloestacionária do sinal de voz, proveniente do comportamento de vibração das cordas vocais. É sugerido que a frequência de oscilação das cordas vocais é dada em função da massa e comprimento delas, e que seu valor é alterado principalmente pela tensão longitudinal aplicada a elas. No modelo proposto para geração da voz, o movimento vibratório das cordas vocais é modelado por meio de um de gerador de trem de impulsos cicloestacionário, controlado por um sinal de tensão obtido a partir da forma de onda do sinal de voz. É realizada toda a análise matemática que abrange o novo modelo para a excitação glotal, apresentando-se uma expressão matemática da densidade espectral de potência do sinal que excita a glote, bem como para o sinal de voz, cujos parâmetros podem ser ajustados para emular patologias na glote. Além disso, apresenta-se a análise no domínio da frequência do pulso glotal usado. Para analisar o desempenho do modelo proposto, testes com locução foram realizados e os resultados indicam que o modelo proposto se ajusta bem a geração da voz. |
id |
UFCG_55f44e83d113b1cd54fcc86792716164 |
---|---|
oai_identifier_str |
oai:localhost:riufcg/1550 |
network_acronym_str |
UFCG |
network_name_str |
Biblioteca Digital de Teses e Dissertações da UFCG |
repository_id_str |
|
spelling |
ALENCAR, Marcelo Sampaio de.ALENCAR, M. S.http://lattes.cnpq.br/0946722048975388QUEIROZ, Wamberto José Lira de.QUEIROZ, Wamberto José Lira dehttp://lattes.cnpq.br/7663004390139625BERNARDINO JÚNIOR, Francisco Madeiro.KLAUTAU JÚNIOR, Aldebaro Barreto da Rocha.AGUIAR NETO, Benedito Guimarães.LOPES, Waslon Terllizzie Araújo.FONTGALLAND, Glauco.ROCHA, R. B.http://lattes.cnpq.br/0884771058471411ROCHA, Raissa Bezerra.A busca por novos modelos que representem a biofísica da fonação da voz é importante em aplicações que incluem o processamento do sinal de voz por representar uma ferramenta no conhecimento de característica dos locutores. Esta tese de doutorado apresenta uma nova abordagem para a teoria fonte-filtro de geração de voz, mais precisamente sons sonoros, que realiza a modelagem da voz por meio de três subsistemas independentes: fonte de excitação, trato vocal e radiação dos lábios e narinas. Trata-se de um modelo em que a geração da voz é feita por meio de filtros lineares e invariantes ao deslocamento no tempo e que leva em consideração a física da fonação, a partir da característica cicloestacionária do sinal de voz, proveniente do comportamento de vibração das cordas vocais. É sugerido que a frequência de oscilação das cordas vocais é dada em função da massa e comprimento delas, e que seu valor é alterado principalmente pela tensão longitudinal aplicada a elas. No modelo proposto para geração da voz, o movimento vibratório das cordas vocais é modelado por meio de um de gerador de trem de impulsos cicloestacionário, controlado por um sinal de tensão obtido a partir da forma de onda do sinal de voz. É realizada toda a análise matemática que abrange o novo modelo para a excitação glotal, apresentando-se uma expressão matemática da densidade espectral de potência do sinal que excita a glote, bem como para o sinal de voz, cujos parâmetros podem ser ajustados para emular patologias na glote. Além disso, apresenta-se a análise no domínio da frequência do pulso glotal usado. Para analisar o desempenho do modelo proposto, testes com locução foram realizados e os resultados indicam que o modelo proposto se ajusta bem a geração da voz.The search for new models that represent the biophysics of voice phonation is important for applications that include voice signal processing because it represents a tool for getting to know the characteristics of the speakers. This doctoral thesis presents a new proposal for the source-filter theory of voice production, more precisely related to voiced sounds, that performs the voice modelling using three independent subsystems: the excitation source, the vocal tract, the lip and nostrils radiation system. It is a proposal for a model to generate voice using linear and time-invariant systems, and takes into account the phonation physics and the cyclestationarity characteristics of the voice signal, related to the vibrational behavior of the vocal cords. The model suggests that the frequency oscillation of the vocal folds is a function of the mass and length, but controlled by the longitudinal tension applied to them. In the proposed voice generation model, the vibratory movement of the vocal cords is modeled by a cyclestationary train of impulses, controlled by a tension signal obtained from the voice signal waveform. A mathematical analysis encompassing the new model for glottal excitation is accomplished by presenting a mathematical expression of the signal power spectral density which excites the glottis, as well as the voice signal, whose parameters can be adjusted to emulate pathologies in the glottis. Moreover, the analysis of the utilized glottal pulse in the frequency domain is presented. To analyze the performance of the proposed model, tests with locutions were done and the results indicate that the proposed model adjusts well to voice generation.Submitted by Maria Medeiros (maria.dilva1@ufcg.edu.br) on 2018-08-24T15:00:51Z No. of bitstreams: 1 RAISSA BEZERRA ROCHA - TESE (PPgEE) 2017.pdf: 2547994 bytes, checksum: e7533ebc755ba778f971329b75a40ff2 (MD5)Made available in DSpace on 2018-08-24T15:00:51Z (GMT). No. of bitstreams: 1 RAISSA BEZERRA ROCHA - TESE (PPgEE) 2017.pdf: 2547994 bytes, checksum: e7533ebc755ba778f971329b75a40ff2 (MD5) Previous issue date: 2017-03-20CNPqUniversidade Federal de Campina GrandePÓS-GRADUAÇÃO EM ENGENHARIA ELÉTRICAUFCGBrasilCentro de Engenharia Elétrica e Informática - CEEIEngenharia ElétricaModelo de Geração de VozTransmissão de Informação CicloestacionáriaPulso Glotal de Liljencrants-FantDensidade Espectral de Potência do Sinal de VozVoice Production ModelTransmission of Cyclostationary InformationGlottal Pulse of Liljencrants-FantPower Spectral Density of Voice SignalModelo de produção da voz baseado na biofísica da fonação.2017-03-202018-08-24T15:00:51Z2018-08-242018-08-24T15:00:51Zhttp://dspace.sti.ufcg.edu.br:8080/jspui/handle/riufcg/1550ROCHA, R. B. Modelo de produção da voz baseado na biofísica da fonação. 2017. 77 f. Tese (Doutorado em Engenharia Elétrica) – Programa de Pós-Graduação em Engenharia Elétrica, Centro de Engenharia Elétrica e Informática, Universidade Federal de Campina Grande, Paraíba, Brasil, 2017.info:eu-repo/semantics/publishedVersioninfo:eu-repo/semantics/doctoralThesisporinfo:eu-repo/semantics/openAccessreponame:Biblioteca Digital de Teses e Dissertações da UFCGinstname:Universidade Federal de Campina Grande (UFCG)instacron:UFCGORIGINALRAISSA BEZERRA ROCHA - TESE (PPgEE) 2017.pdfRAISSA BEZERRA ROCHA - TESE (PPgEE) 2017.pdfapplication/pdf2169863http://dspace.sti.ufcg.edu.br:8080/xmlui/bitstream/riufcg/1550/3/RAISSA+BEZERRA+ROCHA+-+TESE+%28PPgEE%29+2017.pdfe9af98c0c7996076cd46ba60d63ce371MD53LICENSElicense.txtlicense.txttext/plain; charset=utf-81748http://dspace.sti.ufcg.edu.br:8080/xmlui/bitstream/riufcg/1550/2/license.txt8a4605be74aa9ea9d79846c1fba20a33MD52riufcg/15502021-04-20 10:55:39.437oai:localhost:riufcg/1550Tk9URTogUExBQ0UgWU9VUiBPV04gTElDRU5TRSBIRVJFClRoaXMgc2FtcGxlIGxpY2Vuc2UgaXMgcHJvdmlkZWQgZm9yIGluZm9ybWF0aW9uYWwgcHVycG9zZXMgb25seS4KCk5PTi1FWENMVVNJVkUgRElTVFJJQlVUSU9OIExJQ0VOU0UKCkJ5IHNpZ25pbmcgYW5kIHN1Ym1pdHRpbmcgdGhpcyBsaWNlbnNlLCB5b3UgKHRoZSBhdXRob3Iocykgb3IgY29weXJpZ2h0Cm93bmVyKSBncmFudHMgdG8gRFNwYWNlIFVuaXZlcnNpdHkgKERTVSkgdGhlIG5vbi1leGNsdXNpdmUgcmlnaHQgdG8gcmVwcm9kdWNlLAp0cmFuc2xhdGUgKGFzIGRlZmluZWQgYmVsb3cpLCBhbmQvb3IgZGlzdHJpYnV0ZSB5b3VyIHN1Ym1pc3Npb24gKGluY2x1ZGluZwp0aGUgYWJzdHJhY3QpIHdvcmxkd2lkZSBpbiBwcmludCBhbmQgZWxlY3Ryb25pYyBmb3JtYXQgYW5kIGluIGFueSBtZWRpdW0sCmluY2x1ZGluZyBidXQgbm90IGxpbWl0ZWQgdG8gYXVkaW8gb3IgdmlkZW8uCgpZb3UgYWdyZWUgdGhhdCBEU1UgbWF5LCB3aXRob3V0IGNoYW5naW5nIHRoZSBjb250ZW50LCB0cmFuc2xhdGUgdGhlCnN1Ym1pc3Npb24gdG8gYW55IG1lZGl1bSBvciBmb3JtYXQgZm9yIHRoZSBwdXJwb3NlIG9mIHByZXNlcnZhdGlvbi4KCllvdSBhbHNvIGFncmVlIHRoYXQgRFNVIG1heSBrZWVwIG1vcmUgdGhhbiBvbmUgY29weSBvZiB0aGlzIHN1Ym1pc3Npb24gZm9yCnB1cnBvc2VzIG9mIHNlY3VyaXR5LCBiYWNrLXVwIGFuZCBwcmVzZXJ2YXRpb24uCgpZb3UgcmVwcmVzZW50IHRoYXQgdGhlIHN1Ym1pc3Npb24gaXMgeW91ciBvcmlnaW5hbCB3b3JrLCBhbmQgdGhhdCB5b3UgaGF2ZQp0aGUgcmlnaHQgdG8gZ3JhbnQgdGhlIHJpZ2h0cyBjb250YWluZWQgaW4gdGhpcyBsaWNlbnNlLiBZb3UgYWxzbyByZXByZXNlbnQKdGhhdCB5b3VyIHN1Ym1pc3Npb24gZG9lcyBub3QsIHRvIHRoZSBiZXN0IG9mIHlvdXIga25vd2xlZGdlLCBpbmZyaW5nZSB1cG9uCmFueW9uZSdzIGNvcHlyaWdodC4KCklmIHRoZSBzdWJtaXNzaW9uIGNvbnRhaW5zIG1hdGVyaWFsIGZvciB3aGljaCB5b3UgZG8gbm90IGhvbGQgY29weXJpZ2h0LAp5b3UgcmVwcmVzZW50IHRoYXQgeW91IGhhdmUgb2J0YWluZWQgdGhlIHVucmVzdHJpY3RlZCBwZXJtaXNzaW9uIG9mIHRoZQpjb3B5cmlnaHQgb3duZXIgdG8gZ3JhbnQgRFNVIHRoZSByaWdodHMgcmVxdWlyZWQgYnkgdGhpcyBsaWNlbnNlLCBhbmQgdGhhdApzdWNoIHRoaXJkLXBhcnR5IG93bmVkIG1hdGVyaWFsIGlzIGNsZWFybHkgaWRlbnRpZmllZCBhbmQgYWNrbm93bGVkZ2VkCndpdGhpbiB0aGUgdGV4dCBvciBjb250ZW50IG9mIHRoZSBzdWJtaXNzaW9uLgoKSUYgVEhFIFNVQk1JU1NJT04gSVMgQkFTRUQgVVBPTiBXT1JLIFRIQVQgSEFTIEJFRU4gU1BPTlNPUkVEIE9SIFNVUFBPUlRFRApCWSBBTiBBR0VOQ1kgT1IgT1JHQU5JWkFUSU9OIE9USEVSIFRIQU4gRFNVLCBZT1UgUkVQUkVTRU5UIFRIQVQgWU9VIEhBVkUKRlVMRklMTEVEIEFOWSBSSUdIVCBPRiBSRVZJRVcgT1IgT1RIRVIgT0JMSUdBVElPTlMgUkVRVUlSRUQgQlkgU1VDSApDT05UUkFDVCBPUiBBR1JFRU1FTlQuCgpEU1Ugd2lsbCBjbGVhcmx5IGlkZW50aWZ5IHlvdXIgbmFtZShzKSBhcyB0aGUgYXV0aG9yKHMpIG9yIG93bmVyKHMpIG9mIHRoZQpzdWJtaXNzaW9uLCBhbmQgd2lsbCBub3QgbWFrZSBhbnkgYWx0ZXJhdGlvbiwgb3RoZXIgdGhhbiBhcyBhbGxvd2VkIGJ5IHRoaXMKbGljZW5zZSwgdG8geW91ciBzdWJtaXNzaW9uLgo=Biblioteca Digital de Teses e Dissertaçõeshttp://bdtd.ufcg.edu.br/PUBhttp://dspace.sti.ufcg.edu.br:8080/oai/requestbdtd@setor.ufcg.edu.br || bdtd@setor.ufcg.edu.bropendoar:48512021-04-20T13:55:39Biblioteca Digital de Teses e Dissertações da UFCG - Universidade Federal de Campina Grande (UFCG)false |
dc.title.pt_BR.fl_str_mv |
Modelo de produção da voz baseado na biofísica da fonação. |
title |
Modelo de produção da voz baseado na biofísica da fonação. |
spellingShingle |
Modelo de produção da voz baseado na biofísica da fonação. ROCHA, Raissa Bezerra. Engenharia Elétrica Modelo de Geração de Voz Transmissão de Informação Cicloestacionária Pulso Glotal de Liljencrants-Fant Densidade Espectral de Potência do Sinal de Voz Voice Production Model Transmission of Cyclostationary Information Glottal Pulse of Liljencrants-Fant Power Spectral Density of Voice Signal |
title_short |
Modelo de produção da voz baseado na biofísica da fonação. |
title_full |
Modelo de produção da voz baseado na biofísica da fonação. |
title_fullStr |
Modelo de produção da voz baseado na biofísica da fonação. |
title_full_unstemmed |
Modelo de produção da voz baseado na biofísica da fonação. |
title_sort |
Modelo de produção da voz baseado na biofísica da fonação. |
author |
ROCHA, Raissa Bezerra. |
author_facet |
ROCHA, Raissa Bezerra. |
author_role |
author |
dc.contributor.advisor2ID.pt_BR.fl_str_mv |
QUEIROZ, Wamberto José Lira de |
dc.contributor.advisor1.fl_str_mv |
ALENCAR, Marcelo Sampaio de. |
dc.contributor.advisor1ID.fl_str_mv |
ALENCAR, M. S. |
dc.contributor.advisor1Lattes.fl_str_mv |
http://lattes.cnpq.br/0946722048975388 |
dc.contributor.advisor2.fl_str_mv |
QUEIROZ, Wamberto José Lira de. |
dc.contributor.advisor2Lattes.fl_str_mv |
http://lattes.cnpq.br/7663004390139625 |
dc.contributor.referee1.fl_str_mv |
BERNARDINO JÚNIOR, Francisco Madeiro. |
dc.contributor.referee2.fl_str_mv |
KLAUTAU JÚNIOR, Aldebaro Barreto da Rocha. |
dc.contributor.referee3.fl_str_mv |
AGUIAR NETO, Benedito Guimarães. |
dc.contributor.referee4.fl_str_mv |
LOPES, Waslon Terllizzie Araújo. |
dc.contributor.referee5.fl_str_mv |
FONTGALLAND, Glauco. |
dc.contributor.authorID.fl_str_mv |
ROCHA, R. B. |
dc.contributor.authorLattes.fl_str_mv |
http://lattes.cnpq.br/0884771058471411 |
dc.contributor.author.fl_str_mv |
ROCHA, Raissa Bezerra. |
contributor_str_mv |
ALENCAR, Marcelo Sampaio de. QUEIROZ, Wamberto José Lira de. BERNARDINO JÚNIOR, Francisco Madeiro. KLAUTAU JÚNIOR, Aldebaro Barreto da Rocha. AGUIAR NETO, Benedito Guimarães. LOPES, Waslon Terllizzie Araújo. FONTGALLAND, Glauco. |
dc.subject.cnpq.fl_str_mv |
Engenharia Elétrica |
topic |
Engenharia Elétrica Modelo de Geração de Voz Transmissão de Informação Cicloestacionária Pulso Glotal de Liljencrants-Fant Densidade Espectral de Potência do Sinal de Voz Voice Production Model Transmission of Cyclostationary Information Glottal Pulse of Liljencrants-Fant Power Spectral Density of Voice Signal |
dc.subject.por.fl_str_mv |
Modelo de Geração de Voz Transmissão de Informação Cicloestacionária Pulso Glotal de Liljencrants-Fant Densidade Espectral de Potência do Sinal de Voz Voice Production Model Transmission of Cyclostationary Information Glottal Pulse of Liljencrants-Fant Power Spectral Density of Voice Signal |
description |
A busca por novos modelos que representem a biofísica da fonação da voz é importante em aplicações que incluem o processamento do sinal de voz por representar uma ferramenta no conhecimento de característica dos locutores. Esta tese de doutorado apresenta uma nova abordagem para a teoria fonte-filtro de geração de voz, mais precisamente sons sonoros, que realiza a modelagem da voz por meio de três subsistemas independentes: fonte de excitação, trato vocal e radiação dos lábios e narinas. Trata-se de um modelo em que a geração da voz é feita por meio de filtros lineares e invariantes ao deslocamento no tempo e que leva em consideração a física da fonação, a partir da característica cicloestacionária do sinal de voz, proveniente do comportamento de vibração das cordas vocais. É sugerido que a frequência de oscilação das cordas vocais é dada em função da massa e comprimento delas, e que seu valor é alterado principalmente pela tensão longitudinal aplicada a elas. No modelo proposto para geração da voz, o movimento vibratório das cordas vocais é modelado por meio de um de gerador de trem de impulsos cicloestacionário, controlado por um sinal de tensão obtido a partir da forma de onda do sinal de voz. É realizada toda a análise matemática que abrange o novo modelo para a excitação glotal, apresentando-se uma expressão matemática da densidade espectral de potência do sinal que excita a glote, bem como para o sinal de voz, cujos parâmetros podem ser ajustados para emular patologias na glote. Além disso, apresenta-se a análise no domínio da frequência do pulso glotal usado. Para analisar o desempenho do modelo proposto, testes com locução foram realizados e os resultados indicam que o modelo proposto se ajusta bem a geração da voz. |
publishDate |
2017 |
dc.date.issued.fl_str_mv |
2017-03-20 |
dc.date.accessioned.fl_str_mv |
2018-08-24T15:00:51Z |
dc.date.available.fl_str_mv |
2018-08-24 2018-08-24T15:00:51Z |
dc.type.status.fl_str_mv |
info:eu-repo/semantics/publishedVersion |
dc.type.driver.fl_str_mv |
info:eu-repo/semantics/doctoralThesis |
format |
doctoralThesis |
status_str |
publishedVersion |
dc.identifier.uri.fl_str_mv |
http://dspace.sti.ufcg.edu.br:8080/jspui/handle/riufcg/1550 |
dc.identifier.citation.fl_str_mv |
ROCHA, R. B. Modelo de produção da voz baseado na biofísica da fonação. 2017. 77 f. Tese (Doutorado em Engenharia Elétrica) – Programa de Pós-Graduação em Engenharia Elétrica, Centro de Engenharia Elétrica e Informática, Universidade Federal de Campina Grande, Paraíba, Brasil, 2017. |
url |
http://dspace.sti.ufcg.edu.br:8080/jspui/handle/riufcg/1550 |
identifier_str_mv |
ROCHA, R. B. Modelo de produção da voz baseado na biofísica da fonação. 2017. 77 f. Tese (Doutorado em Engenharia Elétrica) – Programa de Pós-Graduação em Engenharia Elétrica, Centro de Engenharia Elétrica e Informática, Universidade Federal de Campina Grande, Paraíba, Brasil, 2017. |
dc.language.iso.fl_str_mv |
por |
language |
por |
dc.rights.driver.fl_str_mv |
info:eu-repo/semantics/openAccess |
eu_rights_str_mv |
openAccess |
dc.publisher.none.fl_str_mv |
Universidade Federal de Campina Grande |
dc.publisher.program.fl_str_mv |
PÓS-GRADUAÇÃO EM ENGENHARIA ELÉTRICA |
dc.publisher.initials.fl_str_mv |
UFCG |
dc.publisher.country.fl_str_mv |
Brasil |
dc.publisher.department.fl_str_mv |
Centro de Engenharia Elétrica e Informática - CEEI |
publisher.none.fl_str_mv |
Universidade Federal de Campina Grande |
dc.source.none.fl_str_mv |
reponame:Biblioteca Digital de Teses e Dissertações da UFCG instname:Universidade Federal de Campina Grande (UFCG) instacron:UFCG |
instname_str |
Universidade Federal de Campina Grande (UFCG) |
instacron_str |
UFCG |
institution |
UFCG |
reponame_str |
Biblioteca Digital de Teses e Dissertações da UFCG |
collection |
Biblioteca Digital de Teses e Dissertações da UFCG |
bitstream.url.fl_str_mv |
http://dspace.sti.ufcg.edu.br:8080/xmlui/bitstream/riufcg/1550/3/RAISSA+BEZERRA+ROCHA+-+TESE+%28PPgEE%29+2017.pdf http://dspace.sti.ufcg.edu.br:8080/xmlui/bitstream/riufcg/1550/2/license.txt |
bitstream.checksum.fl_str_mv |
e9af98c0c7996076cd46ba60d63ce371 8a4605be74aa9ea9d79846c1fba20a33 |
bitstream.checksumAlgorithm.fl_str_mv |
MD5 MD5 |
repository.name.fl_str_mv |
Biblioteca Digital de Teses e Dissertações da UFCG - Universidade Federal de Campina Grande (UFCG) |
repository.mail.fl_str_mv |
bdtd@setor.ufcg.edu.br || bdtd@setor.ufcg.edu.br |
_version_ |
1797044605983653888 |