Segmentação de voz em ambientes ruidosos utilizando análise de imagem do espectrograma
| Ano de defesa: | 2013 |
|---|---|
| Autor(a) principal: | |
| Orientador(a): | |
| Banca de defesa: | |
| Tipo de documento: | Dissertação |
| Tipo de acesso: | Acesso aberto |
| Idioma: | por |
| Instituição de defesa: |
Universidade Federal de Pernambuco
|
| Programa de Pós-Graduação: |
Não Informado pela instituição
|
| Departamento: |
Não Informado pela instituição
|
| País: |
Não Informado pela instituição
|
| Palavras-chave em Português: | |
| Link de acesso: | https://repositorio.ufpe.br/handle/123456789/11995 |
Resumo: | Esta dissertação apresenta um novo algoritmo para segmentação de sinais de voz baseado em técnicas de processamento de imagem, tais como análise de espectrograma, morfologia matemática, componentes conectados, análise de projeção e binarização. O algoritmo proposto opera em dois ciclos: o primeiro age separando o sinal de voz do fundo (silêncio ou ruído). O segundo utiliza esse sinal de voz segmentado para realizar a segmentação de sílabas fonéticas (agrupamento de fonemas). A base de dados de áudio MIT (MIT Mobile Device Speaker Verification Corpus) e a TIMIT (Texas Instruments/Massachussets Institute of Technology) foram utilizadas para validação do algoritmo proposto. Os sinais de voz escolhidos variam desde o gênero do locutor, a regionalidade (sotaque), tipos de fonemas e ruídos de fundo, como: ruídos de apito, chuva, vento e de um cruzamento de ruas com tráfego intenso. A técnica proposta mostrou eficiência na segmentação, no que diz respeito aos segmentos fonéticos, em ambientes com ausência e presença de ruídos, utilizando os mesmos parâmetros em ambas as situações |
| id |
UFPE_2a70b093af50f848ca2b8eb8937c8104 |
|---|---|
| oai_identifier_str |
oai:repositorio.ufpe.br:123456789/11995 |
| network_acronym_str |
UFPE |
| network_name_str |
Repositório Institucional da UFPE |
| repository_id_str |
|
| spelling |
Lopes, Gilliard Alan de MeloMello, Carlos Alexandre Barros de 2015-03-11T17:47:35Z2015-03-11T17:47:35Z2013-08-13LOPES, Gilliard Alan de Melo. Segmentação de voz em ambientes ruidosos utilizando análise de imagem do espectrograma. Recife, 2013. 60 f. Dissertação (mestrado) - UFPE, Centro de Informática, Programa de Pós-graduação em Ciência da Computação, 2013..https://repositorio.ufpe.br/handle/123456789/11995Esta dissertação apresenta um novo algoritmo para segmentação de sinais de voz baseado em técnicas de processamento de imagem, tais como análise de espectrograma, morfologia matemática, componentes conectados, análise de projeção e binarização. O algoritmo proposto opera em dois ciclos: o primeiro age separando o sinal de voz do fundo (silêncio ou ruído). O segundo utiliza esse sinal de voz segmentado para realizar a segmentação de sílabas fonéticas (agrupamento de fonemas). A base de dados de áudio MIT (MIT Mobile Device Speaker Verification Corpus) e a TIMIT (Texas Instruments/Massachussets Institute of Technology) foram utilizadas para validação do algoritmo proposto. Os sinais de voz escolhidos variam desde o gênero do locutor, a regionalidade (sotaque), tipos de fonemas e ruídos de fundo, como: ruídos de apito, chuva, vento e de um cruzamento de ruas com tráfego intenso. A técnica proposta mostrou eficiência na segmentação, no que diz respeito aos segmentos fonéticos, em ambientes com ausência e presença de ruídos, utilizando os mesmos parâmetros em ambas as situaçõesFACEPEporUniversidade Federal de PernambucoAttribution-NonCommercial-NoDerivs 3.0 Brazilhttp://creativecommons.org/licenses/by-nc-nd/3.0/br/info:eu-repo/semantics/openAccessSegmentação de vozSegmentação de fonemasEspectrogramaAnálise de imagensSegmentação de voz em ambientes ruidosos utilizando análise de imagem do espectrogramainfo:eu-repo/semantics/publishedVersioninfo:eu-repo/semantics/masterThesisreponame:Repositório Institucional da UFPEinstname:Universidade Federal de Pernambuco (UFPE)instacron:UFPETHUMBNAILDissertacao Gilliard Lopes.pdf.jpgDissertacao Gilliard Lopes.pdf.jpgGenerated Thumbnailimage/jpeg1345https://repositorio.ufpe.br/bitstream/123456789/11995/5/Dissertacao%20Gilliard%20Lopes.pdf.jpg859df527800e17c3782d63a3f5e9e83aMD55ORIGINALDissertacao Gilliard Lopes.pdfDissertacao Gilliard Lopes.pdfapplication/pdf2357528https://repositorio.ufpe.br/bitstream/123456789/11995/1/Dissertacao%20Gilliard%20Lopes.pdffd0913ca03078329224a12a6dd90a678MD51CC-LICENSElicense_rdflicense_rdfapplication/rdf+xml; charset=utf-81232https://repositorio.ufpe.br/bitstream/123456789/11995/2/license_rdf66e71c371cc565284e70f40736c94386MD52LICENSElicense.txtlicense.txttext/plain; charset=utf-82311https://repositorio.ufpe.br/bitstream/123456789/11995/3/license.txt4b8a02c7f2818eaf00dcf2260dd5eb08MD53TEXTDissertacao Gilliard Lopes.pdf.txtDissertacao Gilliard Lopes.pdf.txtExtracted texttext/plain128352https://repositorio.ufpe.br/bitstream/123456789/11995/4/Dissertacao%20Gilliard%20Lopes.pdf.txtd14e154817e7d750533c80c92d6f073eMD54123456789/119952019-10-25 17:08:09.222oai:repositorio.ufpe.br:123456789/11995TGljZW7Dp2EgZGUgRGlzdHJpYnVpw6fDo28gTsOjbyBFeGNsdXNpdmEKClRvZG8gZGVwb3NpdGFudGUgZGUgbWF0ZXJpYWwgbm8gUmVwb3NpdMOzcmlvIEluc3RpdHVjaW9uYWwgKFJJKSBkZXZlIGNvbmNlZGVyLCDDoCBVbml2ZXJzaWRhZGUgRmVkZXJhbCBkZSBQZXJuYW1idWNvIChVRlBFKSwgdW1hIExpY2Vuw6dhIGRlIERpc3RyaWJ1acOnw6NvIE7Do28gRXhjbHVzaXZhIHBhcmEgbWFudGVyIGUgdG9ybmFyIGFjZXNzw612ZWlzIG9zIHNldXMgZG9jdW1lbnRvcywgZW0gZm9ybWF0byBkaWdpdGFsLCBuZXN0ZSByZXBvc2l0w7NyaW8uCgpDb20gYSBjb25jZXNzw6NvIGRlc3RhIGxpY2Vuw6dhIG7Do28gZXhjbHVzaXZhLCBvIGRlcG9zaXRhbnRlIG1hbnTDqW0gdG9kb3Mgb3MgZGlyZWl0b3MgZGUgYXV0b3IuCl9fX19fX19fX19fX19fX19fX19fX19fX19fX19fX19fX19fX19fX19fX19fX19fX19fX19fX19fX19fX19fX19fX19fXwoKTGljZW7Dp2EgZGUgRGlzdHJpYnVpw6fDo28gTsOjbyBFeGNsdXNpdmEKCkFvIGNvbmNvcmRhciBjb20gZXN0YSBsaWNlbsOnYSBlIGFjZWl0w6EtbGEsIHZvY8OqIChhdXRvciBvdSBkZXRlbnRvciBkb3MgZGlyZWl0b3MgYXV0b3JhaXMpOgoKYSkgRGVjbGFyYSBxdWUgY29uaGVjZSBhIHBvbMOtdGljYSBkZSBjb3B5cmlnaHQgZGEgZWRpdG9yYSBkbyBzZXUgZG9jdW1lbnRvOwpiKSBEZWNsYXJhIHF1ZSBjb25oZWNlIGUgYWNlaXRhIGFzIERpcmV0cml6ZXMgcGFyYSBvIFJlcG9zaXTDs3JpbyBJbnN0aXR1Y2lvbmFsIGRhIFVGUEU7CmMpIENvbmNlZGUgw6AgVUZQRSBvIGRpcmVpdG8gbsOjbyBleGNsdXNpdm8gZGUgYXJxdWl2YXIsIHJlcHJvZHV6aXIsIGNvbnZlcnRlciAoY29tbyBkZWZpbmlkbyBhIHNlZ3VpciksIGNvbXVuaWNhciBlL291IGRpc3RyaWJ1aXIsIG5vIFJJLCBvIGRvY3VtZW50byBlbnRyZWd1ZSAoaW5jbHVpbmRvIG8gcmVzdW1vL2Fic3RyYWN0KSBlbSBmb3JtYXRvIGRpZ2l0YWwgb3UgcG9yIG91dHJvIG1laW87CmQpIERlY2xhcmEgcXVlIGF1dG9yaXphIGEgVUZQRSBhIGFycXVpdmFyIG1haXMgZGUgdW1hIGPDs3BpYSBkZXN0ZSBkb2N1bWVudG8gZSBjb252ZXJ0w6otbG8sIHNlbSBhbHRlcmFyIG8gc2V1IGNvbnRlw7pkbywgcGFyYSBxdWFscXVlciBmb3JtYXRvIGRlIGZpY2hlaXJvLCBtZWlvIG91IHN1cG9ydGUsIHBhcmEgZWZlaXRvcyBkZSBzZWd1cmFuw6dhLCBwcmVzZXJ2YcOnw6NvIChiYWNrdXApIGUgYWNlc3NvOwplKSBEZWNsYXJhIHF1ZSBvIGRvY3VtZW50byBzdWJtZXRpZG8gw6kgbyBzZXUgdHJhYmFsaG8gb3JpZ2luYWwgZSBxdWUgZGV0w6ltIG8gZGlyZWl0byBkZSBjb25jZWRlciBhIHRlcmNlaXJvcyBvcyBkaXJlaXRvcyBjb250aWRvcyBuZXN0YSBsaWNlbsOnYS4gRGVjbGFyYSB0YW1iw6ltIHF1ZSBhIGVudHJlZ2EgZG8gZG9jdW1lbnRvIG7Do28gaW5mcmluZ2Ugb3MgZGlyZWl0b3MgZGUgb3V0cmEgcGVzc29hIG91IGVudGlkYWRlOwpmKSBEZWNsYXJhIHF1ZSwgbm8gY2FzbyBkbyBkb2N1bWVudG8gc3VibWV0aWRvIGNvbnRlciBtYXRlcmlhbCBkbyBxdWFsIG7Do28gZGV0w6ltIG9zIGRpcmVpdG9zIGRlCmF1dG9yLCBvYnRldmUgYSBhdXRvcml6YcOnw6NvIGlycmVzdHJpdGEgZG8gcmVzcGVjdGl2byBkZXRlbnRvciBkZXNzZXMgZGlyZWl0b3MgcGFyYSBjZWRlciDDoApVRlBFIG9zIGRpcmVpdG9zIHJlcXVlcmlkb3MgcG9yIGVzdGEgTGljZW7Dp2EgZSBhdXRvcml6YXIgYSB1bml2ZXJzaWRhZGUgYSB1dGlsaXrDoS1sb3MgbGVnYWxtZW50ZS4gRGVjbGFyYSB0YW1iw6ltIHF1ZSBlc3NlIG1hdGVyaWFsIGN1am9zIGRpcmVpdG9zIHPDo28gZGUgdGVyY2Vpcm9zIGVzdMOhIGNsYXJhbWVudGUgaWRlbnRpZmljYWRvIGUgcmVjb25oZWNpZG8gbm8gdGV4dG8gb3UgY29udGXDumRvIGRvIGRvY3VtZW50byBlbnRyZWd1ZTsKZykgU2UgbyBkb2N1bWVudG8gZW50cmVndWUgw6kgYmFzZWFkbyBlbSB0cmFiYWxobyBmaW5hbmNpYWRvIG91IGFwb2lhZG8gcG9yIG91dHJhIGluc3RpdHVpw6fDo28gcXVlIG7Do28gYSBVRlBFLMKgZGVjbGFyYSBxdWUgY3VtcHJpdSBxdWFpc3F1ZXIgb2JyaWdhw6fDtWVzIGV4aWdpZGFzIHBlbG8gcmVzcGVjdGl2byBjb250cmF0byBvdSBhY29yZG8uCgpBIFVGUEUgaWRlbnRpZmljYXLDoSBjbGFyYW1lbnRlIG8ocykgbm9tZShzKSBkbyhzKSBhdXRvciAoZXMpIGRvcyBkaXJlaXRvcyBkbyBkb2N1bWVudG8gZW50cmVndWUgZSBuw6NvIGZhcsOhIHF1YWxxdWVyIGFsdGVyYcOnw6NvLCBwYXJhIGFsw6ltIGRvIHByZXZpc3RvIG5hIGFsw61uZWEgYykuCg==Repositório InstitucionalPUBhttps://repositorio.ufpe.br/oai/requestattena@ufpe.bropendoar:22212019-10-25T20:08:09Repositório Institucional da UFPE - Universidade Federal de Pernambuco (UFPE)false |
| dc.title.pt_BR.fl_str_mv |
Segmentação de voz em ambientes ruidosos utilizando análise de imagem do espectrograma |
| title |
Segmentação de voz em ambientes ruidosos utilizando análise de imagem do espectrograma |
| spellingShingle |
Segmentação de voz em ambientes ruidosos utilizando análise de imagem do espectrograma Lopes, Gilliard Alan de Melo Segmentação de voz Segmentação de fonemas Espectrograma Análise de imagens |
| title_short |
Segmentação de voz em ambientes ruidosos utilizando análise de imagem do espectrograma |
| title_full |
Segmentação de voz em ambientes ruidosos utilizando análise de imagem do espectrograma |
| title_fullStr |
Segmentação de voz em ambientes ruidosos utilizando análise de imagem do espectrograma |
| title_full_unstemmed |
Segmentação de voz em ambientes ruidosos utilizando análise de imagem do espectrograma |
| title_sort |
Segmentação de voz em ambientes ruidosos utilizando análise de imagem do espectrograma |
| author |
Lopes, Gilliard Alan de Melo |
| author_facet |
Lopes, Gilliard Alan de Melo |
| author_role |
author |
| dc.contributor.author.fl_str_mv |
Lopes, Gilliard Alan de Melo |
| dc.contributor.advisor1.fl_str_mv |
Mello, Carlos Alexandre Barros de |
| contributor_str_mv |
Mello, Carlos Alexandre Barros de |
| dc.subject.por.fl_str_mv |
Segmentação de voz Segmentação de fonemas Espectrograma Análise de imagens |
| topic |
Segmentação de voz Segmentação de fonemas Espectrograma Análise de imagens |
| description |
Esta dissertação apresenta um novo algoritmo para segmentação de sinais de voz baseado em técnicas de processamento de imagem, tais como análise de espectrograma, morfologia matemática, componentes conectados, análise de projeção e binarização. O algoritmo proposto opera em dois ciclos: o primeiro age separando o sinal de voz do fundo (silêncio ou ruído). O segundo utiliza esse sinal de voz segmentado para realizar a segmentação de sílabas fonéticas (agrupamento de fonemas). A base de dados de áudio MIT (MIT Mobile Device Speaker Verification Corpus) e a TIMIT (Texas Instruments/Massachussets Institute of Technology) foram utilizadas para validação do algoritmo proposto. Os sinais de voz escolhidos variam desde o gênero do locutor, a regionalidade (sotaque), tipos de fonemas e ruídos de fundo, como: ruídos de apito, chuva, vento e de um cruzamento de ruas com tráfego intenso. A técnica proposta mostrou eficiência na segmentação, no que diz respeito aos segmentos fonéticos, em ambientes com ausência e presença de ruídos, utilizando os mesmos parâmetros em ambas as situações |
| publishDate |
2013 |
| dc.date.issued.fl_str_mv |
2013-08-13 |
| dc.date.accessioned.fl_str_mv |
2015-03-11T17:47:35Z |
| dc.date.available.fl_str_mv |
2015-03-11T17:47:35Z |
| dc.type.status.fl_str_mv |
info:eu-repo/semantics/publishedVersion |
| dc.type.driver.fl_str_mv |
info:eu-repo/semantics/masterThesis |
| format |
masterThesis |
| status_str |
publishedVersion |
| dc.identifier.citation.fl_str_mv |
LOPES, Gilliard Alan de Melo. Segmentação de voz em ambientes ruidosos utilizando análise de imagem do espectrograma. Recife, 2013. 60 f. Dissertação (mestrado) - UFPE, Centro de Informática, Programa de Pós-graduação em Ciência da Computação, 2013.. |
| dc.identifier.uri.fl_str_mv |
https://repositorio.ufpe.br/handle/123456789/11995 |
| identifier_str_mv |
LOPES, Gilliard Alan de Melo. Segmentação de voz em ambientes ruidosos utilizando análise de imagem do espectrograma. Recife, 2013. 60 f. Dissertação (mestrado) - UFPE, Centro de Informática, Programa de Pós-graduação em Ciência da Computação, 2013.. |
| url |
https://repositorio.ufpe.br/handle/123456789/11995 |
| dc.language.iso.fl_str_mv |
por |
| language |
por |
| dc.rights.driver.fl_str_mv |
Attribution-NonCommercial-NoDerivs 3.0 Brazil http://creativecommons.org/licenses/by-nc-nd/3.0/br/ info:eu-repo/semantics/openAccess |
| rights_invalid_str_mv |
Attribution-NonCommercial-NoDerivs 3.0 Brazil http://creativecommons.org/licenses/by-nc-nd/3.0/br/ |
| eu_rights_str_mv |
openAccess |
| dc.publisher.none.fl_str_mv |
Universidade Federal de Pernambuco |
| publisher.none.fl_str_mv |
Universidade Federal de Pernambuco |
| dc.source.none.fl_str_mv |
reponame:Repositório Institucional da UFPE instname:Universidade Federal de Pernambuco (UFPE) instacron:UFPE |
| instname_str |
Universidade Federal de Pernambuco (UFPE) |
| instacron_str |
UFPE |
| institution |
UFPE |
| reponame_str |
Repositório Institucional da UFPE |
| collection |
Repositório Institucional da UFPE |
| bitstream.url.fl_str_mv |
https://repositorio.ufpe.br/bitstream/123456789/11995/5/Dissertacao%20Gilliard%20Lopes.pdf.jpg https://repositorio.ufpe.br/bitstream/123456789/11995/1/Dissertacao%20Gilliard%20Lopes.pdf https://repositorio.ufpe.br/bitstream/123456789/11995/2/license_rdf https://repositorio.ufpe.br/bitstream/123456789/11995/3/license.txt https://repositorio.ufpe.br/bitstream/123456789/11995/4/Dissertacao%20Gilliard%20Lopes.pdf.txt |
| bitstream.checksum.fl_str_mv |
859df527800e17c3782d63a3f5e9e83a fd0913ca03078329224a12a6dd90a678 66e71c371cc565284e70f40736c94386 4b8a02c7f2818eaf00dcf2260dd5eb08 d14e154817e7d750533c80c92d6f073e |
| bitstream.checksumAlgorithm.fl_str_mv |
MD5 MD5 MD5 MD5 MD5 |
| repository.name.fl_str_mv |
Repositório Institucional da UFPE - Universidade Federal de Pernambuco (UFPE) |
| repository.mail.fl_str_mv |
attena@ufpe.br |
| _version_ |
1862741580189794304 |