Representação senoidal da voz.
| Ano de defesa: | 1991 |
|---|---|
| Autor(a) principal: | |
| Orientador(a): | |
| Banca de defesa: | |
| Tipo de documento: | Tese |
| Tipo de acesso: | Acesso aberto |
| Idioma: | por |
| Instituição de defesa: |
Biblioteca Digitais de Teses e Dissertações da USP
|
| Programa de Pós-Graduação: |
Não Informado pela instituição
|
| Departamento: |
Não Informado pela instituição
|
| País: |
Não Informado pela instituição
|
| Palavras-chave em Português: | |
| Link de acesso: | https://www.teses.usp.br/teses/disponiveis/3/3142/tde-06032025-103811/ |
Resumo: | O principal objetivo deste trabalhoé apresentar e analisar o modelo senoidal de análise e síntese de sinais de voz. Este modelo, denominado representação senoidal da voz se baseia no fato de que o espectro de um trecho do sinal de voz pode ser sintetizado com boa fidelidade através das amplitudes, frequências e fases associadas a cada pico do seu espectro. É apresentado também uma comparação entre representação senoida e predição linear. O trabalho se divide em seis capítulos. No primeiro é introduzido o modelo fisiológico de produção da voz e as características da forma de onda. Nos segundo e terceiro são introduzidos o método básico de representação da voz por predição linear e o modelo senoidal desenvolvido por McAulay e Quatieri. No capítulo quarto é apresentado um novo modelo de representação senoidal baseado no método de Prony para aproximação de um sinal, tendo como vantagem a sua simplicidade e conduz a uma representação eficiente da voz, com um número relativamente baixo de frequências. No capítulo cinco, baseando-se nos resultados do anterior, fez-se uma comparação entre predição linear e o modelo senoidal através da medida do erro quadrático médio aproximado de síntese para os modelos. Finalizando, no sexto capítulo é apresentado um resumo final dos resultados e conclusões obtidos. |
| id |
USP_48988315d0a80213ebf366348786b34a |
|---|---|
| oai_identifier_str |
oai:teses.usp.br:tde-06032025-103811 |
| network_acronym_str |
USP |
| network_name_str |
Biblioteca Digital de Teses e Dissertações da USP |
| repository_id_str |
|
| spelling |
Representação senoidal da voz.Untitled in englishReconhecimento de vozVoice recognitionO principal objetivo deste trabalhoé apresentar e analisar o modelo senoidal de análise e síntese de sinais de voz. Este modelo, denominado representação senoidal da voz se baseia no fato de que o espectro de um trecho do sinal de voz pode ser sintetizado com boa fidelidade através das amplitudes, frequências e fases associadas a cada pico do seu espectro. É apresentado também uma comparação entre representação senoida e predição linear. O trabalho se divide em seis capítulos. No primeiro é introduzido o modelo fisiológico de produção da voz e as características da forma de onda. Nos segundo e terceiro são introduzidos o método básico de representação da voz por predição linear e o modelo senoidal desenvolvido por McAulay e Quatieri. No capítulo quarto é apresentado um novo modelo de representação senoidal baseado no método de Prony para aproximação de um sinal, tendo como vantagem a sua simplicidade e conduz a uma representação eficiente da voz, com um número relativamente baixo de frequências. No capítulo cinco, baseando-se nos resultados do anterior, fez-se uma comparação entre predição linear e o modelo senoidal através da medida do erro quadrático médio aproximado de síntese para os modelos. Finalizando, no sexto capítulo é apresentado um resumo final dos resultados e conclusões obtidos.The main point of this work is to present and analyse the sinusoidal model when applied to the speech signal. This model has been called sinusoidal representation of the speech and is based upon the pulselike characteristic of the speech signal spectrum, and as a consequence, magnitude, frequence and phase of peaks of the spectrum can be used to accurately synthesize the signal. Also a comparison between sinusoidal representation model and the classic linear predition method is presented, and synthesis erros involved hás been analysed. Basicallythis thesis hás been organized in six chapters. The first one presents the physiological modelo f the voice production and the main characteristics of its waveform. In the second and third chapters, a review of previous speech representation models hás been made. The proposed model is discussed in chapter four. This model uses the Prony method for the signal aproximation and it hás the advantages of simplicity and efficient representation of speech signal. For instance a voice piecewise varing from 10 to 25 ms is well represented by a low number of frequence components. Furthermore, comparison of results between the proposed model and the harmonic model hás shown no significant difference. Based on the results presented a comparison between linear prediction and sinusoidal model is shown in chapter Five. The figure parameter used is the mean square error of the synthesis for both models. Finally, chapter six discuss all results and conclusions this work leads to.Biblioteca Digitais de Teses e Dissertações da USPAlens, NormondsJoaquim, Marcelo Basilio1991-04-02info:eu-repo/semantics/publishedVersioninfo:eu-repo/semantics/doctoralThesisapplication/pdfhttps://www.teses.usp.br/teses/disponiveis/3/3142/tde-06032025-103811/reponame:Biblioteca Digital de Teses e Dissertações da USPinstname:Universidade de São Paulo (USP)instacron:USPLiberar o conteúdo para acesso público.info:eu-repo/semantics/openAccesspor2025-03-06T13:46:02Zoai:teses.usp.br:tde-06032025-103811Biblioteca Digital de Teses e Dissertaçõeshttp://www.teses.usp.br/PUBhttp://www.teses.usp.br/cgi-bin/mtd2br.plvirginia@if.usp.br|| atendimento@aguia.usp.br||virginia@if.usp.bropendoar:27212025-03-06T13:46:02Biblioteca Digital de Teses e Dissertações da USP - Universidade de São Paulo (USP)false |
| dc.title.none.fl_str_mv |
Representação senoidal da voz. Untitled in english |
| title |
Representação senoidal da voz. |
| spellingShingle |
Representação senoidal da voz. Joaquim, Marcelo Basilio Reconhecimento de voz Voice recognition |
| title_short |
Representação senoidal da voz. |
| title_full |
Representação senoidal da voz. |
| title_fullStr |
Representação senoidal da voz. |
| title_full_unstemmed |
Representação senoidal da voz. |
| title_sort |
Representação senoidal da voz. |
| author |
Joaquim, Marcelo Basilio |
| author_facet |
Joaquim, Marcelo Basilio |
| author_role |
author |
| dc.contributor.none.fl_str_mv |
Alens, Normonds |
| dc.contributor.author.fl_str_mv |
Joaquim, Marcelo Basilio |
| dc.subject.por.fl_str_mv |
Reconhecimento de voz Voice recognition |
| topic |
Reconhecimento de voz Voice recognition |
| description |
O principal objetivo deste trabalhoé apresentar e analisar o modelo senoidal de análise e síntese de sinais de voz. Este modelo, denominado representação senoidal da voz se baseia no fato de que o espectro de um trecho do sinal de voz pode ser sintetizado com boa fidelidade através das amplitudes, frequências e fases associadas a cada pico do seu espectro. É apresentado também uma comparação entre representação senoida e predição linear. O trabalho se divide em seis capítulos. No primeiro é introduzido o modelo fisiológico de produção da voz e as características da forma de onda. Nos segundo e terceiro são introduzidos o método básico de representação da voz por predição linear e o modelo senoidal desenvolvido por McAulay e Quatieri. No capítulo quarto é apresentado um novo modelo de representação senoidal baseado no método de Prony para aproximação de um sinal, tendo como vantagem a sua simplicidade e conduz a uma representação eficiente da voz, com um número relativamente baixo de frequências. No capítulo cinco, baseando-se nos resultados do anterior, fez-se uma comparação entre predição linear e o modelo senoidal através da medida do erro quadrático médio aproximado de síntese para os modelos. Finalizando, no sexto capítulo é apresentado um resumo final dos resultados e conclusões obtidos. |
| publishDate |
1991 |
| dc.date.none.fl_str_mv |
1991-04-02 |
| dc.type.status.fl_str_mv |
info:eu-repo/semantics/publishedVersion |
| dc.type.driver.fl_str_mv |
info:eu-repo/semantics/doctoralThesis |
| format |
doctoralThesis |
| status_str |
publishedVersion |
| dc.identifier.uri.fl_str_mv |
https://www.teses.usp.br/teses/disponiveis/3/3142/tde-06032025-103811/ |
| url |
https://www.teses.usp.br/teses/disponiveis/3/3142/tde-06032025-103811/ |
| dc.language.iso.fl_str_mv |
por |
| language |
por |
| dc.relation.none.fl_str_mv |
|
| dc.rights.driver.fl_str_mv |
Liberar o conteúdo para acesso público. info:eu-repo/semantics/openAccess |
| rights_invalid_str_mv |
Liberar o conteúdo para acesso público. |
| eu_rights_str_mv |
openAccess |
| dc.format.none.fl_str_mv |
application/pdf |
| dc.coverage.none.fl_str_mv |
|
| dc.publisher.none.fl_str_mv |
Biblioteca Digitais de Teses e Dissertações da USP |
| publisher.none.fl_str_mv |
Biblioteca Digitais de Teses e Dissertações da USP |
| dc.source.none.fl_str_mv |
reponame:Biblioteca Digital de Teses e Dissertações da USP instname:Universidade de São Paulo (USP) instacron:USP |
| instname_str |
Universidade de São Paulo (USP) |
| instacron_str |
USP |
| institution |
USP |
| reponame_str |
Biblioteca Digital de Teses e Dissertações da USP |
| collection |
Biblioteca Digital de Teses e Dissertações da USP |
| repository.name.fl_str_mv |
Biblioteca Digital de Teses e Dissertações da USP - Universidade de São Paulo (USP) |
| repository.mail.fl_str_mv |
virginia@if.usp.br|| atendimento@aguia.usp.br||virginia@if.usp.br |
| _version_ |
1839839140211851264 |