Redução de ruído em radiocomunicação de alta frequência utilizando máscara tempo-frequência e estimador de razão sinal-ruído a priori

Detalhes bibliográficos
Ano de defesa: 2025
Autor(a) principal: Milesi, Erik Santana
Orientador(a): Bispo, Bruno Catarino
Banca de defesa: Não Informado pela instituição
Tipo de documento: Dissertação
Tipo de acesso: Acesso aberto
Idioma: por
Instituição de defesa: Não Informado pela instituição
Programa de Pós-Graduação: Não Informado pela instituição
Departamento: Não Informado pela instituição
País: Não Informado pela instituição
Link de acesso: https://repositorio.ufsc.br/handle/123456789/264992
Resumo: Dissertação (mestrado) - Universidade Federal de Santa Catarina, Centro Tecnológico, Programa de Pós-Graduação em Engenharia Elétrica, Florianópolis, 2025.
id UFSC_1e345f7e2aba5069ff086a7f3676de79
oai_identifier_str oai:repositorio.ufsc.br:123456789/264992
network_acronym_str UFSC
network_name_str Repositório Institucional da UFSC
repository_id_str
spelling Universidade Federal de Santa CatarinaMilesi, Erik SantanaBispo, Bruno CatarinoCosta, Márcio Holsbach2025-05-09T23:26:04Z2025-05-09T23:26:04Z2025391612https://repositorio.ufsc.br/handle/123456789/264992Dissertação (mestrado) - Universidade Federal de Santa Catarina, Centro Tecnológico, Programa de Pós-Graduação em Engenharia Elétrica, Florianópolis, 2025.Esta dissertação apresenta uma pesquisa sobre técnicas de mascaramento tempo-frequência aplicadas à redução de ruído em sinais de fala transmitidos por canais de radiocomunicação de alta frequência (HF, do inglês high frequency). O estudo é dividido em duas etapas principais. Na primeira etapa, análises sob condições ideais de razão sinal-ruído (SNR, do inglês signal-to-noise ratio) foram realizadas para comparar diferentes máscaras. Inicialmente, comparou-se a máscara de Wiener (WM, do inglês Wiener mask) com uma versão aprimorada que incorpora a correlação cruzada (CCWM, do inglês crosscorrelation compensated Wiener mask). Embora a CCWM tenha apresentado resultados ligeiramente superiores nas medidas objetivas de qualidade e inteligibilidade, as diferenças estatísticas em relação à WM não foram significativas, evidenciando que o aumento da complexidade computacional não se traduziu em ganhos substanciais. Em seguida, o estudo avaliou a eficácia das máscaras binária (BM, do inglês binary mask), WM e raiz quadrada de Wiener (SRW, do inglês square-root Wiener mask) na redução de ruído típico de radiocomunicação HF. Nesse cenário, a SRW destacou-se em todas as condições de SNR provavelmente devido à sua maior capacidade de preservação do envelope temporal da fala. Na segunda etapa, o foco foi na estimação da SNR a priori e na aplicação prática dessas estimativas nas máscaras tempo-frequência. Estudou-se um modelo inovador que integra o clássico algoritmo orientado à decisão (DD, do inglês decision-directed) em uma célula recorrente customizada, formando um modelo de rede neural recorrente (RNN/DD). Os resultados demonstraram que o modelo RNN/DD, treinado com a WM como variável-alvo, reduziu o erro de estimação da SNR em até 22,64 dB, resultando em uma melhoria de qualidade de 81,3% e de inteligibilidade de 70,45% em relação à fala contaminada, superando significativamente o método DD. Para fins comparativos, um modelo baseado em memória de curto e longo prazo bidirecional (BLSTM, do inglês bidirectional long short-term memory) foi também avaliado, atingindo os menores valores de erro de estimação da SNR, embora a sua elevada demanda computacional e a operação não causal limitem sua aplicabilidade em tempo real. A comparação entre o método tradicional e os baseados em aprendizado profundo revelou que esses últimos são superiores em termos de precisão na estimação da SNR, resultando em melhorias significativas nas medidas objetivas de qualidade e, sobretudo, de inteligibilidade da fala processada. Em síntese, a dissertação demonstra que a aplicação de máscaras tempo-frequência utilizando SNR a priori estimada é uma estratégia viável e promissora para a redução dos ruídos típicos em radiocomunicação HF. Essa proposta inovadora foi validada por resultados quantitativos que evidenciam ganhos expressivos, especialmente na inteligibilidade, e os métodos baseados em aprendizado profundo apresentaram avanços notáveis, mesmo diante dos desafios operacionais associados ao seu alto custo computacional.Abstract: This dissertation presents research on time-frequency masking techniques applied to noise reduction in speech signals transmitted over high-frequency (HF) radio communication channels. The study is divided into two main stages. In the first stage, analyses under ideal signal-to-noise ratio (SNR) conditions were conducted to compare different masks. Initially, the Wiener mask (WM) was compared with an enhanced version, referred to as the cross-correlation compensated Wiener mask (CCWM). Although the CCWM demonstrated slightly superior results in objective measures of quality and intelligibility, the statistical differences relative to the WM were not significant, indicating that the increased computational complexity did not translate into substantial gains. Subsequently, the study evaluated the effectiveness of the binary mask (BM), the WM, and the square-root Wiener mask (SRW) in reducing the typical noise encountered in HF radio communication. In this context, SRW stood out in all SNR conditions, likely due to its greater ability to preserve the speech temporal envelope. In the second stage, the focus was on a priori SNR estimation and the practical application of these estimates in time-frequency masks. An innovative model that integrates the classic decision-directed (DD) algorithm into a customized recurrent cell, forming a recurrent neural network model (RNN/DD), was investigated. The results demonstrated that the RNN/DD model, trained with the WM as the target variable, reduced the SNR estimation error by up to 22.64 dB, resulting in an 81.3% improvement in quality and a 70.45% improvement in intelligibility compared to noisy speech, thereby significantly outperforming the DD method. For comparative purposes, a bidirectional long short-term memory (BLSTM) model was also evaluated, achieving the lowest SNR estimation error values. However, its high computational demand and non-causal operation limit its applicability in real-time scenarios. The comparison between the traditional method and deep learning-based approaches revealed that the latter are superior in terms of SNR estimation accuracy, leading to significant improvements in objective quality and, notably, in the intelligibility of the processed speech. In summary, the dissertation demonstrates that the application of time-frequency masks using estimated a priori SNR is a viable and promising strategy for reducing the typical noise encountered in HF radio communication. This innovative approach was validated by quantitative results that evidenced substantial gains, particularly in intelligibility, with deep learning-based methods showing remarkable advancements despite the operational challenges associated with their high computational cost.87 p.| il., tabs.porEngenharia elétricaControle de ruídoAnalisadores de somRedução de ruído em radiocomunicação de alta frequência utilizando máscara tempo-frequência e estimador de razão sinal-ruído a prioriinfo:eu-repo/semantics/publishedVersioninfo:eu-repo/semantics/masterThesisreponame:Repositório Institucional da UFSCinstname:Universidade Federal de Santa Catarina (UFSC)instacron:UFSCinfo:eu-repo/semantics/openAccessORIGINALPEEL2227-D.pdfPEEL2227-D.pdfapplication/pdf9606151https://repositorio.ufsc.br/bitstream/123456789/264992/-1/PEEL2227-D.pdfa1eeb048c9713c236704cef53f49bf11MD5-1123456789/2649922025-05-09 20:26:04.996oai:repositorio.ufsc.br:123456789/264992Repositório InstitucionalPUBhttp://150.162.242.35/oai/requestsandra.sobrera@ufsc.bropendoar:23732025-05-09T23:26:04Repositório Institucional da UFSC - Universidade Federal de Santa Catarina (UFSC)false
dc.title.none.fl_str_mv Redução de ruído em radiocomunicação de alta frequência utilizando máscara tempo-frequência e estimador de razão sinal-ruído a priori
title Redução de ruído em radiocomunicação de alta frequência utilizando máscara tempo-frequência e estimador de razão sinal-ruído a priori
spellingShingle Redução de ruído em radiocomunicação de alta frequência utilizando máscara tempo-frequência e estimador de razão sinal-ruído a priori
Milesi, Erik Santana
Engenharia elétrica
Controle de ruído
Analisadores de som
title_short Redução de ruído em radiocomunicação de alta frequência utilizando máscara tempo-frequência e estimador de razão sinal-ruído a priori
title_full Redução de ruído em radiocomunicação de alta frequência utilizando máscara tempo-frequência e estimador de razão sinal-ruído a priori
title_fullStr Redução de ruído em radiocomunicação de alta frequência utilizando máscara tempo-frequência e estimador de razão sinal-ruído a priori
title_full_unstemmed Redução de ruído em radiocomunicação de alta frequência utilizando máscara tempo-frequência e estimador de razão sinal-ruído a priori
title_sort Redução de ruído em radiocomunicação de alta frequência utilizando máscara tempo-frequência e estimador de razão sinal-ruído a priori
author Milesi, Erik Santana
author_facet Milesi, Erik Santana
author_role author
dc.contributor.none.fl_str_mv Universidade Federal de Santa Catarina
dc.contributor.author.fl_str_mv Milesi, Erik Santana
dc.contributor.advisor1.fl_str_mv Bispo, Bruno Catarino
dc.contributor.advisor-co1.fl_str_mv Costa, Márcio Holsbach
contributor_str_mv Bispo, Bruno Catarino
Costa, Márcio Holsbach
dc.subject.classification.none.fl_str_mv Engenharia elétrica
Controle de ruído
Analisadores de som
topic Engenharia elétrica
Controle de ruído
Analisadores de som
description Dissertação (mestrado) - Universidade Federal de Santa Catarina, Centro Tecnológico, Programa de Pós-Graduação em Engenharia Elétrica, Florianópolis, 2025.
publishDate 2025
dc.date.accessioned.fl_str_mv 2025-05-09T23:26:04Z
dc.date.available.fl_str_mv 2025-05-09T23:26:04Z
dc.date.issued.fl_str_mv 2025
dc.type.status.fl_str_mv info:eu-repo/semantics/publishedVersion
dc.type.driver.fl_str_mv info:eu-repo/semantics/masterThesis
format masterThesis
status_str publishedVersion
dc.identifier.uri.fl_str_mv https://repositorio.ufsc.br/handle/123456789/264992
dc.identifier.other.none.fl_str_mv 391612
identifier_str_mv 391612
url https://repositorio.ufsc.br/handle/123456789/264992
dc.language.iso.fl_str_mv por
language por
dc.rights.driver.fl_str_mv info:eu-repo/semantics/openAccess
eu_rights_str_mv openAccess
dc.format.none.fl_str_mv 87 p.| il., tabs.
dc.source.none.fl_str_mv reponame:Repositório Institucional da UFSC
instname:Universidade Federal de Santa Catarina (UFSC)
instacron:UFSC
instname_str Universidade Federal de Santa Catarina (UFSC)
instacron_str UFSC
institution UFSC
reponame_str Repositório Institucional da UFSC
collection Repositório Institucional da UFSC
bitstream.url.fl_str_mv https://repositorio.ufsc.br/bitstream/123456789/264992/-1/PEEL2227-D.pdf
bitstream.checksum.fl_str_mv a1eeb048c9713c236704cef53f49bf11
bitstream.checksumAlgorithm.fl_str_mv MD5
repository.name.fl_str_mv Repositório Institucional da UFSC - Universidade Federal de Santa Catarina (UFSC)
repository.mail.fl_str_mv sandra.sobrera@ufsc.br
_version_ 1851759283793821696