Redução de ruído em radiocomunicação de alta frequência utilizando máscara tempo-frequência e estimador de razão sinal-ruído a priori

Milesi, Erik Santana

Redução de ruído em radiocomunicação de alta frequência utilizando máscara tempo-frequência e estimador de razão sinal-ruído a priori

Detalhes bibliográficos
Ano de defesa:	2025
Autor(a) principal:	Milesi, Erik Santana
Orientador(a):	Bispo, Bruno Catarino
Banca de defesa:	Não Informado pela instituição
Tipo de documento:	Dissertação
Tipo de acesso:	Acesso aberto
Idioma:	por
Instituição de defesa:	Não Informado pela instituição
Programa de Pós-Graduação:	Não Informado pela instituição
Departamento:	Não Informado pela instituição
País:	Não Informado pela instituição
Link de acesso:	https://repositorio.ufsc.br/handle/123456789/264992
Resumo:	Dissertação (mestrado) - Universidade Federal de Santa Catarina, Centro Tecnológico, Programa de Pós-Graduação em Engenharia Elétrica, Florianópolis, 2025.

Metadados do item

id	UFSC_1e345f7e2aba5069ff086a7f3676de79
oai_identifier_str	oai:repositorio.ufsc.br:123456789/264992
network_acronym_str	UFSC
network_name_str	Repositório Institucional da UFSC
repository_id_str
spelling	Universidade Federal de Santa CatarinaMilesi, Erik SantanaBispo, Bruno CatarinoCosta, Márcio Holsbach2025-05-09T23:26:04Z2025-05-09T23:26:04Z2025391612https://repositorio.ufsc.br/handle/123456789/264992Dissertação (mestrado) - Universidade Federal de Santa Catarina, Centro Tecnológico, Programa de Pós-Graduação em Engenharia Elétrica, Florianópolis, 2025.Esta dissertação apresenta uma pesquisa sobre técnicas de mascaramento tempo-frequência aplicadas à redução de ruído em sinais de fala transmitidos por canais de radiocomunicação de alta frequência (HF, do inglês high frequency). O estudo é dividido em duas etapas principais. Na primeira etapa, análises sob condições ideais de razão sinal-ruído (SNR, do inglês signal-to-noise ratio) foram realizadas para comparar diferentes máscaras. Inicialmente, comparou-se a máscara de Wiener (WM, do inglês Wiener mask) com uma versão aprimorada que incorpora a correlação cruzada (CCWM, do inglês crosscorrelation compensated Wiener mask). Embora a CCWM tenha apresentado resultados ligeiramente superiores nas medidas objetivas de qualidade e inteligibilidade, as diferenças estatísticas em relação à WM não foram significativas, evidenciando que o aumento da complexidade computacional não se traduziu em ganhos substanciais. Em seguida, o estudo avaliou a eficácia das máscaras binária (BM, do inglês binary mask), WM e raiz quadrada de Wiener (SRW, do inglês square-root Wiener mask) na redução de ruído típico de radiocomunicação HF. Nesse cenário, a SRW destacou-se em todas as condições de SNR provavelmente devido à sua maior capacidade de preservação do envelope temporal da fala. Na segunda etapa, o foco foi na estimação da SNR a priori e na aplicação prática dessas estimativas nas máscaras tempo-frequência. Estudou-se um modelo inovador que integra o clássico algoritmo orientado à decisão (DD, do inglês decision-directed) em uma célula recorrente customizada, formando um modelo de rede neural recorrente (RNN/DD). Os resultados demonstraram que o modelo RNN/DD, treinado com a WM como variável-alvo, reduziu o erro de estimação da SNR em até 22,64 dB, resultando em uma melhoria de qualidade de 81,3% e de inteligibilidade de 70,45% em relação à fala contaminada, superando significativamente o método DD. Para fins comparativos, um modelo baseado em memória de curto e longo prazo bidirecional (BLSTM, do inglês bidirectional long short-term memory) foi também avaliado, atingindo os menores valores de erro de estimação da SNR, embora a sua elevada demanda computacional e a operação não causal limitem sua aplicabilidade em tempo real. A comparação entre o método tradicional e os baseados em aprendizado profundo revelou que esses últimos são superiores em termos de precisão na estimação da SNR, resultando em melhorias significativas nas medidas objetivas de qualidade e, sobretudo, de inteligibilidade da fala processada. Em síntese, a dissertação demonstra que a aplicação de máscaras tempo-frequência utilizando SNR a priori estimada é uma estratégia viável e promissora para a redução dos ruídos típicos em radiocomunicação HF. Essa proposta inovadora foi validada por resultados quantitativos que evidenciam ganhos expressivos, especialmente na inteligibilidade, e os métodos baseados em aprendizado profundo apresentaram avanços notáveis, mesmo diante dos desafios operacionais associados ao seu alto custo computacional.Abstract: This dissertation presents research on time-frequency masking techniques applied to noise reduction in speech signals transmitted over high-frequency (HF) radio communication channels. The study is divided into two main stages. In the first stage, analyses under ideal signal-to-noise ratio (SNR) conditions were conducted to compare different masks. Initially, the Wiener mask (WM) was compared with an enhanced version, referred to as the cross-correlation compensated Wiener mask (CCWM). Although the CCWM demonstrated slightly superior results in objective measures of quality and intelligibility, the statistical differences relative to the WM were not significant, indicating that the increased computational complexity did not translate into substantial gains. Subsequently, the study evaluated the effectiveness of the binary mask (BM), the WM, and the square-root Wiener mask (SRW) in reducing the typical noise encountered in HF radio communication. In this context, SRW stood out in all SNR conditions, likely due to its greater ability to preserve the speech temporal envelope. In the second stage, the focus was on a priori SNR estimation and the practical application of these estimates in time-frequency masks. An innovative model that integrates the classic decision-directed (DD) algorithm into a customized recurrent cell, forming a recurrent neural network model (RNN/DD), was investigated. The results demonstrated that the RNN/DD model, trained with the WM as the target variable, reduced the SNR estimation error by up to 22.64 dB, resulting in an 81.3% improvement in quality and a 70.45% improvement in intelligibility compared to noisy speech, thereby significantly outperforming the DD method. For comparative purposes, a bidirectional long short-term memory (BLSTM) model was also evaluated, achieving the lowest SNR estimation error values. However, its high computational demand and non-causal operation limit its applicability in real-time scenarios. The comparison between the traditional method and deep learning-based approaches revealed that the latter are superior in terms of SNR estimation accuracy, leading to significant improvements in objective quality and, notably, in the intelligibility of the processed speech. In summary, the dissertation demonstrates that the application of time-frequency masks using estimated a priori SNR is a viable and promising strategy for reducing the typical noise encountered in HF radio communication. This innovative approach was validated by quantitative results that evidenced substantial gains, particularly in intelligibility, with deep learning-based methods showing remarkable advancements despite the operational challenges associated with their high computational cost.87 p.\| il., tabs.porEngenharia elétricaControle de ruídoAnalisadores de somRedução de ruído em radiocomunicação de alta frequência utilizando máscara tempo-frequência e estimador de razão sinal-ruído a prioriinfo:eu-repo/semantics/publishedVersioninfo:eu-repo/semantics/masterThesisreponame:Repositório Institucional da UFSCinstname:Universidade Federal de Santa Catarina (UFSC)instacron:UFSCinfo:eu-repo/semantics/openAccessORIGINALPEEL2227-D.pdfPEEL2227-D.pdfapplication/pdf9606151https://repositorio.ufsc.br/bitstream/123456789/264992/-1/PEEL2227-D.pdfa1eeb048c9713c236704cef53f49bf11MD5-1123456789/2649922025-05-09 20:26:04.996oai:repositorio.ufsc.br:123456789/264992Repositório InstitucionalPUBhttp://150.162.242.35/oai/requestsandra.sobrera@ufsc.bropendoar:23732025-05-09T23:26:04Repositório Institucional da UFSC - Universidade Federal de Santa Catarina (UFSC)false
dc.title.none.fl_str_mv	Redução de ruído em radiocomunicação de alta frequência utilizando máscara tempo-frequência e estimador de razão sinal-ruído a priori
title	Redução de ruído em radiocomunicação de alta frequência utilizando máscara tempo-frequência e estimador de razão sinal-ruído a priori
spellingShingle	Redução de ruído em radiocomunicação de alta frequência utilizando máscara tempo-frequência e estimador de razão sinal-ruído a priori Milesi, Erik Santana Engenharia elétrica Controle de ruído Analisadores de som
title_short	Redução de ruído em radiocomunicação de alta frequência utilizando máscara tempo-frequência e estimador de razão sinal-ruído a priori
title_full	Redução de ruído em radiocomunicação de alta frequência utilizando máscara tempo-frequência e estimador de razão sinal-ruído a priori
title_fullStr	Redução de ruído em radiocomunicação de alta frequência utilizando máscara tempo-frequência e estimador de razão sinal-ruído a priori
title_full_unstemmed	Redução de ruído em radiocomunicação de alta frequência utilizando máscara tempo-frequência e estimador de razão sinal-ruído a priori
title_sort	Redução de ruído em radiocomunicação de alta frequência utilizando máscara tempo-frequência e estimador de razão sinal-ruído a priori
author	Milesi, Erik Santana
author_facet	Milesi, Erik Santana
author_role	author
dc.contributor.none.fl_str_mv	Universidade Federal de Santa Catarina
dc.contributor.author.fl_str_mv	Milesi, Erik Santana
dc.contributor.advisor1.fl_str_mv	Bispo, Bruno Catarino
dc.contributor.advisor-co1.fl_str_mv	Costa, Márcio Holsbach
contributor_str_mv	Bispo, Bruno Catarino Costa, Márcio Holsbach
dc.subject.classification.none.fl_str_mv	Engenharia elétrica Controle de ruído Analisadores de som
topic	Engenharia elétrica Controle de ruído Analisadores de som
description	Dissertação (mestrado) - Universidade Federal de Santa Catarina, Centro Tecnológico, Programa de Pós-Graduação em Engenharia Elétrica, Florianópolis, 2025.
publishDate	2025
dc.date.accessioned.fl_str_mv	2025-05-09T23:26:04Z
dc.date.available.fl_str_mv	2025-05-09T23:26:04Z
dc.date.issued.fl_str_mv	2025
dc.type.status.fl_str_mv	info:eu-repo/semantics/publishedVersion
dc.type.driver.fl_str_mv	info:eu-repo/semantics/masterThesis
format	masterThesis
status_str	publishedVersion
dc.identifier.uri.fl_str_mv	https://repositorio.ufsc.br/handle/123456789/264992
dc.identifier.other.none.fl_str_mv	391612
identifier_str_mv	391612
url	https://repositorio.ufsc.br/handle/123456789/264992
dc.language.iso.fl_str_mv	por
language	por
dc.rights.driver.fl_str_mv	info:eu-repo/semantics/openAccess
eu_rights_str_mv	openAccess
dc.format.none.fl_str_mv	87 p.\| il., tabs.
dc.source.none.fl_str_mv	reponame:Repositório Institucional da UFSC instname:Universidade Federal de Santa Catarina (UFSC) instacron:UFSC
instname_str	Universidade Federal de Santa Catarina (UFSC)
instacron_str	UFSC
institution	UFSC
reponame_str	Repositório Institucional da UFSC
collection	Repositório Institucional da UFSC
bitstream.url.fl_str_mv	https://repositorio.ufsc.br/bitstream/123456789/264992/-1/PEEL2227-D.pdf
bitstream.checksum.fl_str_mv	a1eeb048c9713c236704cef53f49bf11
bitstream.checksumAlgorithm.fl_str_mv	MD5
repository.name.fl_str_mv	Repositório Institucional da UFSC - Universidade Federal de Santa Catarina (UFSC)
repository.mail.fl_str_mv	sandra.sobrera@ufsc.br
_version_	1851759283793821696

Redução de ruído em radiocomunicação de alta frequência utilizando máscara tempo-frequência e estimador de razão sinal-ruído a priori

Registros relacionados