FFT-based acoustic descriptors formusical timbre characterization usingdata analysis and Machine Learning
| Ano de defesa: | 2023 |
|---|---|
| Autor(a) principal: | |
| Orientador(a): | |
| Banca de defesa: | |
| Tipo de documento: | Tese |
| Tipo de acesso: | Acesso aberto |
| Idioma: | eng |
| Instituição de defesa: |
Universidade Federal do ABC
|
| Programa de Pós-Graduação: |
Programa de Pós-Graduação em Ciência da Computação
|
| Departamento: |
Não Informado pela instituição
|
| País: |
Não Informado pela instituição
|
| Link de acesso: | http://biblioteca.ufabc.edu.br/index.php?codigo_sophia=126932&midiaext=81332 |
Resumo: | Coordenação de Aperfeiçoamento de Pessoal de Nivel Superior |
| id |
UFBC_5b0ce5cbe6de6c34a04cda317997e3ca |
|---|---|
| oai_identifier_str |
oai:BDTD:126932 |
| network_acronym_str |
UFBC |
| network_name_str |
Repositório Institucional da UFABC |
| repository_id_str |
|
| spelling |
info:eu-repo/semantics/publishedVersioninfo:eu-repo/semantics/doctoralThesisFFT-based acoustic descriptors formusical timbre characterization usingdata analysis and Machine Learning2023-11-01Prati, Ronaldo CristianoGonzalez, Yubiry SinamaicaUniversidade Federal do ABCPrograma de Pós-Graduação em Ciência da ComputaçãoUFABCengFFTACOUSTIC DESCRIPTORSMUSICAL TIMBREMUSICAL ACOUSTICSMACHINE LEARNINGRANDOM FORESTK-MEANSDESCRITORES ACÚSTICOSTIMBRE MUSICALACÚSTICA MUSICALPROGRAMA DE PÓS-GRADUAÇÃO EM CIÊNCIA DA COMPUTAÇÃO - UFABCCoordenação de Aperfeiçoamento de Pessoal de Nivel SuperiorO timbre musical é um dos atributos sonoros mais complexos e sua caracterização é uma área de pesquisa em aberto. A coleta e a reprodução digital de sons musicais através da FFT permite estudar o problema do timbre musical sob a perspectiva da acústica musical. Portanto, a tese fundamental é que toda a informação timbrica relevante está, de alguma forma, contida na Transformada de Fourier da gravação de áudio correspondente. O problema da representação do timbre é considerado muito semelhante ao das representações do espaço das cores. Em ambos os casos, as percepções (áudio, cor) precisam ser definidas operacionalmente em espaços abstratos para gestão operacional e computação automática. O principal problema da caracterização do timbre musical estabelece a necessidade de desenvolver um conjunto mínimo de descritores acústicos eficientes que avaliem quantitativamente o timbre musical a partir de gravações de áudio digital, e que possam fornecer com precisão informações suficientes sobre a identificação do timbre musical e padrões de semelhanças. A análise considera apenas gravações de áudio monofônicas, correspondentes à escala de temperamento igual, que constituem um conjunto de frequências discretas, finitas e bem definidas. A partir de gravações de áudio extraídas de bibliotecas conhecidas: TinySol e Good-sounds, correspondentes a sons monofônicos de instrumentos musicais, típicos de uma orquestra sinfônica ocidental, executados por músicos profissionais. Um conjunto de descritores adimensionais e acusticamente motivados são definidos para descrever quantitativamente a distribuição parcial de amplitude de frequência nas FFTs de registros de áudio. Cada FFT contém apenas duas quantidades físicas: frequência e amplitude, cuja distribuição pode ser caracterizada quantificando seu componente fundamental, Afinity (A) e Sharpness (S); os valores médios de ambas quantidades; Mean Affinity (MA) e Mean Contrast (MC) e a descrição da envolvente: Harmonicity (H), Monotony (M). Esses descritores, juntamente com a frequência fundamental, configuram um espaço heptadimensional que permite geometrizar, através da distância euclidiana, as relações de semelhança e proximidade tímbrica. Assim, o problema de caracterização tímbrica se reduz a um problema de agrupamento em um espaço abstrato de 7 dimensões, onde cada registro de áudio corresponde a um ponto. A sua posição no espaço tímbrico e a distância euclidiana entre os registos permitiram-nos discriminar as variações tímbricas, por dinâmicas, oitavas, instrumentos musicais e famílias de instrumentos; utilizando técnicas de Machine Learning e processamento de dados. As semelhanças tímbricas entre gravações de áudio são estudadas, criando um algoritmo através de distâncias euclidianas no espaço de 7 dimensões. Este algoritmo nos permitiu descobrir quais FFTs são semelhantes para diferentes instrumentos musicais. Com base no cálculo dos descritores e relações de distância, foi realizada uma análise exploratória de agrupamento utilizando o algoritmo K-means para a análise dos grupos de instrumentos musicais, famílias de instrumentos, bibliotecas de sons e notas musicais. Observamos que os dados de cada estudo de caso aparecem em regiões delimitadas específicas do espaço tímbrico, o que nos permite identificar relações significativas no processo de caracterização tímbrica. Na análise das variações tímbricas consideramos o crescendo e o vibrato, onde observamos que o crescendo modifica o Mean contrast (MC) e o vibrato modifica o descriptor Affinity (A). Por fim, comparamos a capacidade de classificação dos nossos descritores acústicos FFT com os descritores da biblioteca Librosa, aplicando o algoritmo de classificação Random Forest. Observamos resultados estatisticamente significativos para os descritores FFT-Acústico na classificação de instrumentos musicais e dinâmica, obtendo melhor classificação para notas musicais e família de instrumentos ao compará-los com os descritores Librosa.http://biblioteca.ufabc.edu.br/index.php?codigo_sophia=126932&midiaext=81332application/pdfreponame:Repositório Institucional da UFABCinstname:Universidade Federal do ABC (UFABC)instacron:UFABCinfo:eu-repo/semantics/openAccess2026-01-15T22:08:04Zoai:BDTD:126932Repositório InstitucionalPUBhttp://www.biblioteca.ufabc.edu.br/oai/oai.phpopendoar:2024-09-02T19:52:31Repositório Institucional da UFABC - Universidade Federal do ABC (UFABC)false |
| dc.title.pt.fl_str_mv |
FFT-based acoustic descriptors formusical timbre characterization usingdata analysis and Machine Learning |
| title |
FFT-based acoustic descriptors formusical timbre characterization usingdata analysis and Machine Learning |
| spellingShingle |
FFT-based acoustic descriptors formusical timbre characterization usingdata analysis and Machine Learning Gonzalez, Yubiry Sinamaica |
| title_short |
FFT-based acoustic descriptors formusical timbre characterization usingdata analysis and Machine Learning |
| title_full |
FFT-based acoustic descriptors formusical timbre characterization usingdata analysis and Machine Learning |
| title_fullStr |
FFT-based acoustic descriptors formusical timbre characterization usingdata analysis and Machine Learning |
| title_full_unstemmed |
FFT-based acoustic descriptors formusical timbre characterization usingdata analysis and Machine Learning |
| title_sort |
FFT-based acoustic descriptors formusical timbre characterization usingdata analysis and Machine Learning |
| author |
Gonzalez, Yubiry Sinamaica |
| author_facet |
Gonzalez, Yubiry Sinamaica |
| author_role |
author |
| dc.contributor.advisor1.fl_str_mv |
Prati, Ronaldo Cristiano |
| dc.contributor.author.fl_str_mv |
Gonzalez, Yubiry Sinamaica |
| contributor_str_mv |
Prati, Ronaldo Cristiano |
| description |
Coordenação de Aperfeiçoamento de Pessoal de Nivel Superior |
| publishDate |
2023 |
| dc.date.issued.fl_str_mv |
2023-11-01 |
| dc.type.status.fl_str_mv |
info:eu-repo/semantics/publishedVersion |
| dc.type.driver.fl_str_mv |
info:eu-repo/semantics/doctoralThesis |
| format |
doctoralThesis |
| status_str |
publishedVersion |
| dc.identifier.uri.fl_str_mv |
http://biblioteca.ufabc.edu.br/index.php?codigo_sophia=126932&midiaext=81332 |
| url |
http://biblioteca.ufabc.edu.br/index.php?codigo_sophia=126932&midiaext=81332 |
| dc.language.iso.fl_str_mv |
eng |
| language |
eng |
| dc.rights.driver.fl_str_mv |
info:eu-repo/semantics/openAccess |
| eu_rights_str_mv |
openAccess |
| dc.format.none.fl_str_mv |
application/pdf |
| dc.publisher.none.fl_str_mv |
Universidade Federal do ABC |
| dc.publisher.program.fl_str_mv |
Programa de Pós-Graduação em Ciência da Computação |
| dc.publisher.initials.fl_str_mv |
UFABC |
| publisher.none.fl_str_mv |
Universidade Federal do ABC |
| dc.source.none.fl_str_mv |
reponame:Repositório Institucional da UFABC instname:Universidade Federal do ABC (UFABC) instacron:UFABC |
| instname_str |
Universidade Federal do ABC (UFABC) |
| instacron_str |
UFABC |
| institution |
UFABC |
| reponame_str |
Repositório Institucional da UFABC |
| collection |
Repositório Institucional da UFABC |
| repository.name.fl_str_mv |
Repositório Institucional da UFABC - Universidade Federal do ABC (UFABC) |
| repository.mail.fl_str_mv |
|
| _version_ |
1854475891460014080 |