Soluções de aprendizado de máquina para geração de música instrumental.

Detalhes bibliográficos
Ano de defesa: 2025
Autor(a) principal: Scocca, Lucas de Santana
Orientador(a): Não Informado pela instituição
Banca de defesa: Não Informado pela instituição
Tipo de documento: Dissertação
Tipo de acesso: Acesso aberto
Idioma: por
Instituição de defesa: Biblioteca Digitais de Teses e Dissertações da USP
Programa de Pós-Graduação: Não Informado pela instituição
Departamento: Não Informado pela instituição
País: Não Informado pela instituição
Palavras-chave em Português:
Link de acesso: https://www.teses.usp.br/teses/disponiveis/3/3142/tde-10112025-110321/
Resumo: Por conta de sua capacidade de gerar imagens, sons e textos realistas para os humanos, diferentes soluções de inteligência artificial (IA) têm sido cada vez mais exploradas para a geração de arte, inclusive com aplicações comerciais. Nesta dissertação de mestrado, foram desenvolvidos modelos de diferentes estruturas de aprendizado de máquina, como Redes Neurais Adversárias Gerativas (Generative Adversarial Networks GANs), Autocodificadores Variacionais (Variational Autoencoders VAEs), e redes do tipo Memória de Curto Longo Prazo (Long Short-Term Memory LSTM) utilizando Processamento de Linguagem Natural (Natural Language Processing NLP) para compor músicas instrumentais. Os modelos foram treinados utilizando formato matricial próprio, em que cada música é uma matriz de notas. Como banco de dados, foram utilizadas músicas para piano dos compositores Bach, Mozart e Chopin. Para avaliar os resultados, foi realizada uma pesquisa de opinião em que participantes classificaram trechos musicais gerados a partir de músicas de Bach pelos modelos propostos e os compararam com músicas provenientes de outras abordagens, incluindo um modelo documentado na literatura, outro encontrado em repositórios públicos e uma composição original de Bach. Os resultados indicaram que, embora a música original de Bach tenha sido a mais bem avaliada em média, 22,58% dos participantes avaliaram a música gerada pelo modelo de GAN convolucional proposto neste trabalho como a melhor, evidenciando o potencial do uso de IA na composição musical e a capacidade do modelo proposto de produzir resultados considerados satisfatórios por ouvintes humanos. As abordagens propostas neste trabalho foram preferidas, de forma subjetiva, pelos participantes da pesquisa de opinião em relação às soluções da literatura utilizadas para comparação.
id USP_770960409fd953fe3702abe11251532f
oai_identifier_str oai:teses.usp.br:tde-10112025-110321
network_acronym_str USP
network_name_str Biblioteca Digital de Teses e Dissertações da USP
repository_id_str
spelling Soluções de aprendizado de máquina para geração de música instrumental.Machine learning solutions for instrumental music generation.Aprendizado computacionalArtificial intelligenceComputational musicInteligência artificialMachine learningMúsica computacionalPor conta de sua capacidade de gerar imagens, sons e textos realistas para os humanos, diferentes soluções de inteligência artificial (IA) têm sido cada vez mais exploradas para a geração de arte, inclusive com aplicações comerciais. Nesta dissertação de mestrado, foram desenvolvidos modelos de diferentes estruturas de aprendizado de máquina, como Redes Neurais Adversárias Gerativas (Generative Adversarial Networks GANs), Autocodificadores Variacionais (Variational Autoencoders VAEs), e redes do tipo Memória de Curto Longo Prazo (Long Short-Term Memory LSTM) utilizando Processamento de Linguagem Natural (Natural Language Processing NLP) para compor músicas instrumentais. Os modelos foram treinados utilizando formato matricial próprio, em que cada música é uma matriz de notas. Como banco de dados, foram utilizadas músicas para piano dos compositores Bach, Mozart e Chopin. Para avaliar os resultados, foi realizada uma pesquisa de opinião em que participantes classificaram trechos musicais gerados a partir de músicas de Bach pelos modelos propostos e os compararam com músicas provenientes de outras abordagens, incluindo um modelo documentado na literatura, outro encontrado em repositórios públicos e uma composição original de Bach. Os resultados indicaram que, embora a música original de Bach tenha sido a mais bem avaliada em média, 22,58% dos participantes avaliaram a música gerada pelo modelo de GAN convolucional proposto neste trabalho como a melhor, evidenciando o potencial do uso de IA na composição musical e a capacidade do modelo proposto de produzir resultados considerados satisfatórios por ouvintes humanos. As abordagens propostas neste trabalho foram preferidas, de forma subjetiva, pelos participantes da pesquisa de opinião em relação às soluções da literatura utilizadas para comparação.Due to its ability to generate realistic images, sounds, and texts for humans, different artificial intelligence (AI) solutions have been increasingly explored for artistic creation, including commercial applications. In this masters dissertation, models based on different machine learning structures were developed, such as Generative Adversarial Networks (GANs), Variational Autoencoders (VAEs), and Long Short-Term Memory (LSTM) networks using Natural Language Processing (NLP) to compose instrumental music. The models were trained using a custom matrix format, where each piece of music is represented as a matrix of notes. The dataset consisted of piano compositions by Bach, Mozart, and Chopin. To evaluate the results, an opinion survey was conducted in which participants ranked musical excerpts generated from Bachs compositions by the proposed models and compared them with pieces generated by other approaches, including one documented in the literature, another found in public repositories, and an original composition by Bach. The results indicated that, although Bachs original composition received the highest average ranking, 22.58% of participants rated the music generated by the proposed deep convolutional GAN model as the best, highlighting the potential of AI in music composition and the ability of the proposed model to produce results considered satisfactory by human listeners. The approaches proposed in this work were subjectively preferred by the participants in the opinion poll in relation to those used for comparison.Biblioteca Digitais de Teses e Dissertações da USPSilva, Magno Teófilo Madeira daScocca, Lucas de Santana2025-04-24info:eu-repo/semantics/publishedVersioninfo:eu-repo/semantics/masterThesisapplication/pdfhttps://www.teses.usp.br/teses/disponiveis/3/3142/tde-10112025-110321/reponame:Biblioteca Digital de Teses e Dissertações da USPinstname:Universidade de São Paulo (USP)instacron:USPLiberar o conteúdo para acesso público.info:eu-repo/semantics/openAccesspor2025-11-10T13:11:02Zoai:teses.usp.br:tde-10112025-110321Biblioteca Digital de Teses e Dissertaçõeshttp://www.teses.usp.br/PUBhttp://www.teses.usp.br/cgi-bin/mtd2br.plvirginia@if.usp.br|| atendimento@aguia.usp.br||virginia@if.usp.bropendoar:27212025-11-10T13:11:02Biblioteca Digital de Teses e Dissertações da USP - Universidade de São Paulo (USP)false
dc.title.none.fl_str_mv Soluções de aprendizado de máquina para geração de música instrumental.
Machine learning solutions for instrumental music generation.
title Soluções de aprendizado de máquina para geração de música instrumental.
spellingShingle Soluções de aprendizado de máquina para geração de música instrumental.
Scocca, Lucas de Santana
Aprendizado computacional
Artificial intelligence
Computational music
Inteligência artificial
Machine learning
Música computacional
title_short Soluções de aprendizado de máquina para geração de música instrumental.
title_full Soluções de aprendizado de máquina para geração de música instrumental.
title_fullStr Soluções de aprendizado de máquina para geração de música instrumental.
title_full_unstemmed Soluções de aprendizado de máquina para geração de música instrumental.
title_sort Soluções de aprendizado de máquina para geração de música instrumental.
author Scocca, Lucas de Santana
author_facet Scocca, Lucas de Santana
author_role author
dc.contributor.none.fl_str_mv Silva, Magno Teófilo Madeira da
dc.contributor.author.fl_str_mv Scocca, Lucas de Santana
dc.subject.por.fl_str_mv Aprendizado computacional
Artificial intelligence
Computational music
Inteligência artificial
Machine learning
Música computacional
topic Aprendizado computacional
Artificial intelligence
Computational music
Inteligência artificial
Machine learning
Música computacional
description Por conta de sua capacidade de gerar imagens, sons e textos realistas para os humanos, diferentes soluções de inteligência artificial (IA) têm sido cada vez mais exploradas para a geração de arte, inclusive com aplicações comerciais. Nesta dissertação de mestrado, foram desenvolvidos modelos de diferentes estruturas de aprendizado de máquina, como Redes Neurais Adversárias Gerativas (Generative Adversarial Networks GANs), Autocodificadores Variacionais (Variational Autoencoders VAEs), e redes do tipo Memória de Curto Longo Prazo (Long Short-Term Memory LSTM) utilizando Processamento de Linguagem Natural (Natural Language Processing NLP) para compor músicas instrumentais. Os modelos foram treinados utilizando formato matricial próprio, em que cada música é uma matriz de notas. Como banco de dados, foram utilizadas músicas para piano dos compositores Bach, Mozart e Chopin. Para avaliar os resultados, foi realizada uma pesquisa de opinião em que participantes classificaram trechos musicais gerados a partir de músicas de Bach pelos modelos propostos e os compararam com músicas provenientes de outras abordagens, incluindo um modelo documentado na literatura, outro encontrado em repositórios públicos e uma composição original de Bach. Os resultados indicaram que, embora a música original de Bach tenha sido a mais bem avaliada em média, 22,58% dos participantes avaliaram a música gerada pelo modelo de GAN convolucional proposto neste trabalho como a melhor, evidenciando o potencial do uso de IA na composição musical e a capacidade do modelo proposto de produzir resultados considerados satisfatórios por ouvintes humanos. As abordagens propostas neste trabalho foram preferidas, de forma subjetiva, pelos participantes da pesquisa de opinião em relação às soluções da literatura utilizadas para comparação.
publishDate 2025
dc.date.none.fl_str_mv 2025-04-24
dc.type.status.fl_str_mv info:eu-repo/semantics/publishedVersion
dc.type.driver.fl_str_mv info:eu-repo/semantics/masterThesis
format masterThesis
status_str publishedVersion
dc.identifier.uri.fl_str_mv https://www.teses.usp.br/teses/disponiveis/3/3142/tde-10112025-110321/
url https://www.teses.usp.br/teses/disponiveis/3/3142/tde-10112025-110321/
dc.language.iso.fl_str_mv por
language por
dc.relation.none.fl_str_mv
dc.rights.driver.fl_str_mv Liberar o conteúdo para acesso público.
info:eu-repo/semantics/openAccess
rights_invalid_str_mv Liberar o conteúdo para acesso público.
eu_rights_str_mv openAccess
dc.format.none.fl_str_mv application/pdf
dc.coverage.none.fl_str_mv
dc.publisher.none.fl_str_mv Biblioteca Digitais de Teses e Dissertações da USP
publisher.none.fl_str_mv Biblioteca Digitais de Teses e Dissertações da USP
dc.source.none.fl_str_mv
reponame:Biblioteca Digital de Teses e Dissertações da USP
instname:Universidade de São Paulo (USP)
instacron:USP
instname_str Universidade de São Paulo (USP)
instacron_str USP
institution USP
reponame_str Biblioteca Digital de Teses e Dissertações da USP
collection Biblioteca Digital de Teses e Dissertações da USP
repository.name.fl_str_mv Biblioteca Digital de Teses e Dissertações da USP - Universidade de São Paulo (USP)
repository.mail.fl_str_mv virginia@if.usp.br|| atendimento@aguia.usp.br||virginia@if.usp.br
_version_ 1865492190297325568