Soluções de aprendizado de máquina para geração de música instrumental.
| Ano de defesa: | 2025 |
|---|---|
| Autor(a) principal: | |
| Orientador(a): | |
| Banca de defesa: | |
| Tipo de documento: | Dissertação |
| Tipo de acesso: | Acesso aberto |
| Idioma: | por |
| Instituição de defesa: |
Biblioteca Digitais de Teses e Dissertações da USP
|
| Programa de Pós-Graduação: |
Não Informado pela instituição
|
| Departamento: |
Não Informado pela instituição
|
| País: |
Não Informado pela instituição
|
| Palavras-chave em Português: | |
| Link de acesso: | https://www.teses.usp.br/teses/disponiveis/3/3142/tde-10112025-110321/ |
Resumo: | Por conta de sua capacidade de gerar imagens, sons e textos realistas para os humanos, diferentes soluções de inteligência artificial (IA) têm sido cada vez mais exploradas para a geração de arte, inclusive com aplicações comerciais. Nesta dissertação de mestrado, foram desenvolvidos modelos de diferentes estruturas de aprendizado de máquina, como Redes Neurais Adversárias Gerativas (Generative Adversarial Networks GANs), Autocodificadores Variacionais (Variational Autoencoders VAEs), e redes do tipo Memória de Curto Longo Prazo (Long Short-Term Memory LSTM) utilizando Processamento de Linguagem Natural (Natural Language Processing NLP) para compor músicas instrumentais. Os modelos foram treinados utilizando formato matricial próprio, em que cada música é uma matriz de notas. Como banco de dados, foram utilizadas músicas para piano dos compositores Bach, Mozart e Chopin. Para avaliar os resultados, foi realizada uma pesquisa de opinião em que participantes classificaram trechos musicais gerados a partir de músicas de Bach pelos modelos propostos e os compararam com músicas provenientes de outras abordagens, incluindo um modelo documentado na literatura, outro encontrado em repositórios públicos e uma composição original de Bach. Os resultados indicaram que, embora a música original de Bach tenha sido a mais bem avaliada em média, 22,58% dos participantes avaliaram a música gerada pelo modelo de GAN convolucional proposto neste trabalho como a melhor, evidenciando o potencial do uso de IA na composição musical e a capacidade do modelo proposto de produzir resultados considerados satisfatórios por ouvintes humanos. As abordagens propostas neste trabalho foram preferidas, de forma subjetiva, pelos participantes da pesquisa de opinião em relação às soluções da literatura utilizadas para comparação. |
| id |
USP_770960409fd953fe3702abe11251532f |
|---|---|
| oai_identifier_str |
oai:teses.usp.br:tde-10112025-110321 |
| network_acronym_str |
USP |
| network_name_str |
Biblioteca Digital de Teses e Dissertações da USP |
| repository_id_str |
|
| spelling |
Soluções de aprendizado de máquina para geração de música instrumental.Machine learning solutions for instrumental music generation.Aprendizado computacionalArtificial intelligenceComputational musicInteligência artificialMachine learningMúsica computacionalPor conta de sua capacidade de gerar imagens, sons e textos realistas para os humanos, diferentes soluções de inteligência artificial (IA) têm sido cada vez mais exploradas para a geração de arte, inclusive com aplicações comerciais. Nesta dissertação de mestrado, foram desenvolvidos modelos de diferentes estruturas de aprendizado de máquina, como Redes Neurais Adversárias Gerativas (Generative Adversarial Networks GANs), Autocodificadores Variacionais (Variational Autoencoders VAEs), e redes do tipo Memória de Curto Longo Prazo (Long Short-Term Memory LSTM) utilizando Processamento de Linguagem Natural (Natural Language Processing NLP) para compor músicas instrumentais. Os modelos foram treinados utilizando formato matricial próprio, em que cada música é uma matriz de notas. Como banco de dados, foram utilizadas músicas para piano dos compositores Bach, Mozart e Chopin. Para avaliar os resultados, foi realizada uma pesquisa de opinião em que participantes classificaram trechos musicais gerados a partir de músicas de Bach pelos modelos propostos e os compararam com músicas provenientes de outras abordagens, incluindo um modelo documentado na literatura, outro encontrado em repositórios públicos e uma composição original de Bach. Os resultados indicaram que, embora a música original de Bach tenha sido a mais bem avaliada em média, 22,58% dos participantes avaliaram a música gerada pelo modelo de GAN convolucional proposto neste trabalho como a melhor, evidenciando o potencial do uso de IA na composição musical e a capacidade do modelo proposto de produzir resultados considerados satisfatórios por ouvintes humanos. As abordagens propostas neste trabalho foram preferidas, de forma subjetiva, pelos participantes da pesquisa de opinião em relação às soluções da literatura utilizadas para comparação.Due to its ability to generate realistic images, sounds, and texts for humans, different artificial intelligence (AI) solutions have been increasingly explored for artistic creation, including commercial applications. In this masters dissertation, models based on different machine learning structures were developed, such as Generative Adversarial Networks (GANs), Variational Autoencoders (VAEs), and Long Short-Term Memory (LSTM) networks using Natural Language Processing (NLP) to compose instrumental music. The models were trained using a custom matrix format, where each piece of music is represented as a matrix of notes. The dataset consisted of piano compositions by Bach, Mozart, and Chopin. To evaluate the results, an opinion survey was conducted in which participants ranked musical excerpts generated from Bachs compositions by the proposed models and compared them with pieces generated by other approaches, including one documented in the literature, another found in public repositories, and an original composition by Bach. The results indicated that, although Bachs original composition received the highest average ranking, 22.58% of participants rated the music generated by the proposed deep convolutional GAN model as the best, highlighting the potential of AI in music composition and the ability of the proposed model to produce results considered satisfactory by human listeners. The approaches proposed in this work were subjectively preferred by the participants in the opinion poll in relation to those used for comparison.Biblioteca Digitais de Teses e Dissertações da USPSilva, Magno Teófilo Madeira daScocca, Lucas de Santana2025-04-24info:eu-repo/semantics/publishedVersioninfo:eu-repo/semantics/masterThesisapplication/pdfhttps://www.teses.usp.br/teses/disponiveis/3/3142/tde-10112025-110321/reponame:Biblioteca Digital de Teses e Dissertações da USPinstname:Universidade de São Paulo (USP)instacron:USPLiberar o conteúdo para acesso público.info:eu-repo/semantics/openAccesspor2025-11-10T13:11:02Zoai:teses.usp.br:tde-10112025-110321Biblioteca Digital de Teses e Dissertaçõeshttp://www.teses.usp.br/PUBhttp://www.teses.usp.br/cgi-bin/mtd2br.plvirginia@if.usp.br|| atendimento@aguia.usp.br||virginia@if.usp.bropendoar:27212025-11-10T13:11:02Biblioteca Digital de Teses e Dissertações da USP - Universidade de São Paulo (USP)false |
| dc.title.none.fl_str_mv |
Soluções de aprendizado de máquina para geração de música instrumental. Machine learning solutions for instrumental music generation. |
| title |
Soluções de aprendizado de máquina para geração de música instrumental. |
| spellingShingle |
Soluções de aprendizado de máquina para geração de música instrumental. Scocca, Lucas de Santana Aprendizado computacional Artificial intelligence Computational music Inteligência artificial Machine learning Música computacional |
| title_short |
Soluções de aprendizado de máquina para geração de música instrumental. |
| title_full |
Soluções de aprendizado de máquina para geração de música instrumental. |
| title_fullStr |
Soluções de aprendizado de máquina para geração de música instrumental. |
| title_full_unstemmed |
Soluções de aprendizado de máquina para geração de música instrumental. |
| title_sort |
Soluções de aprendizado de máquina para geração de música instrumental. |
| author |
Scocca, Lucas de Santana |
| author_facet |
Scocca, Lucas de Santana |
| author_role |
author |
| dc.contributor.none.fl_str_mv |
Silva, Magno Teófilo Madeira da |
| dc.contributor.author.fl_str_mv |
Scocca, Lucas de Santana |
| dc.subject.por.fl_str_mv |
Aprendizado computacional Artificial intelligence Computational music Inteligência artificial Machine learning Música computacional |
| topic |
Aprendizado computacional Artificial intelligence Computational music Inteligência artificial Machine learning Música computacional |
| description |
Por conta de sua capacidade de gerar imagens, sons e textos realistas para os humanos, diferentes soluções de inteligência artificial (IA) têm sido cada vez mais exploradas para a geração de arte, inclusive com aplicações comerciais. Nesta dissertação de mestrado, foram desenvolvidos modelos de diferentes estruturas de aprendizado de máquina, como Redes Neurais Adversárias Gerativas (Generative Adversarial Networks GANs), Autocodificadores Variacionais (Variational Autoencoders VAEs), e redes do tipo Memória de Curto Longo Prazo (Long Short-Term Memory LSTM) utilizando Processamento de Linguagem Natural (Natural Language Processing NLP) para compor músicas instrumentais. Os modelos foram treinados utilizando formato matricial próprio, em que cada música é uma matriz de notas. Como banco de dados, foram utilizadas músicas para piano dos compositores Bach, Mozart e Chopin. Para avaliar os resultados, foi realizada uma pesquisa de opinião em que participantes classificaram trechos musicais gerados a partir de músicas de Bach pelos modelos propostos e os compararam com músicas provenientes de outras abordagens, incluindo um modelo documentado na literatura, outro encontrado em repositórios públicos e uma composição original de Bach. Os resultados indicaram que, embora a música original de Bach tenha sido a mais bem avaliada em média, 22,58% dos participantes avaliaram a música gerada pelo modelo de GAN convolucional proposto neste trabalho como a melhor, evidenciando o potencial do uso de IA na composição musical e a capacidade do modelo proposto de produzir resultados considerados satisfatórios por ouvintes humanos. As abordagens propostas neste trabalho foram preferidas, de forma subjetiva, pelos participantes da pesquisa de opinião em relação às soluções da literatura utilizadas para comparação. |
| publishDate |
2025 |
| dc.date.none.fl_str_mv |
2025-04-24 |
| dc.type.status.fl_str_mv |
info:eu-repo/semantics/publishedVersion |
| dc.type.driver.fl_str_mv |
info:eu-repo/semantics/masterThesis |
| format |
masterThesis |
| status_str |
publishedVersion |
| dc.identifier.uri.fl_str_mv |
https://www.teses.usp.br/teses/disponiveis/3/3142/tde-10112025-110321/ |
| url |
https://www.teses.usp.br/teses/disponiveis/3/3142/tde-10112025-110321/ |
| dc.language.iso.fl_str_mv |
por |
| language |
por |
| dc.relation.none.fl_str_mv |
|
| dc.rights.driver.fl_str_mv |
Liberar o conteúdo para acesso público. info:eu-repo/semantics/openAccess |
| rights_invalid_str_mv |
Liberar o conteúdo para acesso público. |
| eu_rights_str_mv |
openAccess |
| dc.format.none.fl_str_mv |
application/pdf |
| dc.coverage.none.fl_str_mv |
|
| dc.publisher.none.fl_str_mv |
Biblioteca Digitais de Teses e Dissertações da USP |
| publisher.none.fl_str_mv |
Biblioteca Digitais de Teses e Dissertações da USP |
| dc.source.none.fl_str_mv |
reponame:Biblioteca Digital de Teses e Dissertações da USP instname:Universidade de São Paulo (USP) instacron:USP |
| instname_str |
Universidade de São Paulo (USP) |
| instacron_str |
USP |
| institution |
USP |
| reponame_str |
Biblioteca Digital de Teses e Dissertações da USP |
| collection |
Biblioteca Digital de Teses e Dissertações da USP |
| repository.name.fl_str_mv |
Biblioteca Digital de Teses e Dissertações da USP - Universidade de São Paulo (USP) |
| repository.mail.fl_str_mv |
virginia@if.usp.br|| atendimento@aguia.usp.br||virginia@if.usp.br |
| _version_ |
1865492190297325568 |