Avaliação de características e previsão de sucesso de canções populares brasileiras por meio de aprendizado de máquina

Detalhes bibliográficos
Ano de defesa: 2021
Autor(a) principal: Bertoni, André Augusto lattes
Orientador(a): Lemos, Rodrigo Pinto lattes
Banca de defesa: Lemos, Rodrigo Pinto, Vieira, Flávio Henrique Teles, Calixto, Wesley Pacheco, Almeida, Anselmo Guerra de
Tipo de documento: Dissertação
Tipo de acesso: Acesso aberto
Idioma: por
Instituição de defesa: Universidade Federal de Goiás
Programa de Pós-Graduação: Programa de Pós-graduação em Engenharia Elétrica e da Computação (EMC)
Departamento: Escola de Engenharia Elétrica, Mecânica e de Computação - EMC (RG)
País: Brasil
Palavras-chave em Português:
Palavras-chave em Inglês:
Área do conhecimento CNPq:
Link de acesso: http://repositorio.bc.ufg.br/tede/handle/tede/11387
Resumo: This work aims to develop algorithms capable of predicting whether a Brazilian popular song can become a commercial success, using the help of Machine Learning techniques. To achieve this goal, a bank of popular Brazilian songs performed on the radio from 2014 to 2019 was created, applying the number of radio plays as the criterion for separating the songs into a successful group and another of non-successful. Several techniques of Data Analysis were studied and applied to optimize the databases and extract statistical characteristics of the songs. From the study of music theory, a set of musical semantic characteristics extracted from each song was also defined to support the Machine Learning algorithms, and then employ Data Science techniques to predict if a song can become a commercial success. Classification algorithms with supervised training were used, both by the classical approach and by means of Deep Neural Networks. For training and validation, cross-validation was used with ten subsets for the classical approach, and five subsets for convolutional networks. The performance of the algorithms was compared basically in terms of accuracy, precision, sensitivity and specificity. The discussion of the results of this work showed that statistical characteristics extracted from the songs brought satisfactory results in several metrics, such as: Accuracy (69.63%), Precision: (69.03%), Sensitivity (71.55%), Balanced Accuracy (69.75%) and ROC (69.75%), using classic techniques as: Naive Bayes, Decision Tree, Random Forest, kNN, Logistic Regression, SVM and MLP - which represents an excellent result, when compared to several other works of literature. Deep Neural Networks of the Convolutional type did not bring good results, with little better accuracy than randomness. The best scenario was achieved by combining three distinct banks of characteristics: a) statistics; b) spectrographs extracted from the Main Voice Melody; c) Musical Melodic Semantic information. With the combination of these three distinct banks of characteristics, 74.54% Accuracy was obtained.
id UFG-2_0a7506f21041b9a40c755d887ddc2d0f
oai_identifier_str oai:repositorio.bc.ufg.br:tede/11387
network_acronym_str UFG-2
network_name_str Repositório Institucional da UFG
repository_id_str
spelling Lemos, Rodrigo Pintohttp://lattes.cnpq.br/3333000136853156Lemos, Rodrigo PintoVieira, Flávio Henrique TelesCalixto, Wesley PachecoAlmeida, Anselmo Guerra dehttp://lattes.cnpq.br/5924224953025095Bertoni, André Augusto2021-05-26T11:27:23Z2021-05-26T11:27:23Z2021-04-13BERTONI, A. A. Avaliação de características e previsão de sucesso de canções populares brasileiras por meio de aprendizado de máquina. 2021. 178 f. Dissertação (Mestrado em Engenharia Elétrica e da Computação) - Universidade Federal de Goiás, Goiânia, 2021.http://repositorio.bc.ufg.br/tede/handle/tede/11387This work aims to develop algorithms capable of predicting whether a Brazilian popular song can become a commercial success, using the help of Machine Learning techniques. To achieve this goal, a bank of popular Brazilian songs performed on the radio from 2014 to 2019 was created, applying the number of radio plays as the criterion for separating the songs into a successful group and another of non-successful. Several techniques of Data Analysis were studied and applied to optimize the databases and extract statistical characteristics of the songs. From the study of music theory, a set of musical semantic characteristics extracted from each song was also defined to support the Machine Learning algorithms, and then employ Data Science techniques to predict if a song can become a commercial success. Classification algorithms with supervised training were used, both by the classical approach and by means of Deep Neural Networks. For training and validation, cross-validation was used with ten subsets for the classical approach, and five subsets for convolutional networks. The performance of the algorithms was compared basically in terms of accuracy, precision, sensitivity and specificity. The discussion of the results of this work showed that statistical characteristics extracted from the songs brought satisfactory results in several metrics, such as: Accuracy (69.63%), Precision: (69.03%), Sensitivity (71.55%), Balanced Accuracy (69.75%) and ROC (69.75%), using classic techniques as: Naive Bayes, Decision Tree, Random Forest, kNN, Logistic Regression, SVM and MLP - which represents an excellent result, when compared to several other works of literature. Deep Neural Networks of the Convolutional type did not bring good results, with little better accuracy than randomness. The best scenario was achieved by combining three distinct banks of characteristics: a) statistics; b) spectrographs extracted from the Main Voice Melody; c) Musical Melodic Semantic information. With the combination of these three distinct banks of characteristics, 74.54% Accuracy was obtained.Este trabalho tem por intuito desenvolver algoritmos capazes de prever se uma canção popular brasileira pode se tornar um sucesso comercial, utilizando-se do auxílio de técnicas de Aprendizado de Máquina. Para alcançar este objetivo, foi criado um banco de canções populares brasileiras executadas nas rádios no período de 2014 a 2019, aplicando-se o número de execuções em rádios como o critério para separação das canções em um grupo de sucesso e noutro de canções de não-sucesso. Foram estudadas e aplicadas diversas técnicas de Análise de Dados (Data Analytics) para otimizar os bancos de dados e extrair características estatísticas das canções. A partir do estudo de teoria musical, definiu-se também um conjunto de características semânticas musicais extraídas de cada canção para subsidiar os algoritmos de Aprendizado de Máquina, para, em seguida, empregar-se técnicas de Ciência de Dados (Data Science) para prever se uma canção pode se tornar um sucesso comercial. Utilizaram-se algoritmos de classificação com treinamento supervisionado, tanto por abordagem clássica quanto por meio de Redes Neurais Profundas. Para treinamento e validação, empregou-se validação cruzada com dez subconjuntos para a abordagem com técnicas clássicas, e cinco subconjuntos para as redes convolucionais. Os desempenhos dos algoritmos foram comparados basicamente em termos de acurácia, precisão, sensibilidade e especificidade. A discussão dos resultados deste trabalho demonstrou que características estatísticas extraídas das canções trouxeram resultados satisfatórios em várias métricas, como: Acurácia (69,63%), Precisão: (69,03%), Sensibilidade (71,55%), Acurácia Balanceada (69,75%) e ROC (69,75%), utilizando-se Técnicas Clássicas, como: Naive Bayes, Árvore de Decisões, Floresta Aleatória, kNN, Regressão Logística, Máquina de Vetores de Suporte (SVM) e Multi Layer Perceptron (MLP) - o que representa um excelente resultado, quando comparado à vários outros trabalhos da literatura. As Redes Neurais Profundas do tipo Convolucionais não trouxeram bons resultados, com acurácia pouco melhor do que um sorteio aleatório. O melhor cenário foi conseguido através da junção de três bancos distintos de características: a) estatísticas; b) espectrográficas extraídas da Melodia Principal da Voz; c) informações Semânticas Melódicas Musicais. Com a junção destes três bancos distintos de características obteve-se 74,54% de Precisão.Submitted by Luciana Ferreira (lucgeral@gmail.com) on 2021-05-20T11:13:32Z No. of bitstreams: 2 Dissertação - André Augusto Bertoni - 2021.pdf: 7829360 bytes, checksum: a6a485f477a277e9b0abdaf71ab176c3 (MD5) license_rdf: 805 bytes, checksum: 4460e5956bc1d1639be9ae6146a50347 (MD5)Approved for entry into archive by Luciana Ferreira (lucgeral@gmail.com) on 2021-05-26T11:27:23Z (GMT) No. of bitstreams: 2 Dissertação - André Augusto Bertoni - 2021.pdf: 7829360 bytes, checksum: a6a485f477a277e9b0abdaf71ab176c3 (MD5) license_rdf: 805 bytes, checksum: 4460e5956bc1d1639be9ae6146a50347 (MD5)Made available in DSpace on 2021-05-26T11:27:23Z (GMT). No. of bitstreams: 2 Dissertação - André Augusto Bertoni - 2021.pdf: 7829360 bytes, checksum: a6a485f477a277e9b0abdaf71ab176c3 (MD5) license_rdf: 805 bytes, checksum: 4460e5956bc1d1639be9ae6146a50347 (MD5) Previous issue date: 2021-04-13porUniversidade Federal de GoiásPrograma de Pós-graduação em Engenharia Elétrica e da Computação (EMC)UFGBrasilEscola de Engenharia Elétrica, Mecânica e de Computação - EMC (RG)Attribution-NonCommercial-NoDerivatives 4.0 Internationalhttp://creativecommons.org/licenses/by-nc-nd/4.0/info:eu-repo/semantics/openAccessCiência das canções de sucessoAprendizado de máquinaExtração de característicasRecuperação de Informações Musicais (RIM)Melodia predominante da vozHit song scienceMachine learningFeature extractionMusic Information Retrieval (MIR)Predominant voice melodyENGENHARIASAvaliação de características e previsão de sucesso de canções populares brasileiras por meio de aprendizado de máquinaCharacteristics evaluation and prediction of success of popular brazilian songs through machine learninginfo:eu-repo/semantics/publishedVersioninfo:eu-repo/semantics/masterThesis495005005004484reponame:Repositório Institucional da UFGinstname:Universidade Federal de Goiás (UFG)instacron:UFGLICENSElicense.txtlicense.txttext/plain; charset=utf-81748http://repositorio.bc.ufg.br/tede/bitstreams/9d4b4a04-7391-4384-b363-6b2c1bcfc2ff/download8a4605be74aa9ea9d79846c1fba20a33MD51ORIGINALDissertação - André Augusto Bertoni - 2021.pdfDissertação - André Augusto Bertoni - 2021.pdfapplication/pdf7829360http://repositorio.bc.ufg.br/tede/bitstreams/dcab41d7-3830-4cb8-a15c-f84856d09d84/downloada6a485f477a277e9b0abdaf71ab176c3MD53CC-LICENSElicense_rdflicense_rdfapplication/rdf+xml; charset=utf-8805http://repositorio.bc.ufg.br/tede/bitstreams/9f7b169d-b8a9-4a9b-8274-e408c7d4fd1a/download4460e5956bc1d1639be9ae6146a50347MD52tede/113872021-05-26 08:27:23.937http://creativecommons.org/licenses/by-nc-nd/4.0/Attribution-NonCommercial-NoDerivatives 4.0 Internationalopen.accessoai:repositorio.bc.ufg.br:tede/11387http://repositorio.bc.ufg.br/tedeRepositório InstitucionalPUBhttp://repositorio.bc.ufg.br/oai/requesttasesdissertacoes.bc@ufg.bropendoar:2021-05-26T11:27:23Repositório Institucional da UFG - Universidade Federal de Goiás (UFG)falseTk9URTogUExBQ0UgWU9VUiBPV04gTElDRU5TRSBIRVJFClRoaXMgc2FtcGxlIGxpY2Vuc2UgaXMgcHJvdmlkZWQgZm9yIGluZm9ybWF0aW9uYWwgcHVycG9zZXMgb25seS4KCk5PTi1FWENMVVNJVkUgRElTVFJJQlVUSU9OIExJQ0VOU0UKCkJ5IHNpZ25pbmcgYW5kIHN1Ym1pdHRpbmcgdGhpcyBsaWNlbnNlLCB5b3UgKHRoZSBhdXRob3Iocykgb3IgY29weXJpZ2h0Cm93bmVyKSBncmFudHMgdG8gRFNwYWNlIFVuaXZlcnNpdHkgKERTVSkgdGhlIG5vbi1leGNsdXNpdmUgcmlnaHQgdG8gcmVwcm9kdWNlLAp0cmFuc2xhdGUgKGFzIGRlZmluZWQgYmVsb3cpLCBhbmQvb3IgZGlzdHJpYnV0ZSB5b3VyIHN1Ym1pc3Npb24gKGluY2x1ZGluZwp0aGUgYWJzdHJhY3QpIHdvcmxkd2lkZSBpbiBwcmludCBhbmQgZWxlY3Ryb25pYyBmb3JtYXQgYW5kIGluIGFueSBtZWRpdW0sCmluY2x1ZGluZyBidXQgbm90IGxpbWl0ZWQgdG8gYXVkaW8gb3IgdmlkZW8uCgpZb3UgYWdyZWUgdGhhdCBEU1UgbWF5LCB3aXRob3V0IGNoYW5naW5nIHRoZSBjb250ZW50LCB0cmFuc2xhdGUgdGhlCnN1Ym1pc3Npb24gdG8gYW55IG1lZGl1bSBvciBmb3JtYXQgZm9yIHRoZSBwdXJwb3NlIG9mIHByZXNlcnZhdGlvbi4KCllvdSBhbHNvIGFncmVlIHRoYXQgRFNVIG1heSBrZWVwIG1vcmUgdGhhbiBvbmUgY29weSBvZiB0aGlzIHN1Ym1pc3Npb24gZm9yCnB1cnBvc2VzIG9mIHNlY3VyaXR5LCBiYWNrLXVwIGFuZCBwcmVzZXJ2YXRpb24uCgpZb3UgcmVwcmVzZW50IHRoYXQgdGhlIHN1Ym1pc3Npb24gaXMgeW91ciBvcmlnaW5hbCB3b3JrLCBhbmQgdGhhdCB5b3UgaGF2ZQp0aGUgcmlnaHQgdG8gZ3JhbnQgdGhlIHJpZ2h0cyBjb250YWluZWQgaW4gdGhpcyBsaWNlbnNlLiBZb3UgYWxzbyByZXByZXNlbnQKdGhhdCB5b3VyIHN1Ym1pc3Npb24gZG9lcyBub3QsIHRvIHRoZSBiZXN0IG9mIHlvdXIga25vd2xlZGdlLCBpbmZyaW5nZSB1cG9uCmFueW9uZSdzIGNvcHlyaWdodC4KCklmIHRoZSBzdWJtaXNzaW9uIGNvbnRhaW5zIG1hdGVyaWFsIGZvciB3aGljaCB5b3UgZG8gbm90IGhvbGQgY29weXJpZ2h0LAp5b3UgcmVwcmVzZW50IHRoYXQgeW91IGhhdmUgb2J0YWluZWQgdGhlIHVucmVzdHJpY3RlZCBwZXJtaXNzaW9uIG9mIHRoZQpjb3B5cmlnaHQgb3duZXIgdG8gZ3JhbnQgRFNVIHRoZSByaWdodHMgcmVxdWlyZWQgYnkgdGhpcyBsaWNlbnNlLCBhbmQgdGhhdApzdWNoIHRoaXJkLXBhcnR5IG93bmVkIG1hdGVyaWFsIGlzIGNsZWFybHkgaWRlbnRpZmllZCBhbmQgYWNrbm93bGVkZ2VkCndpdGhpbiB0aGUgdGV4dCBvciBjb250ZW50IG9mIHRoZSBzdWJtaXNzaW9uLgoKSUYgVEhFIFNVQk1JU1NJT04gSVMgQkFTRUQgVVBPTiBXT1JLIFRIQVQgSEFTIEJFRU4gU1BPTlNPUkVEIE9SIFNVUFBPUlRFRApCWSBBTiBBR0VOQ1kgT1IgT1JHQU5JWkFUSU9OIE9USEVSIFRIQU4gRFNVLCBZT1UgUkVQUkVTRU5UIFRIQVQgWU9VIEhBVkUKRlVMRklMTEVEIEFOWSBSSUdIVCBPRiBSRVZJRVcgT1IgT1RIRVIgT0JMSUdBVElPTlMgUkVRVUlSRUQgQlkgU1VDSApDT05UUkFDVCBPUiBBR1JFRU1FTlQuCgpEU1Ugd2lsbCBjbGVhcmx5IGlkZW50aWZ5IHlvdXIgbmFtZShzKSBhcyB0aGUgYXV0aG9yKHMpIG9yIG93bmVyKHMpIG9mIHRoZQpzdWJtaXNzaW9uLCBhbmQgd2lsbCBub3QgbWFrZSBhbnkgYWx0ZXJhdGlvbiwgb3RoZXIgdGhhbiBhcyBhbGxvd2VkIGJ5IHRoaXMKbGljZW5zZSwgdG8geW91ciBzdWJtaXNzaW9uLgo=
dc.title.pt_BR.fl_str_mv Avaliação de características e previsão de sucesso de canções populares brasileiras por meio de aprendizado de máquina
dc.title.alternative.eng.fl_str_mv Characteristics evaluation and prediction of success of popular brazilian songs through machine learning
title Avaliação de características e previsão de sucesso de canções populares brasileiras por meio de aprendizado de máquina
spellingShingle Avaliação de características e previsão de sucesso de canções populares brasileiras por meio de aprendizado de máquina
Bertoni, André Augusto
Ciência das canções de sucesso
Aprendizado de máquina
Extração de características
Recuperação de Informações Musicais (RIM)
Melodia predominante da voz
Hit song science
Machine learning
Feature extraction
Music Information Retrieval (MIR)
Predominant voice melody
ENGENHARIAS
title_short Avaliação de características e previsão de sucesso de canções populares brasileiras por meio de aprendizado de máquina
title_full Avaliação de características e previsão de sucesso de canções populares brasileiras por meio de aprendizado de máquina
title_fullStr Avaliação de características e previsão de sucesso de canções populares brasileiras por meio de aprendizado de máquina
title_full_unstemmed Avaliação de características e previsão de sucesso de canções populares brasileiras por meio de aprendizado de máquina
title_sort Avaliação de características e previsão de sucesso de canções populares brasileiras por meio de aprendizado de máquina
author Bertoni, André Augusto
author_facet Bertoni, André Augusto
author_role author
dc.contributor.advisor1.fl_str_mv Lemos, Rodrigo Pinto
dc.contributor.advisor1Lattes.fl_str_mv http://lattes.cnpq.br/3333000136853156
dc.contributor.referee1.fl_str_mv Lemos, Rodrigo Pinto
dc.contributor.referee2.fl_str_mv Vieira, Flávio Henrique Teles
dc.contributor.referee3.fl_str_mv Calixto, Wesley Pacheco
dc.contributor.referee4.fl_str_mv Almeida, Anselmo Guerra de
dc.contributor.authorLattes.fl_str_mv http://lattes.cnpq.br/5924224953025095
dc.contributor.author.fl_str_mv Bertoni, André Augusto
contributor_str_mv Lemos, Rodrigo Pinto
Lemos, Rodrigo Pinto
Vieira, Flávio Henrique Teles
Calixto, Wesley Pacheco
Almeida, Anselmo Guerra de
dc.subject.por.fl_str_mv Ciência das canções de sucesso
Aprendizado de máquina
Extração de características
Recuperação de Informações Musicais (RIM)
Melodia predominante da voz
topic Ciência das canções de sucesso
Aprendizado de máquina
Extração de características
Recuperação de Informações Musicais (RIM)
Melodia predominante da voz
Hit song science
Machine learning
Feature extraction
Music Information Retrieval (MIR)
Predominant voice melody
ENGENHARIAS
dc.subject.eng.fl_str_mv Hit song science
Machine learning
Feature extraction
Music Information Retrieval (MIR)
Predominant voice melody
dc.subject.cnpq.fl_str_mv ENGENHARIAS
description This work aims to develop algorithms capable of predicting whether a Brazilian popular song can become a commercial success, using the help of Machine Learning techniques. To achieve this goal, a bank of popular Brazilian songs performed on the radio from 2014 to 2019 was created, applying the number of radio plays as the criterion for separating the songs into a successful group and another of non-successful. Several techniques of Data Analysis were studied and applied to optimize the databases and extract statistical characteristics of the songs. From the study of music theory, a set of musical semantic characteristics extracted from each song was also defined to support the Machine Learning algorithms, and then employ Data Science techniques to predict if a song can become a commercial success. Classification algorithms with supervised training were used, both by the classical approach and by means of Deep Neural Networks. For training and validation, cross-validation was used with ten subsets for the classical approach, and five subsets for convolutional networks. The performance of the algorithms was compared basically in terms of accuracy, precision, sensitivity and specificity. The discussion of the results of this work showed that statistical characteristics extracted from the songs brought satisfactory results in several metrics, such as: Accuracy (69.63%), Precision: (69.03%), Sensitivity (71.55%), Balanced Accuracy (69.75%) and ROC (69.75%), using classic techniques as: Naive Bayes, Decision Tree, Random Forest, kNN, Logistic Regression, SVM and MLP - which represents an excellent result, when compared to several other works of literature. Deep Neural Networks of the Convolutional type did not bring good results, with little better accuracy than randomness. The best scenario was achieved by combining three distinct banks of characteristics: a) statistics; b) spectrographs extracted from the Main Voice Melody; c) Musical Melodic Semantic information. With the combination of these three distinct banks of characteristics, 74.54% Accuracy was obtained.
publishDate 2021
dc.date.accessioned.fl_str_mv 2021-05-26T11:27:23Z
dc.date.available.fl_str_mv 2021-05-26T11:27:23Z
dc.date.issued.fl_str_mv 2021-04-13
dc.type.status.fl_str_mv info:eu-repo/semantics/publishedVersion
dc.type.driver.fl_str_mv info:eu-repo/semantics/masterThesis
format masterThesis
status_str publishedVersion
dc.identifier.citation.fl_str_mv BERTONI, A. A. Avaliação de características e previsão de sucesso de canções populares brasileiras por meio de aprendizado de máquina. 2021. 178 f. Dissertação (Mestrado em Engenharia Elétrica e da Computação) - Universidade Federal de Goiás, Goiânia, 2021.
dc.identifier.uri.fl_str_mv http://repositorio.bc.ufg.br/tede/handle/tede/11387
identifier_str_mv BERTONI, A. A. Avaliação de características e previsão de sucesso de canções populares brasileiras por meio de aprendizado de máquina. 2021. 178 f. Dissertação (Mestrado em Engenharia Elétrica e da Computação) - Universidade Federal de Goiás, Goiânia, 2021.
url http://repositorio.bc.ufg.br/tede/handle/tede/11387
dc.language.iso.fl_str_mv por
language por
dc.relation.program.fl_str_mv 49
dc.relation.confidence.fl_str_mv 500
500
500
dc.relation.department.fl_str_mv 4
dc.relation.cnpq.fl_str_mv 484
dc.rights.driver.fl_str_mv Attribution-NonCommercial-NoDerivatives 4.0 International
http://creativecommons.org/licenses/by-nc-nd/4.0/
info:eu-repo/semantics/openAccess
rights_invalid_str_mv Attribution-NonCommercial-NoDerivatives 4.0 International
http://creativecommons.org/licenses/by-nc-nd/4.0/
eu_rights_str_mv openAccess
dc.publisher.none.fl_str_mv Universidade Federal de Goiás
dc.publisher.program.fl_str_mv Programa de Pós-graduação em Engenharia Elétrica e da Computação (EMC)
dc.publisher.initials.fl_str_mv UFG
dc.publisher.country.fl_str_mv Brasil
dc.publisher.department.fl_str_mv Escola de Engenharia Elétrica, Mecânica e de Computação - EMC (RG)
publisher.none.fl_str_mv Universidade Federal de Goiás
dc.source.none.fl_str_mv reponame:Repositório Institucional da UFG
instname:Universidade Federal de Goiás (UFG)
instacron:UFG
instname_str Universidade Federal de Goiás (UFG)
instacron_str UFG
institution UFG
reponame_str Repositório Institucional da UFG
collection Repositório Institucional da UFG
bitstream.url.fl_str_mv http://repositorio.bc.ufg.br/tede/bitstreams/9d4b4a04-7391-4384-b363-6b2c1bcfc2ff/download
http://repositorio.bc.ufg.br/tede/bitstreams/dcab41d7-3830-4cb8-a15c-f84856d09d84/download
http://repositorio.bc.ufg.br/tede/bitstreams/9f7b169d-b8a9-4a9b-8274-e408c7d4fd1a/download
bitstream.checksum.fl_str_mv 8a4605be74aa9ea9d79846c1fba20a33
a6a485f477a277e9b0abdaf71ab176c3
4460e5956bc1d1639be9ae6146a50347
bitstream.checksumAlgorithm.fl_str_mv MD5
MD5
MD5
repository.name.fl_str_mv Repositório Institucional da UFG - Universidade Federal de Goiás (UFG)
repository.mail.fl_str_mv tasesdissertacoes.bc@ufg.br
_version_ 1798045049737445376