Ecologia Acústica e Ciência de Dados: uma análise da paisagem sonora do cerrado Aplicabilidade e desempenho de modelos de aprendizado de máquina na identificação de formações ecológicas.
| Ano de defesa: | 2024 |
|---|---|
| Autor(a) principal: | |
| Orientador(a): | |
| Banca de defesa: | |
| Tipo de documento: | Dissertação |
| Tipo de acesso: | Acesso aberto |
| Idioma: | por |
| Instituição de defesa: |
Biblioteca Digitais de Teses e Dissertações da USP
|
| Programa de Pós-Graduação: |
Não Informado pela instituição
|
| Departamento: |
Não Informado pela instituição
|
| País: |
Não Informado pela instituição
|
| Palavras-chave em Português: | |
| Link de acesso: | https://www.teses.usp.br/teses/disponiveis/3/3152/tde-19072024-094959/ |
Resumo: | O Cerrado é um bioma brasileiro de grande importância ecológica, ocupando cerca de 2 milhões de quilômetros quadrados, o que corresponde a quase um quarto do território nacional. Este bioma possui papel relevante na manutenção da vida e do clima, concentrando cerca de 5% de todas as espécies (fauna) do planeta e formando o sistema hidrológico do Pantanal, um dos maiores complexos de água doce do mundo. Entretanto, o Cerrado enfrenta desafios devido ao avanço das atividades agropecuárias e ao aumento dos desastres ambientais, em decorrência das mudanças climáticas. Visando auxiliar os trabalhos de preservação e recuperação do bioma, este estudo explorou diferentes metodologias de Ciência de Dados para identificar a formação natural do Cerrado (Florestal, Savânica e Campestre) através da paisagem sonora do ambiente. Foram desenvolvidos cinco modelos estatísticos, utilizando coeficientes cepstrais de frequência mel (MFCCs) como variáveis independentes para os modelos de Gradient Boosting, Random Forest, Regressão Logística e Multilayer Perceptron, e imagens dos espectrogramas para a Rede Neural Convolucional (CNN). A análise dos resultados revelou que a CNN apresentou o melhor desempenho em todas as métricas avaliadas. Entretanto, a escolha do modelo mais adequado deve levar em consideração não apenas a performance, mas também a simplicidade do método, o tempo de resposta da predição e a capacidade de lidar com um grande número de observações em um curto período de tempo. Neste contexto, modelos mais simples, como Gradient Boosting ou Random Forest, podem ser mais apropriados em alguns casos. A aplicação da técnica de explicabilidade LIME auxiliou na compreensão dos processos de decisão do modelo de CNN, fornecendo insights sobre como melhorar sua performance e aplicação em estudos futuros de preservação e recuperação do bioma Cerrado. A análise das frequências relevantes para cada formação do Cerrado demonstrou o potencial dessa técnica na identificação das características do espectrograma responsáveis pela classificação das paisagens acústicas. Este estudo demonstra que a combinação de Ecologia Acústica e Ciência de Dados pode ser eficiente na classificação de paisagens acústicas e na identificação do tipo de formação do Cerrado. As conclusões deste trabalho podem servir como base para futuras pesquisas na área de Ecologia Acústica e na aplicação de técnicas de aprendizado de máquina em estudos ambientais, contribuindo para a preservação da biodiversidade e a recuperação de biomas ameaçados, como o Cerrado. Além disso, fornece insumos metodológicos para outras pesquisas acerca do uso da Inteligência Artificial/Machine Learning na identificação e classificação de sinais em geral. |
| id |
USP_1cdb460a4b08bb3803bb7c3159dd3118 |
|---|---|
| oai_identifier_str |
oai:teses.usp.br:tde-19072024-094959 |
| network_acronym_str |
USP |
| network_name_str |
Biblioteca Digital de Teses e Dissertações da USP |
| repository_id_str |
|
| spelling |
Ecologia Acústica e Ciência de Dados: uma análise da paisagem sonora do cerrado Aplicabilidade e desempenho de modelos de aprendizado de máquina na identificação de formações ecológicas.Acoustic Ecology and Data Science: an analysis of the Cerrado soundscape: applicability and performance of machine learning models in the identification of ecological formations.Acoustic ecologyAprendizado computacionalBiodiversityCerradoCerradoConvolutional neural network (CNN)Ecologia acústicaEnvironmental preservationGradient boostingInteligência artificialMachine learningPaisagem sonoraRandom forestSoundscapesO Cerrado é um bioma brasileiro de grande importância ecológica, ocupando cerca de 2 milhões de quilômetros quadrados, o que corresponde a quase um quarto do território nacional. Este bioma possui papel relevante na manutenção da vida e do clima, concentrando cerca de 5% de todas as espécies (fauna) do planeta e formando o sistema hidrológico do Pantanal, um dos maiores complexos de água doce do mundo. Entretanto, o Cerrado enfrenta desafios devido ao avanço das atividades agropecuárias e ao aumento dos desastres ambientais, em decorrência das mudanças climáticas. Visando auxiliar os trabalhos de preservação e recuperação do bioma, este estudo explorou diferentes metodologias de Ciência de Dados para identificar a formação natural do Cerrado (Florestal, Savânica e Campestre) através da paisagem sonora do ambiente. Foram desenvolvidos cinco modelos estatísticos, utilizando coeficientes cepstrais de frequência mel (MFCCs) como variáveis independentes para os modelos de Gradient Boosting, Random Forest, Regressão Logística e Multilayer Perceptron, e imagens dos espectrogramas para a Rede Neural Convolucional (CNN). A análise dos resultados revelou que a CNN apresentou o melhor desempenho em todas as métricas avaliadas. Entretanto, a escolha do modelo mais adequado deve levar em consideração não apenas a performance, mas também a simplicidade do método, o tempo de resposta da predição e a capacidade de lidar com um grande número de observações em um curto período de tempo. Neste contexto, modelos mais simples, como Gradient Boosting ou Random Forest, podem ser mais apropriados em alguns casos. A aplicação da técnica de explicabilidade LIME auxiliou na compreensão dos processos de decisão do modelo de CNN, fornecendo insights sobre como melhorar sua performance e aplicação em estudos futuros de preservação e recuperação do bioma Cerrado. A análise das frequências relevantes para cada formação do Cerrado demonstrou o potencial dessa técnica na identificação das características do espectrograma responsáveis pela classificação das paisagens acústicas. Este estudo demonstra que a combinação de Ecologia Acústica e Ciência de Dados pode ser eficiente na classificação de paisagens acústicas e na identificação do tipo de formação do Cerrado. As conclusões deste trabalho podem servir como base para futuras pesquisas na área de Ecologia Acústica e na aplicação de técnicas de aprendizado de máquina em estudos ambientais, contribuindo para a preservação da biodiversidade e a recuperação de biomas ameaçados, como o Cerrado. Além disso, fornece insumos metodológicos para outras pesquisas acerca do uso da Inteligência Artificial/Machine Learning na identificação e classificação de sinais em geral.The Cerrado is a Brazilian biome of great ecological importance, occupying about 2 million square kilometers, which corresponds to almost a quarter of the national territory. This biome plays a crucial role in sustaining life and stabilizing climate patterns, encompassing approximately 5% of all known animal species on the planet and contributing to the hydrological system of the Pantanal, one of the worlds most extensive freshwater complexes. However, the Cerrado faces challenges due to the expansion of agricultural activities and the increase in environmental disasters, as a result of climate change. Aiming to support the preservation and recovery of the biome, this study explored different Data Science methodologies to identify the natural formation of the Cerrado (Forested, Savanna, and Grassland) through the soundscapes of the environment. Five statistical models were developed, using Mel Frequency Cepstral Coefficients (MFCCs) as independent variables for the Gradient Boosting, Random Forest, Logistic Regression, and Multilayer Perceptron models, and spectrogram images for the Convolutional Neural Network (CNN). The analysis of the results revealed that the CNN had the best performance in all evaluated metrics. However, the choice of the most suitable model should take into account not only performance but also the simplicity of the method, the response time of the prediction, and the ability to handle a large number of observations in a short period of time. In this context, simpler models, such as Gradient Boosting or Random Forest, may be more appropriate in some cases. The application of the LIME explainability technique helped in understanding the decision processes of the CNN model, providing insights into how to improve its performance and application in future studies of preservation and recovery of the Cerrado biome. The analysis of the relevant frequencies for each Cerrado formation demonstrated the potential of this technique in identifying the characteristics of the spectrogram responsible for classifying the acoustic landscapes. This study demonstrates that the combination of Acoustic Ecology and Data Science can be efficient in classifying acoustic landscapes and identifying the type of Cerrado formation. The conclusions of this work can serve as a basis for future research in the field of Acoustic Ecology and the application of machine learning techniques in environmental studies, contributing to the preservation of biodiversity and the recovery of threatened biomes, such as the Cerrado. Furthermore, it provides methodological inputs for other research on the use of Artificial Intelligence/Machine Learning in the identification and classification of signals.Biblioteca Digitais de Teses e Dissertações da USPPadovese, Linilson RodriguesSilva, Bruno Daleffi da2024-03-08info:eu-repo/semantics/publishedVersioninfo:eu-repo/semantics/masterThesisapplication/pdfhttps://www.teses.usp.br/teses/disponiveis/3/3152/tde-19072024-094959/reponame:Biblioteca Digital de Teses e Dissertações da USPinstname:Universidade de São Paulo (USP)instacron:USPLiberar o conteúdo para acesso público.info:eu-repo/semantics/openAccesspor2024-07-19T13:28:02Zoai:teses.usp.br:tde-19072024-094959Biblioteca Digital de Teses e Dissertaçõeshttp://www.teses.usp.br/PUBhttp://www.teses.usp.br/cgi-bin/mtd2br.plvirginia@if.usp.br|| atendimento@aguia.usp.br||virginia@if.usp.bropendoar:27212024-07-19T13:28:02Biblioteca Digital de Teses e Dissertações da USP - Universidade de São Paulo (USP)false |
| dc.title.none.fl_str_mv |
Ecologia Acústica e Ciência de Dados: uma análise da paisagem sonora do cerrado Aplicabilidade e desempenho de modelos de aprendizado de máquina na identificação de formações ecológicas. Acoustic Ecology and Data Science: an analysis of the Cerrado soundscape: applicability and performance of machine learning models in the identification of ecological formations. |
| title |
Ecologia Acústica e Ciência de Dados: uma análise da paisagem sonora do cerrado Aplicabilidade e desempenho de modelos de aprendizado de máquina na identificação de formações ecológicas. |
| spellingShingle |
Ecologia Acústica e Ciência de Dados: uma análise da paisagem sonora do cerrado Aplicabilidade e desempenho de modelos de aprendizado de máquina na identificação de formações ecológicas. Silva, Bruno Daleffi da Acoustic ecology Aprendizado computacional Biodiversity Cerrado Cerrado Convolutional neural network (CNN) Ecologia acústica Environmental preservation Gradient boosting Inteligência artificial Machine learning Paisagem sonora Random forest Soundscapes |
| title_short |
Ecologia Acústica e Ciência de Dados: uma análise da paisagem sonora do cerrado Aplicabilidade e desempenho de modelos de aprendizado de máquina na identificação de formações ecológicas. |
| title_full |
Ecologia Acústica e Ciência de Dados: uma análise da paisagem sonora do cerrado Aplicabilidade e desempenho de modelos de aprendizado de máquina na identificação de formações ecológicas. |
| title_fullStr |
Ecologia Acústica e Ciência de Dados: uma análise da paisagem sonora do cerrado Aplicabilidade e desempenho de modelos de aprendizado de máquina na identificação de formações ecológicas. |
| title_full_unstemmed |
Ecologia Acústica e Ciência de Dados: uma análise da paisagem sonora do cerrado Aplicabilidade e desempenho de modelos de aprendizado de máquina na identificação de formações ecológicas. |
| title_sort |
Ecologia Acústica e Ciência de Dados: uma análise da paisagem sonora do cerrado Aplicabilidade e desempenho de modelos de aprendizado de máquina na identificação de formações ecológicas. |
| author |
Silva, Bruno Daleffi da |
| author_facet |
Silva, Bruno Daleffi da |
| author_role |
author |
| dc.contributor.none.fl_str_mv |
Padovese, Linilson Rodrigues |
| dc.contributor.author.fl_str_mv |
Silva, Bruno Daleffi da |
| dc.subject.por.fl_str_mv |
Acoustic ecology Aprendizado computacional Biodiversity Cerrado Cerrado Convolutional neural network (CNN) Ecologia acústica Environmental preservation Gradient boosting Inteligência artificial Machine learning Paisagem sonora Random forest Soundscapes |
| topic |
Acoustic ecology Aprendizado computacional Biodiversity Cerrado Cerrado Convolutional neural network (CNN) Ecologia acústica Environmental preservation Gradient boosting Inteligência artificial Machine learning Paisagem sonora Random forest Soundscapes |
| description |
O Cerrado é um bioma brasileiro de grande importância ecológica, ocupando cerca de 2 milhões de quilômetros quadrados, o que corresponde a quase um quarto do território nacional. Este bioma possui papel relevante na manutenção da vida e do clima, concentrando cerca de 5% de todas as espécies (fauna) do planeta e formando o sistema hidrológico do Pantanal, um dos maiores complexos de água doce do mundo. Entretanto, o Cerrado enfrenta desafios devido ao avanço das atividades agropecuárias e ao aumento dos desastres ambientais, em decorrência das mudanças climáticas. Visando auxiliar os trabalhos de preservação e recuperação do bioma, este estudo explorou diferentes metodologias de Ciência de Dados para identificar a formação natural do Cerrado (Florestal, Savânica e Campestre) através da paisagem sonora do ambiente. Foram desenvolvidos cinco modelos estatísticos, utilizando coeficientes cepstrais de frequência mel (MFCCs) como variáveis independentes para os modelos de Gradient Boosting, Random Forest, Regressão Logística e Multilayer Perceptron, e imagens dos espectrogramas para a Rede Neural Convolucional (CNN). A análise dos resultados revelou que a CNN apresentou o melhor desempenho em todas as métricas avaliadas. Entretanto, a escolha do modelo mais adequado deve levar em consideração não apenas a performance, mas também a simplicidade do método, o tempo de resposta da predição e a capacidade de lidar com um grande número de observações em um curto período de tempo. Neste contexto, modelos mais simples, como Gradient Boosting ou Random Forest, podem ser mais apropriados em alguns casos. A aplicação da técnica de explicabilidade LIME auxiliou na compreensão dos processos de decisão do modelo de CNN, fornecendo insights sobre como melhorar sua performance e aplicação em estudos futuros de preservação e recuperação do bioma Cerrado. A análise das frequências relevantes para cada formação do Cerrado demonstrou o potencial dessa técnica na identificação das características do espectrograma responsáveis pela classificação das paisagens acústicas. Este estudo demonstra que a combinação de Ecologia Acústica e Ciência de Dados pode ser eficiente na classificação de paisagens acústicas e na identificação do tipo de formação do Cerrado. As conclusões deste trabalho podem servir como base para futuras pesquisas na área de Ecologia Acústica e na aplicação de técnicas de aprendizado de máquina em estudos ambientais, contribuindo para a preservação da biodiversidade e a recuperação de biomas ameaçados, como o Cerrado. Além disso, fornece insumos metodológicos para outras pesquisas acerca do uso da Inteligência Artificial/Machine Learning na identificação e classificação de sinais em geral. |
| publishDate |
2024 |
| dc.date.none.fl_str_mv |
2024-03-08 |
| dc.type.status.fl_str_mv |
info:eu-repo/semantics/publishedVersion |
| dc.type.driver.fl_str_mv |
info:eu-repo/semantics/masterThesis |
| format |
masterThesis |
| status_str |
publishedVersion |
| dc.identifier.uri.fl_str_mv |
https://www.teses.usp.br/teses/disponiveis/3/3152/tde-19072024-094959/ |
| url |
https://www.teses.usp.br/teses/disponiveis/3/3152/tde-19072024-094959/ |
| dc.language.iso.fl_str_mv |
por |
| language |
por |
| dc.relation.none.fl_str_mv |
|
| dc.rights.driver.fl_str_mv |
Liberar o conteúdo para acesso público. info:eu-repo/semantics/openAccess |
| rights_invalid_str_mv |
Liberar o conteúdo para acesso público. |
| eu_rights_str_mv |
openAccess |
| dc.format.none.fl_str_mv |
application/pdf |
| dc.coverage.none.fl_str_mv |
|
| dc.publisher.none.fl_str_mv |
Biblioteca Digitais de Teses e Dissertações da USP |
| publisher.none.fl_str_mv |
Biblioteca Digitais de Teses e Dissertações da USP |
| dc.source.none.fl_str_mv |
reponame:Biblioteca Digital de Teses e Dissertações da USP instname:Universidade de São Paulo (USP) instacron:USP |
| instname_str |
Universidade de São Paulo (USP) |
| instacron_str |
USP |
| institution |
USP |
| reponame_str |
Biblioteca Digital de Teses e Dissertações da USP |
| collection |
Biblioteca Digital de Teses e Dissertações da USP |
| repository.name.fl_str_mv |
Biblioteca Digital de Teses e Dissertações da USP - Universidade de São Paulo (USP) |
| repository.mail.fl_str_mv |
virginia@if.usp.br|| atendimento@aguia.usp.br||virginia@if.usp.br |
| _version_ |
1865492500482883584 |