Visual active learnig para rotulagem por características discriminantes em paisagens acústicas
| Ano de defesa: | 2020 |
|---|---|
| Autor(a) principal: | |
| Orientador(a): | |
| Banca de defesa: | |
| Tipo de documento: | Dissertação |
| Tipo de acesso: | Acesso aberto |
| Idioma: | por |
| Instituição de defesa: |
Biblioteca Digitais de Teses e Dissertações da USP
|
| Programa de Pós-Graduação: |
Não Informado pela instituição
|
| Departamento: |
Não Informado pela instituição
|
| País: |
Não Informado pela instituição
|
| Palavras-chave em Português: | |
| Link de acesso: | https://www.teses.usp.br/teses/disponiveis/55/55134/tde-21082020-135049/ |
Resumo: | Para a análise de Paisagens Acústicas os especialistas precisam conhecer os eventos em um determinado ambiente. Uma das formas de se adquirir esse conhecimento é através do som, isto é, de paisagens acústicas. Atualmente a tecnologia facilita as gravações de ambientes distintos, produzindo centenas de milhares de gravações de áudio todos os anos. Mas, a capacidade de análise desses sinais coletados continuamente é reduzida, sugerindo a necessidade de se automatizar esse processo, sendo necessário utilizar técnicas computacionais que auxiliem a rotulação, a exploração, a análise e o entendimento desses dados. Neste trabalho, é apresentada uma metodologia baseada em conceitos de ciência de dados, aprendizado máquina e visualização de informação, para identificar e validar um conjunto de caraterísticas mais discriminantes num ambiente de aprendizado ativo, de modo que se consiga segregar categorias de eventos de interesse em paisagens acústicas, isto é, grupos de eventos similares. Na primeira parte do trabalho foram identificadas e validadas características mais discriminantes, para isto, formulouse uma estrategia de ranking de importância de caraterísticas, no qual por meio da combinação das n primeiras caraterísticas do ranking permitiu determinar as caraterísticas mais discriminantes. Na segunda parte do trabalho foram validadas as caraterísticas discriminantes em um ambiente de aprendizado visual ativo, que incorpora a utilização de técnicas de projeção como t-SNE e UMAP para visualizar e analisar a segregação entre categorias de eventos da paisagem analisada. Além disso, a visualização de espectrogramas denominada Time-Line-Spectrogram foi incorporada para auxiliar as tarefas de rotulação do usuário no aprendizado ativo. Os resultados confirmam a efetividade das características para segregar categorias de eventos acústicos, no conjunto de dados real denominado Cantareira-Mantiqueira que trata de 3 categorias de eventos: anuros, pássaros e insetos. Na identificação de caraterísticas discriminantes os resultados de acurácia de classificação foram: 89:91% (com 30 caraterísticas para anuros, pássaros e insetos), 82:64% (com 30 caraterísticas para anuros e pássaros), 100:00% (com 46 caraterísticas para anuros e insetos) e 99:40% (com 14 caraterísticas para pássaros e insetos). Para a rotulagem de eventos sonoros com a metodologia visual de aprendizado ativo proposta, os resultados de acurácia atingidos utilizando as caraterísticas discriminantes e uma determinada configuração de parâmetros foram: 75:53% (para anuros, pássaros e insetos), 71:85% (para anuros e pássaros), 90:57% (para anuros e insetos) e 93:99% (para pássaros e insetos). |
| id |
USP_40c446d6565da93ec874045271961718 |
|---|---|
| oai_identifier_str |
oai:teses.usp.br:tde-21082020-135049 |
| network_acronym_str |
USP |
| network_name_str |
Biblioteca Digital de Teses e Dissertações da USP |
| repository_id_str |
|
| spelling |
Visual active learnig para rotulagem por características discriminantes em paisagens acústicasVisual active learning for labeling in soundscape bydiscriminating featuresActive LearningAprendizado AtivoCaracterísticas DiscriminantesDiscriminant FeaturesLabeling DataPaisagem AcústicaRotulagem de DadosSoundscapeVisualizaçãoVisualizationPara a análise de Paisagens Acústicas os especialistas precisam conhecer os eventos em um determinado ambiente. Uma das formas de se adquirir esse conhecimento é através do som, isto é, de paisagens acústicas. Atualmente a tecnologia facilita as gravações de ambientes distintos, produzindo centenas de milhares de gravações de áudio todos os anos. Mas, a capacidade de análise desses sinais coletados continuamente é reduzida, sugerindo a necessidade de se automatizar esse processo, sendo necessário utilizar técnicas computacionais que auxiliem a rotulação, a exploração, a análise e o entendimento desses dados. Neste trabalho, é apresentada uma metodologia baseada em conceitos de ciência de dados, aprendizado máquina e visualização de informação, para identificar e validar um conjunto de caraterísticas mais discriminantes num ambiente de aprendizado ativo, de modo que se consiga segregar categorias de eventos de interesse em paisagens acústicas, isto é, grupos de eventos similares. Na primeira parte do trabalho foram identificadas e validadas características mais discriminantes, para isto, formulouse uma estrategia de ranking de importância de caraterísticas, no qual por meio da combinação das n primeiras caraterísticas do ranking permitiu determinar as caraterísticas mais discriminantes. Na segunda parte do trabalho foram validadas as caraterísticas discriminantes em um ambiente de aprendizado visual ativo, que incorpora a utilização de técnicas de projeção como t-SNE e UMAP para visualizar e analisar a segregação entre categorias de eventos da paisagem analisada. Além disso, a visualização de espectrogramas denominada Time-Line-Spectrogram foi incorporada para auxiliar as tarefas de rotulação do usuário no aprendizado ativo. Os resultados confirmam a efetividade das características para segregar categorias de eventos acústicos, no conjunto de dados real denominado Cantareira-Mantiqueira que trata de 3 categorias de eventos: anuros, pássaros e insetos. Na identificação de caraterísticas discriminantes os resultados de acurácia de classificação foram: 89:91% (com 30 caraterísticas para anuros, pássaros e insetos), 82:64% (com 30 caraterísticas para anuros e pássaros), 100:00% (com 46 caraterísticas para anuros e insetos) e 99:40% (com 14 caraterísticas para pássaros e insetos). Para a rotulagem de eventos sonoros com a metodologia visual de aprendizado ativo proposta, os resultados de acurácia atingidos utilizando as caraterísticas discriminantes e uma determinada configuração de parâmetros foram: 75:53% (para anuros, pássaros e insetos), 71:85% (para anuros e pássaros), 90:57% (para anuros e insetos) e 93:99% (para pássaros e insetos).For the analysis of soundscapes, experts need to know the events in a given environment. One way to acquire this knowledge is through sound, that is, acoustic landscapes. Todays technology makes it easy to record in different environments, producing hundreds of thousands of audio recordings every year. However, the ability to analyze continuously collected signals is reduced, suggesting the need to automate process, it is necessary to use computational techniques that aid in the labeling, exploration, analysis and understanding of these data. In this work, a methodology based on data science, machine learning and information visualization concepts is presented to identify and validate a set of most discriminant features in an active learning environment so that interest categories of events can be segregated in soundscapes, that is, segregated groups of similar events. In the first part of the work, the most discriminant features were identified and validated. For this, a ranking strategy of the importance of features was formulated, combining the first n ranking features it was possible to determine the most discriminant features. The second part of the work validated the discriminant features of an active visual learning environment that incorporates the use of projection techniques such as t-SNE and UMAP to visualize and analyze the segregation between event categories of the analyzed landscape. In addition, a spectrogram visualization strategy called Time-Line-Spectrogram has been incorporated to assist the users labeling tasks in active learning. The results confirm the effectiveness of the features to segregate acoustic event categories in the real data set named Cantareira-Mantiqueira, which deals with 3 event categories: anurans, birds and insects. In identifying discriminant features the accuracy results (10% test) were: 89:91% (with 30 features for anurans, birds and insects), 89:91% (with 30 features for anurans and birds), 100:00% (with 46 features for anurans and insects) and 99:40% (with 14 features for birds and insects). For the labeling of sound events with proposed visual active learning methodology, the accuracy results achieved using the discriminant characteristics and a certain parameters setting were: 75:53% (for frogs, birds and insects), 71:85% (for anurans and birds), 90:57% (for anurans and insects) and 93:99% (for birds and insects).Biblioteca Digitais de Teses e Dissertações da USPMinghim, RosaneHilasaca, Liz Maribel Huancapaza2020-07-09info:eu-repo/semantics/publishedVersioninfo:eu-repo/semantics/masterThesisapplication/pdfhttps://www.teses.usp.br/teses/disponiveis/55/55134/tde-21082020-135049/reponame:Biblioteca Digital de Teses e Dissertações da USPinstname:Universidade de São Paulo (USP)instacron:USPLiberar o conteúdo para acesso público.info:eu-repo/semantics/openAccesspor2020-09-23T21:27:51Zoai:teses.usp.br:tde-21082020-135049Biblioteca Digital de Teses e Dissertaçõeshttp://www.teses.usp.br/PUBhttp://www.teses.usp.br/cgi-bin/mtd2br.plvirginia@if.usp.br|| atendimento@aguia.usp.br||virginia@if.usp.bropendoar:27212020-09-23T21:27:51Biblioteca Digital de Teses e Dissertações da USP - Universidade de São Paulo (USP)false |
| dc.title.none.fl_str_mv |
Visual active learnig para rotulagem por características discriminantes em paisagens acústicas Visual active learning for labeling in soundscape bydiscriminating features |
| title |
Visual active learnig para rotulagem por características discriminantes em paisagens acústicas |
| spellingShingle |
Visual active learnig para rotulagem por características discriminantes em paisagens acústicas Hilasaca, Liz Maribel Huancapaza Active Learning Aprendizado Ativo Características Discriminantes Discriminant Features Labeling Data Paisagem Acústica Rotulagem de Dados Soundscape Visualização Visualization |
| title_short |
Visual active learnig para rotulagem por características discriminantes em paisagens acústicas |
| title_full |
Visual active learnig para rotulagem por características discriminantes em paisagens acústicas |
| title_fullStr |
Visual active learnig para rotulagem por características discriminantes em paisagens acústicas |
| title_full_unstemmed |
Visual active learnig para rotulagem por características discriminantes em paisagens acústicas |
| title_sort |
Visual active learnig para rotulagem por características discriminantes em paisagens acústicas |
| author |
Hilasaca, Liz Maribel Huancapaza |
| author_facet |
Hilasaca, Liz Maribel Huancapaza |
| author_role |
author |
| dc.contributor.none.fl_str_mv |
Minghim, Rosane |
| dc.contributor.author.fl_str_mv |
Hilasaca, Liz Maribel Huancapaza |
| dc.subject.por.fl_str_mv |
Active Learning Aprendizado Ativo Características Discriminantes Discriminant Features Labeling Data Paisagem Acústica Rotulagem de Dados Soundscape Visualização Visualization |
| topic |
Active Learning Aprendizado Ativo Características Discriminantes Discriminant Features Labeling Data Paisagem Acústica Rotulagem de Dados Soundscape Visualização Visualization |
| description |
Para a análise de Paisagens Acústicas os especialistas precisam conhecer os eventos em um determinado ambiente. Uma das formas de se adquirir esse conhecimento é através do som, isto é, de paisagens acústicas. Atualmente a tecnologia facilita as gravações de ambientes distintos, produzindo centenas de milhares de gravações de áudio todos os anos. Mas, a capacidade de análise desses sinais coletados continuamente é reduzida, sugerindo a necessidade de se automatizar esse processo, sendo necessário utilizar técnicas computacionais que auxiliem a rotulação, a exploração, a análise e o entendimento desses dados. Neste trabalho, é apresentada uma metodologia baseada em conceitos de ciência de dados, aprendizado máquina e visualização de informação, para identificar e validar um conjunto de caraterísticas mais discriminantes num ambiente de aprendizado ativo, de modo que se consiga segregar categorias de eventos de interesse em paisagens acústicas, isto é, grupos de eventos similares. Na primeira parte do trabalho foram identificadas e validadas características mais discriminantes, para isto, formulouse uma estrategia de ranking de importância de caraterísticas, no qual por meio da combinação das n primeiras caraterísticas do ranking permitiu determinar as caraterísticas mais discriminantes. Na segunda parte do trabalho foram validadas as caraterísticas discriminantes em um ambiente de aprendizado visual ativo, que incorpora a utilização de técnicas de projeção como t-SNE e UMAP para visualizar e analisar a segregação entre categorias de eventos da paisagem analisada. Além disso, a visualização de espectrogramas denominada Time-Line-Spectrogram foi incorporada para auxiliar as tarefas de rotulação do usuário no aprendizado ativo. Os resultados confirmam a efetividade das características para segregar categorias de eventos acústicos, no conjunto de dados real denominado Cantareira-Mantiqueira que trata de 3 categorias de eventos: anuros, pássaros e insetos. Na identificação de caraterísticas discriminantes os resultados de acurácia de classificação foram: 89:91% (com 30 caraterísticas para anuros, pássaros e insetos), 82:64% (com 30 caraterísticas para anuros e pássaros), 100:00% (com 46 caraterísticas para anuros e insetos) e 99:40% (com 14 caraterísticas para pássaros e insetos). Para a rotulagem de eventos sonoros com a metodologia visual de aprendizado ativo proposta, os resultados de acurácia atingidos utilizando as caraterísticas discriminantes e uma determinada configuração de parâmetros foram: 75:53% (para anuros, pássaros e insetos), 71:85% (para anuros e pássaros), 90:57% (para anuros e insetos) e 93:99% (para pássaros e insetos). |
| publishDate |
2020 |
| dc.date.none.fl_str_mv |
2020-07-09 |
| dc.type.status.fl_str_mv |
info:eu-repo/semantics/publishedVersion |
| dc.type.driver.fl_str_mv |
info:eu-repo/semantics/masterThesis |
| format |
masterThesis |
| status_str |
publishedVersion |
| dc.identifier.uri.fl_str_mv |
https://www.teses.usp.br/teses/disponiveis/55/55134/tde-21082020-135049/ |
| url |
https://www.teses.usp.br/teses/disponiveis/55/55134/tde-21082020-135049/ |
| dc.language.iso.fl_str_mv |
por |
| language |
por |
| dc.relation.none.fl_str_mv |
|
| dc.rights.driver.fl_str_mv |
Liberar o conteúdo para acesso público. info:eu-repo/semantics/openAccess |
| rights_invalid_str_mv |
Liberar o conteúdo para acesso público. |
| eu_rights_str_mv |
openAccess |
| dc.format.none.fl_str_mv |
application/pdf |
| dc.coverage.none.fl_str_mv |
|
| dc.publisher.none.fl_str_mv |
Biblioteca Digitais de Teses e Dissertações da USP |
| publisher.none.fl_str_mv |
Biblioteca Digitais de Teses e Dissertações da USP |
| dc.source.none.fl_str_mv |
reponame:Biblioteca Digital de Teses e Dissertações da USP instname:Universidade de São Paulo (USP) instacron:USP |
| instname_str |
Universidade de São Paulo (USP) |
| instacron_str |
USP |
| institution |
USP |
| reponame_str |
Biblioteca Digital de Teses e Dissertações da USP |
| collection |
Biblioteca Digital de Teses e Dissertações da USP |
| repository.name.fl_str_mv |
Biblioteca Digital de Teses e Dissertações da USP - Universidade de São Paulo (USP) |
| repository.mail.fl_str_mv |
virginia@if.usp.br|| atendimento@aguia.usp.br||virginia@if.usp.br |
| _version_ |
1815258366824415232 |