Analysis of the impacts of label dependence in multi-label learning
| Ano de defesa: | 2021 |
|---|---|
| Autor(a) principal: | |
| Orientador(a): | |
| Banca de defesa: | |
| Tipo de documento: | Tese |
| Tipo de acesso: | Acesso aberto |
| Idioma: | por |
| Instituição de defesa: |
Universidade Federal do Espírito Santo
BR Doutorado em Ciência da Computação Centro Tecnológico UFES Programa de Pós-Graduação em Informática |
| Programa de Pós-Graduação: |
Não Informado pela instituição
|
| Departamento: |
Não Informado pela instituição
|
| País: |
Não Informado pela instituição
|
| Palavras-chave em Português: | |
| Link de acesso: | http://repositorio.ufes.br/handle/10/15475 |
Resumo: | Conclusions in the field of multi-label learning are often drawn from experiments using real benchmark datasets, which is a good practice for comparing results. However, it hardly proves or clearly shows how dependencies among class labels impact on the performance and behaviour of multi-label algorithms. A reasonable approach to tackle this issue consists of adopting a mathematical or statistical formulation of the problem and using it to elaborate theoretical proofs. Another approach consists of elaborating experiments in a well-controlled environment where the dependence among labels can be easier controlled and analyzed, which is the case for many works based on artificial datasets. Both approaches are adopted in this thesis to understand the role of label dependence in multi-label learning. The work done in this thesis is composed of several contributions regarding the analysis of multi-label algorithms from a statistical perspective. One contribution is that calibrated label ranking is an algorithm that can perform extremely poor in particular scenarios where label dependence is present, due to the way that pairwise comparison of labels is done by the algorithm. Another contribution is that the label dependence present in multi-label learning makes the optimization of the expected coverage a NP-hard problem, even at restricted conditions. Finally, a proposal is presented on how to build an experimental environment where the label dependence can conveniently be controlled for comparing performance among multi-label learning algorithms. |
| id |
UFES_2d2ab234ee7b671444f10f3f63589f16 |
|---|---|
| oai_identifier_str |
oai:repositorio.ufes.br:10/15475 |
| network_acronym_str |
UFES |
| network_name_str |
Repositório Institucional da Universidade Federal do Espírito Santo (riUfes) |
| repository_id_str |
|
| spelling |
Analysis of the impacts of label dependence in multi-label learningtitle.alternativeAlgoritmos multirrótulocalibrated label rankingsubject.br-rjbnCiência da ComputaçãoConclusions in the field of multi-label learning are often drawn from experiments using real benchmark datasets, which is a good practice for comparing results. However, it hardly proves or clearly shows how dependencies among class labels impact on the performance and behaviour of multi-label algorithms. A reasonable approach to tackle this issue consists of adopting a mathematical or statistical formulation of the problem and using it to elaborate theoretical proofs. Another approach consists of elaborating experiments in a well-controlled environment where the dependence among labels can be easier controlled and analyzed, which is the case for many works based on artificial datasets. Both approaches are adopted in this thesis to understand the role of label dependence in multi-label learning. The work done in this thesis is composed of several contributions regarding the analysis of multi-label algorithms from a statistical perspective. One contribution is that calibrated label ranking is an algorithm that can perform extremely poor in particular scenarios where label dependence is present, due to the way that pairwise comparison of labels is done by the algorithm. Another contribution is that the label dependence present in multi-label learning makes the optimization of the expected coverage a NP-hard problem, even at restricted conditions. Finally, a proposal is presented on how to build an experimental environment where the label dependence can conveniently be controlled for comparing performance among multi-label learning algorithms.Conclusões em aprendizado multirrótulo geralmente são tiradas através de experimentos usando conjuntos de dados reais de referência, o que é uma boa prática ao comparar resultados. No entanto, dificilmente demonstra ou mostra claramente como a dependência entre rótulos afeta o desempenho e o comportamento de algoritmos multirrótulo. Uma abordagem razoável para resolver tal problema consiste em adotar uma formulação matemática ou estatística do problema e usá-lo para elaborar provas teóricas. Outra abordagem consiste em elaborar experimentos em um ambiente controlado, onde a dependência entre rótulos pode ser mais facilmente controlada e analisada, o que é o caso de muitos trabalhos baseados em conjuntos de dados artificiais. Ambas abordagens são adotadas nesta tese para entender o papel da dependência de rótulos na aprendizagem multirrótulo. O trabalho realizado nesta tese é composto de várias contribuições à análise de algoritmos multirrótulo em uma perspectiva estatística. Uma contribuição é que o método calibrated label ranking é um algoritmo que pode ter um desempenho extremamente baixo quando empregado em um cenário muito particular em que a dependência entre rótulos está presente, devido à maneira como a comparação em pares de rótulos é feita pelo algoritmo. Outra contribuição é que a dependência entre rótulos a otimização de coverage esperado é um problema NP-difícil. Por final, é apresentada uma forma de criar um ambiente experimental em que a dependência entre rótulos possa ser convenientemente controlada com o objetivo de comparar o desempenho entre os métodos de aprendizado multirrótulo.Universidade Federal do Espírito SantoBRDoutorado em Ciência da ComputaçãoCentro TecnológicoUFESPrograma de Pós-Graduação em InformáticaVarejão, Flavio Miguelhttps://orcid.org/0000-0002-5444-1974http://lattes.cnpq.br/6501574961643171https://orcid.org/0000-0003-3601-8782http://lattes.cnpq.br/1436724861273417Haeusler, Edward Hermannhttps://orcid.org/0000-0002-4999-7476http://lattes.cnpq.br/6075905438020841Boldt, Francisco de Assishttps://orcid.org/0000-0001-6919-5377http://lattes.cnpq.br/0385991152092556Santos, Thiago Oliveira doshttps://orcid.org/0000-0001-7607-635Xhttp://lattes.cnpq.br/5117339495064254Rodrigues, Alexandre Loureiroshttps://orcid.org/0000-0002-7619-2681Rauber, Thomas Walterhttps://orcid.org/0000000263806584http://lattes.cnpq.br/0462549482032704Mello, Lucas Henrique Sousa2024-05-30T00:50:44Z2024-05-30T00:50:44Z2021-10-19info:eu-repo/semantics/publishedVersioninfo:eu-repo/semantics/doctoralThesisTextapplication/pdfhttp://repositorio.ufes.br/handle/10/15475porinfo:eu-repo/semantics/openAccessreponame:Repositório Institucional da Universidade Federal do Espírito Santo (riUfes)instname:Universidade Federal do Espírito Santo (UFES)instacron:UFES2024-11-29T11:27:16Zoai:repositorio.ufes.br:10/15475Repositório InstitucionalPUBhttp://repositorio.ufes.br/oai/requestriufes@ufes.bropendoar:21082024-11-29T11:27:16Repositório Institucional da Universidade Federal do Espírito Santo (riUfes) - Universidade Federal do Espírito Santo (UFES)false |
| dc.title.none.fl_str_mv |
Analysis of the impacts of label dependence in multi-label learning title.alternative |
| title |
Analysis of the impacts of label dependence in multi-label learning |
| spellingShingle |
Analysis of the impacts of label dependence in multi-label learning Mello, Lucas Henrique Sousa Algoritmos multirrótulo calibrated label ranking subject.br-rjbn Ciência da Computação |
| title_short |
Analysis of the impacts of label dependence in multi-label learning |
| title_full |
Analysis of the impacts of label dependence in multi-label learning |
| title_fullStr |
Analysis of the impacts of label dependence in multi-label learning |
| title_full_unstemmed |
Analysis of the impacts of label dependence in multi-label learning |
| title_sort |
Analysis of the impacts of label dependence in multi-label learning |
| author |
Mello, Lucas Henrique Sousa |
| author_facet |
Mello, Lucas Henrique Sousa |
| author_role |
author |
| dc.contributor.none.fl_str_mv |
Varejão, Flavio Miguel https://orcid.org/0000-0002-5444-1974 http://lattes.cnpq.br/6501574961643171 https://orcid.org/0000-0003-3601-8782 http://lattes.cnpq.br/1436724861273417 Haeusler, Edward Hermann https://orcid.org/0000-0002-4999-7476 http://lattes.cnpq.br/6075905438020841 Boldt, Francisco de Assis https://orcid.org/0000-0001-6919-5377 http://lattes.cnpq.br/0385991152092556 Santos, Thiago Oliveira dos https://orcid.org/0000-0001-7607-635X http://lattes.cnpq.br/5117339495064254 Rodrigues, Alexandre Loureiros https://orcid.org/0000-0002-7619-2681 Rauber, Thomas Walter https://orcid.org/0000000263806584 http://lattes.cnpq.br/0462549482032704 |
| dc.contributor.author.fl_str_mv |
Mello, Lucas Henrique Sousa |
| dc.subject.por.fl_str_mv |
Algoritmos multirrótulo calibrated label ranking subject.br-rjbn Ciência da Computação |
| topic |
Algoritmos multirrótulo calibrated label ranking subject.br-rjbn Ciência da Computação |
| description |
Conclusions in the field of multi-label learning are often drawn from experiments using real benchmark datasets, which is a good practice for comparing results. However, it hardly proves or clearly shows how dependencies among class labels impact on the performance and behaviour of multi-label algorithms. A reasonable approach to tackle this issue consists of adopting a mathematical or statistical formulation of the problem and using it to elaborate theoretical proofs. Another approach consists of elaborating experiments in a well-controlled environment where the dependence among labels can be easier controlled and analyzed, which is the case for many works based on artificial datasets. Both approaches are adopted in this thesis to understand the role of label dependence in multi-label learning. The work done in this thesis is composed of several contributions regarding the analysis of multi-label algorithms from a statistical perspective. One contribution is that calibrated label ranking is an algorithm that can perform extremely poor in particular scenarios where label dependence is present, due to the way that pairwise comparison of labels is done by the algorithm. Another contribution is that the label dependence present in multi-label learning makes the optimization of the expected coverage a NP-hard problem, even at restricted conditions. Finally, a proposal is presented on how to build an experimental environment where the label dependence can conveniently be controlled for comparing performance among multi-label learning algorithms. |
| publishDate |
2021 |
| dc.date.none.fl_str_mv |
2021-10-19 2024-05-30T00:50:44Z 2024-05-30T00:50:44Z |
| dc.type.status.fl_str_mv |
info:eu-repo/semantics/publishedVersion |
| dc.type.driver.fl_str_mv |
info:eu-repo/semantics/doctoralThesis |
| format |
doctoralThesis |
| status_str |
publishedVersion |
| dc.identifier.uri.fl_str_mv |
http://repositorio.ufes.br/handle/10/15475 |
| url |
http://repositorio.ufes.br/handle/10/15475 |
| dc.language.iso.fl_str_mv |
por |
| language |
por |
| dc.rights.driver.fl_str_mv |
info:eu-repo/semantics/openAccess |
| eu_rights_str_mv |
openAccess |
| dc.format.none.fl_str_mv |
Text application/pdf |
| dc.publisher.none.fl_str_mv |
Universidade Federal do Espírito Santo BR Doutorado em Ciência da Computação Centro Tecnológico UFES Programa de Pós-Graduação em Informática |
| publisher.none.fl_str_mv |
Universidade Federal do Espírito Santo BR Doutorado em Ciência da Computação Centro Tecnológico UFES Programa de Pós-Graduação em Informática |
| dc.source.none.fl_str_mv |
reponame:Repositório Institucional da Universidade Federal do Espírito Santo (riUfes) instname:Universidade Federal do Espírito Santo (UFES) instacron:UFES |
| instname_str |
Universidade Federal do Espírito Santo (UFES) |
| instacron_str |
UFES |
| institution |
UFES |
| reponame_str |
Repositório Institucional da Universidade Federal do Espírito Santo (riUfes) |
| collection |
Repositório Institucional da Universidade Federal do Espírito Santo (riUfes) |
| repository.name.fl_str_mv |
Repositório Institucional da Universidade Federal do Espírito Santo (riUfes) - Universidade Federal do Espírito Santo (UFES) |
| repository.mail.fl_str_mv |
riufes@ufes.br |
| _version_ |
1834479071025692672 |