Analysis of the impacts of label dependence in multi-label learning
bibo.pageEnd | 111 | |
dc.contributor.advisor1 | Varejão, Flavio Miguel | |
dc.contributor.advisor1ID | https://orcid.org/0000-0002-5444-1974 | |
dc.contributor.advisor1Lattes | http://lattes.cnpq.br/6501574961643171 | |
dc.contributor.author | Mello, Lucas Henrique Sousa | |
dc.contributor.authorID | https://orcid.org/0000-0003-3601-8782 | |
dc.contributor.authorLattes | http://lattes.cnpq.br/1436724861273417 | |
dc.contributor.referee1 | Haeusler, Edward Hermann | |
dc.contributor.referee1ID | https://orcid.org/0000-0002-4999-7476 | |
dc.contributor.referee1Lattes | http://lattes.cnpq.br/6075905438020841 | |
dc.contributor.referee2 | Boldt, Francisco de Assis | |
dc.contributor.referee2ID | https://orcid.org/0000-0001-6919-5377 | |
dc.contributor.referee2Lattes | http://lattes.cnpq.br/0385991152092556 | |
dc.contributor.referee3 | Santos, Thiago Oliveira dos | |
dc.contributor.referee3ID | https://orcid.org/0000-0001-7607-635X | |
dc.contributor.referee3Lattes | http://lattes.cnpq.br/5117339495064254 | |
dc.contributor.referee4 | Rodrigues, Alexandre Loureiros | |
dc.contributor.referee4ID | https://orcid.org/0000-0002-7619-2681 | |
dc.contributor.referee5 | Rauber, Thomas Walter | |
dc.contributor.referee5ID | https://orcid.org/0000000263806584 | |
dc.contributor.referee5Lattes | http://lattes.cnpq.br/0462549482032704 | |
dc.date.accessioned | 2024-05-30T00:50:44Z | |
dc.date.available | 2024-05-30T00:50:44Z | |
dc.date.issued | 2021-10-19 | |
dc.description.abstract | Conclusions in the field of multi-label learning are often drawn from experiments using real benchmark datasets, which is a good practice for comparing results. However, it hardly proves or clearly shows how dependencies among class labels impact on the performance and behaviour of multi-label algorithms. A reasonable approach to tackle this issue consists of adopting a mathematical or statistical formulation of the problem and using it to elaborate theoretical proofs. Another approach consists of elaborating experiments in a well-controlled environment where the dependence among labels can be easier controlled and analyzed, which is the case for many works based on artificial datasets. Both approaches are adopted in this thesis to understand the role of label dependence in multi-label learning. The work done in this thesis is composed of several contributions regarding the analysis of multi-label algorithms from a statistical perspective. One contribution is that calibrated label ranking is an algorithm that can perform extremely poor in particular scenarios where label dependence is present, due to the way that pairwise comparison of labels is done by the algorithm. Another contribution is that the label dependence present in multi-label learning makes the optimization of the expected coverage a NP-hard problem, even at restricted conditions. Finally, a proposal is presented on how to build an experimental environment where the label dependence can conveniently be controlled for comparing performance among multi-label learning algorithms. | |
dc.description.resumo | Conclusões em aprendizado multirrótulo geralmente são tiradas através de experimentos usando conjuntos de dados reais de referência, o que é uma boa prática ao comparar resultados. No entanto, dificilmente demonstra ou mostra claramente como a dependência entre rótulos afeta o desempenho e o comportamento de algoritmos multirrótulo. Uma abordagem razoável para resolver tal problema consiste em adotar uma formulação matemática ou estatística do problema e usá-lo para elaborar provas teóricas. Outra abordagem consiste em elaborar experimentos em um ambiente controlado, onde a dependência entre rótulos pode ser mais facilmente controlada e analisada, o que é o caso de muitos trabalhos baseados em conjuntos de dados artificiais. Ambas abordagens são adotadas nesta tese para entender o papel da dependência de rótulos na aprendizagem multirrótulo. O trabalho realizado nesta tese é composto de várias contribuições à análise de algoritmos multirrótulo em uma perspectiva estatística. Uma contribuição é que o método calibrated label ranking é um algoritmo que pode ter um desempenho extremamente baixo quando empregado em um cenário muito particular em que a dependência entre rótulos está presente, devido à maneira como a comparação em pares de rótulos é feita pelo algoritmo. Outra contribuição é que a dependência entre rótulos a otimização de coverage esperado é um problema NP-difícil. Por final, é apresentada uma forma de criar um ambiente experimental em que a dependência entre rótulos possa ser convenientemente controlada com o objetivo de comparar o desempenho entre os métodos de aprendizado multirrótulo. | |
dc.format | Text | |
dc.identifier.uri | http://repositorio.ufes.br/handle/10/15475 | |
dc.language | por | |
dc.publisher | Universidade Federal do Espírito Santo | |
dc.publisher.country | BR | |
dc.publisher.course | Doutorado em Ciência da Computação | |
dc.publisher.department | Centro Tecnológico | |
dc.publisher.initials | UFES | |
dc.publisher.program | Programa de Pós-Graduação em Informática | |
dc.rights | open access | |
dc.subject | Algoritmos multirrótulo | |
dc.subject | calibrated label ranking | |
dc.subject.br-rjbn | subject.br-rjbn | |
dc.subject.cnpq | Ciência da Computação | |
dc.title | Analysis of the impacts of label dependence in multi-label learning | |
dc.title.alternative | title.alternative | |
dc.type | doctoralThesis |
Arquivos
Pacote Original
1 - 1 de 1
Carregando...
- Nome:
- LucasHenriqueSousaMello-2021-tese.pdf
- Tamanho:
- 1.73 MB
- Formato:
- Adobe Portable Document Format
- Descrição: