Analysis of the impacts of label dependence in multi-label learning

bibo.pageEnd111
dc.contributor.advisor1Varejão, Flavio Miguel
dc.contributor.advisor1IDhttps://orcid.org/0000-0002-5444-1974
dc.contributor.advisor1Latteshttp://lattes.cnpq.br/6501574961643171
dc.contributor.authorMello, Lucas Henrique Sousa
dc.contributor.authorIDhttps://orcid.org/0000-0003-3601-8782
dc.contributor.authorLatteshttp://lattes.cnpq.br/1436724861273417
dc.contributor.referee1Haeusler, Edward Hermann
dc.contributor.referee1IDhttps://orcid.org/0000-0002-4999-7476
dc.contributor.referee1Latteshttp://lattes.cnpq.br/6075905438020841
dc.contributor.referee2Boldt, Francisco de Assis
dc.contributor.referee2IDhttps://orcid.org/0000-0001-6919-5377
dc.contributor.referee2Latteshttp://lattes.cnpq.br/0385991152092556
dc.contributor.referee3Santos, Thiago Oliveira dos
dc.contributor.referee3IDhttps://orcid.org/0000-0001-7607-635X
dc.contributor.referee3Latteshttp://lattes.cnpq.br/5117339495064254
dc.contributor.referee4Rodrigues, Alexandre Loureiros
dc.contributor.referee4IDhttps://orcid.org/0000-0002-7619-2681
dc.contributor.referee5Rauber, Thomas Walter
dc.contributor.referee5IDhttps://orcid.org/0000000263806584
dc.contributor.referee5Latteshttp://lattes.cnpq.br/0462549482032704
dc.date.accessioned2024-05-30T00:50:44Z
dc.date.available2024-05-30T00:50:44Z
dc.date.issued2021-10-19
dc.description.abstractConclusions in the field of multi-label learning are often drawn from experiments using real benchmark datasets, which is a good practice for comparing results. However, it hardly proves or clearly shows how dependencies among class labels impact on the performance and behaviour of multi-label algorithms. A reasonable approach to tackle this issue consists of adopting a mathematical or statistical formulation of the problem and using it to elaborate theoretical proofs. Another approach consists of elaborating experiments in a well-controlled environment where the dependence among labels can be easier controlled and analyzed, which is the case for many works based on artificial datasets. Both approaches are adopted in this thesis to understand the role of label dependence in multi-label learning. The work done in this thesis is composed of several contributions regarding the analysis of multi-label algorithms from a statistical perspective. One contribution is that calibrated label ranking is an algorithm that can perform extremely poor in particular scenarios where label dependence is present, due to the way that pairwise comparison of labels is done by the algorithm. Another contribution is that the label dependence present in multi-label learning makes the optimization of the expected coverage a NP-hard problem, even at restricted conditions. Finally, a proposal is presented on how to build an experimental environment where the label dependence can conveniently be controlled for comparing performance among multi-label learning algorithms.
dc.description.resumoConclusões em aprendizado multirrótulo geralmente são tiradas através de experimentos usando conjuntos de dados reais de referência, o que é uma boa prática ao comparar resultados. No entanto, dificilmente demonstra ou mostra claramente como a dependência entre rótulos afeta o desempenho e o comportamento de algoritmos multirrótulo. Uma abordagem razoável para resolver tal problema consiste em adotar uma formulação matemática ou estatística do problema e usá-lo para elaborar provas teóricas. Outra abordagem consiste em elaborar experimentos em um ambiente controlado, onde a dependência entre rótulos pode ser mais facilmente controlada e analisada, o que é o caso de muitos trabalhos baseados em conjuntos de dados artificiais. Ambas abordagens são adotadas nesta tese para entender o papel da dependência de rótulos na aprendizagem multirrótulo. O trabalho realizado nesta tese é composto de várias contribuições à análise de algoritmos multirrótulo em uma perspectiva estatística. Uma contribuição é que o método calibrated label ranking é um algoritmo que pode ter um desempenho extremamente baixo quando empregado em um cenário muito particular em que a dependência entre rótulos está presente, devido à maneira como a comparação em pares de rótulos é feita pelo algoritmo. Outra contribuição é que a dependência entre rótulos a otimização de coverage esperado é um problema NP-difícil. Por final, é apresentada uma forma de criar um ambiente experimental em que a dependência entre rótulos possa ser convenientemente controlada com o objetivo de comparar o desempenho entre os métodos de aprendizado multirrótulo.
dc.formatText
dc.identifier.urihttp://repositorio.ufes.br/handle/10/15475
dc.languagepor
dc.publisherUniversidade Federal do Espírito Santo
dc.publisher.countryBR
dc.publisher.courseDoutorado em Ciência da Computação
dc.publisher.departmentCentro Tecnológico
dc.publisher.initialsUFES
dc.publisher.programPrograma de Pós-Graduação em Informática
dc.rightsopen access
dc.subjectAlgoritmos multirrótulo
dc.subjectcalibrated label ranking
dc.subject.br-rjbnsubject.br-rjbn
dc.subject.cnpqCiência da Computação
dc.titleAnalysis of the impacts of label dependence in multi-label learning
dc.title.alternativetitle.alternative
dc.typedoctoralThesis
Arquivos
Pacote Original
Agora exibindo 1 - 1 de 1
Carregando...
Imagem de Miniatura
Nome:
LucasHenriqueSousaMello-2021-tese.pdf
Tamanho:
1.73 MB
Formato:
Adobe Portable Document Format
Descrição: