Novas técnicas de amostragem tendenciosa para os algoritmos de análise de agrupamento k-médias e DBSCAN

dc.contributor.advisor1Varejao, Flavio Miguel
dc.contributor.advisor1IDhttps://orcid.org/0000-0002-5444-1974
dc.contributor.advisor1Latteshttp://lattes.cnpq.br/6501574961643171
dc.contributor.authorLuchi, Diego
dc.contributor.authorIDhttps://orcid.org/0009-0002-4384-7116
dc.contributor.authorLattes http://lattes.cnpq.br/4690522362645057
dc.contributor.referee1Carvalho, Alexandre Plastino de
dc.contributor.referee1IDhttps://orcid.org/0000-0003-4039-0915
dc.contributor.referee1Latteshttp://lattes.cnpq.br/4985266524417261
dc.contributor.referee2Santos, Thiago Oliveira dos
dc.contributor.referee2IDhttps://orcid.org/0000-0001-7607-635X
dc.contributor.referee2Latteshttp://lattes.cnpq.br/5117339495064254
dc.contributor.referee3Rodrigues, Alexandre Loureiros
dc.contributor.referee3IDhttps://orcid.org/
dc.contributor.referee3Latteshttp://lattes.cnpq.br/0000601083852823
dc.contributor.referee4Rauber, Thomas Walter
dc.contributor.referee4IDhttps://orcid.org/0000000263806584
dc.contributor.referee4Latteshttp://lattes.cnpq.br/0462549482032704
dc.date.accessioned2024-05-30T00:48:38Z
dc.date.available2024-05-30T00:48:38Z
dc.date.issued2019-03-28
dc.description.abstractThe cluster analysis is a set of techniques designed to identify groups of similar elements in a dataset. Such techniques are used in many different applica tions, such as image segmentation, signal processing, data compression, unsuper vised learning, selection of characteristics, sampling, among others. Although they are important in a wide range of applications, the use of these techniques in large cardinality data is a problem due to the poor scalability of several traditional al gorithms. One way to circumvent this problem is to sample, after all, reducing the cardinality of data sets greatly reduces the computational effort required by the methods. This thesis presents three new sampling methods specifically designed to be used in conjunction with the cluster analysis algorithms k-means and DBSCAN. The experimental results show that those designed for the DBSCAN algorithm obtained better results than the competitors. However, the proposed sampling ap proach for k-means returned lower quality results than DENDIS, a recently proposed method.
dc.description.resumoA análise de agrupamento é um conjunto de técnicas destinadas a identi f icação de grupos de elementos similares em um conjunto de dados. Tais técnicas são utilizadas nas mais variadas aplicações, como segmentação de imagens, proces samento de sinais, compressão de dados, aprendizado não supervisionado, seleção de características, amostragem, dentre outras. Embora sejam importantes nas mais diversas aplicações, a utilização dessas técnicas em conjunto de dados de grande cardinalidade é um problema em virtude da escalabilidade ruim de vários algorit mos tradicionais. Uma das formas de se contornar esse problema é a amostragem, afinal, reduzir a cardinalidade do conjuntos de dados reduz bastante o esforço com putacional exigido pelos métodos. Nesse trabalho são apresentados três métodos amostrais novos especificamente projetados para serem utilizados em conjunto com os algoritmos de análise de agrupamento k-médias e DBSCAN. Os resultados expe rimentais mostram que os métodos propostos para o algoritmo DBSCAN obtiveram melhores resultados que os competidores. Contudo, a abordagem amostral proposta para o k-médias ficou em segundo lugar, retornando resultados de qualidade inferior a outro método recentemente proposto denominado DENDIS
dc.description.sponsorshipFundação Coordenação de Aperfeiçoamento de Pessoal de Nível Superior (CAPES)
dc.formatText
dc.identifier.urihttp://repositorio.ufes.br/handle/10/13791
dc.languagepor
dc.publisherUniversidade Federal do Espírito Santo
dc.publisher.countryBR
dc.publisher.courseDoutorado em Ciência da Computação
dc.publisher.departmentCentro Tecnológico
dc.publisher.initialsUFES
dc.publisher.programPrograma de Pós-Graduação em Informática
dc.rightsopen access
dc.subjectAmostragem
dc.subjectUnsupervised learning
dc.subjectCluster analysis
dc.subjectSampling
dc.subjectAprendizado não supervisionado
dc.subjectAnálise de agrupamento
dc.subject.br-rjbnsubject.br-rjbn
dc.subject.cnpqCiência da Computação
dc.titleNovas técnicas de amostragem tendenciosa para os algoritmos de análise de agrupamento k-médias e DBSCAN
dc.typedoctoralThesis
Arquivos
Pacote Original
Agora exibindo 1 - 1 de 1
Carregando...
Imagem de Miniatura
Nome:
Tese (1).pdf
Tamanho:
1.26 MB
Formato:
Adobe Portable Document Format
Descrição: