Novas técnicas de amostragem tendenciosa para os algoritmos de análise de agrupamento k-médias e DBSCAN
dc.contributor.advisor1 | Varejao, Flavio Miguel | |
dc.contributor.advisor1ID | https://orcid.org/0000-0002-5444-1974 | |
dc.contributor.advisor1Lattes | http://lattes.cnpq.br/6501574961643171 | |
dc.contributor.author | Luchi, Diego | |
dc.contributor.authorID | https://orcid.org/0009-0002-4384-7116 | |
dc.contributor.authorLattes | http://lattes.cnpq.br/4690522362645057 | |
dc.contributor.referee1 | Carvalho, Alexandre Plastino de | |
dc.contributor.referee1ID | https://orcid.org/0000-0003-4039-0915 | |
dc.contributor.referee1Lattes | http://lattes.cnpq.br/4985266524417261 | |
dc.contributor.referee2 | Santos, Thiago Oliveira dos | |
dc.contributor.referee2ID | https://orcid.org/0000-0001-7607-635X | |
dc.contributor.referee2Lattes | http://lattes.cnpq.br/5117339495064254 | |
dc.contributor.referee3 | Rodrigues, Alexandre Loureiros | |
dc.contributor.referee3ID | https://orcid.org/ | |
dc.contributor.referee3Lattes | http://lattes.cnpq.br/0000601083852823 | |
dc.contributor.referee4 | Rauber, Thomas Walter | |
dc.contributor.referee4ID | https://orcid.org/0000000263806584 | |
dc.contributor.referee4Lattes | http://lattes.cnpq.br/0462549482032704 | |
dc.date.accessioned | 2024-05-30T00:48:38Z | |
dc.date.available | 2024-05-30T00:48:38Z | |
dc.date.issued | 2019-03-28 | |
dc.description.abstract | The cluster analysis is a set of techniques designed to identify groups of similar elements in a dataset. Such techniques are used in many different applica tions, such as image segmentation, signal processing, data compression, unsuper vised learning, selection of characteristics, sampling, among others. Although they are important in a wide range of applications, the use of these techniques in large cardinality data is a problem due to the poor scalability of several traditional al gorithms. One way to circumvent this problem is to sample, after all, reducing the cardinality of data sets greatly reduces the computational effort required by the methods. This thesis presents three new sampling methods specifically designed to be used in conjunction with the cluster analysis algorithms k-means and DBSCAN. The experimental results show that those designed for the DBSCAN algorithm obtained better results than the competitors. However, the proposed sampling ap proach for k-means returned lower quality results than DENDIS, a recently proposed method. | |
dc.description.resumo | A análise de agrupamento é um conjunto de técnicas destinadas a identi f icação de grupos de elementos similares em um conjunto de dados. Tais técnicas são utilizadas nas mais variadas aplicações, como segmentação de imagens, proces samento de sinais, compressão de dados, aprendizado não supervisionado, seleção de características, amostragem, dentre outras. Embora sejam importantes nas mais diversas aplicações, a utilização dessas técnicas em conjunto de dados de grande cardinalidade é um problema em virtude da escalabilidade ruim de vários algorit mos tradicionais. Uma das formas de se contornar esse problema é a amostragem, afinal, reduzir a cardinalidade do conjuntos de dados reduz bastante o esforço com putacional exigido pelos métodos. Nesse trabalho são apresentados três métodos amostrais novos especificamente projetados para serem utilizados em conjunto com os algoritmos de análise de agrupamento k-médias e DBSCAN. Os resultados expe rimentais mostram que os métodos propostos para o algoritmo DBSCAN obtiveram melhores resultados que os competidores. Contudo, a abordagem amostral proposta para o k-médias ficou em segundo lugar, retornando resultados de qualidade inferior a outro método recentemente proposto denominado DENDIS | |
dc.description.sponsorship | Fundação Coordenação de Aperfeiçoamento de Pessoal de Nível Superior (CAPES) | |
dc.format | Text | |
dc.identifier.uri | http://repositorio.ufes.br/handle/10/13791 | |
dc.language | por | |
dc.publisher | Universidade Federal do Espírito Santo | |
dc.publisher.country | BR | |
dc.publisher.course | Doutorado em Ciência da Computação | |
dc.publisher.department | Centro Tecnológico | |
dc.publisher.initials | UFES | |
dc.publisher.program | Programa de Pós-Graduação em Informática | |
dc.rights | open access | |
dc.subject | Amostragem | |
dc.subject | Unsupervised learning | |
dc.subject | Cluster analysis | |
dc.subject | Sampling | |
dc.subject | Aprendizado não supervisionado | |
dc.subject | Análise de agrupamento | |
dc.subject.br-rjbn | subject.br-rjbn | |
dc.subject.cnpq | Ciência da Computação | |
dc.title | Novas técnicas de amostragem tendenciosa para os algoritmos de análise de agrupamento k-médias e DBSCAN | |
dc.type | doctoralThesis |
Arquivos
Pacote Original
1 - 1 de 1
Carregando...
- Nome:
- Tese (1).pdf
- Tamanho:
- 1.26 MB
- Formato:
- Adobe Portable Document Format
- Descrição: