A novel cooperative algorithm for clustering large databases with sampling
dc.contributor.advisor1 | Varejão, Flávio Miguel | |
dc.contributor.author | Fabris, Fábio | |
dc.contributor.referee1 | Alvarenga, Arlindo Gomes de | |
dc.contributor.referee2 | Barbosa, Hélio José Corrêa | |
dc.contributor.referee3 | Rodrigues, Alexandre Loureiro | |
dc.date.accessioned | 2016-08-29T15:33:17Z | |
dc.date.available | 2016-07-11 | |
dc.date.available | 2016-08-29T15:33:17Z | |
dc.date.issued | 2012-07-30 | |
dc.description.abstract | Clustering is a recurrent task in data mining. The application of traditional heuristics techniques in large sets of data is not easy. They tend to have at least quadratic complexity with respect to the number of points, yielding prohibitive run times or low quality solutions. The most common approach to tackle this problem is to use weaker, more randomized algorithms with lower complexities to solve the clustering problem. This work proposes a novel approach for performing this task, allowing traditional, stronger algorithms to work on a sample of the data, chosen in such a way that the overall clustering is considered good. | eng |
dc.description.resumo | Agrupamento de dados é uma tarefa recorrente em mineração de dados. Com o passar do tempo, vem se tornando mais importante o agrupamento de bases cada vez maiores. Contudo, aplicar heurísticas de agrupamento tradicionais em grandes bases não é uma tarefa fácil. Essas técnicas geralmente possuem complexidades pelo menos quadráticas no número de pontos da base, tornando o seu uso inviável pelo alto tempo de resposta ou pela baixa qualidade da solução final. A solução mais comumente utilizada para resolver o problema de agrupamento em bases de dados grandes é usar algoritmos especiais, mais fracos no ponto de vista da qualidade. Este trabalho propõe uma abordagem diferente para resolver esse problema: o uso de algoritmos tradicionais, mais fortes, em um sub-conjunto dos dados originais. Esse sub-conjunto dos dados originais é obtido com uso de um algoritmo co-evolutivo que seleciona um sub-conjunto de pontos difícil de agrupar. | |
dc.format | Text | |
dc.identifier.citation | FABRIS, Fábio. A novel cooperative algorithm for clustering large databases with sampling. 2012. 99 f. Dissertação (Mestrado em Informática) - Universidade Federal do Espírito Santo, Centro Tecnológico, Vitória, 2012. | |
dc.identifier.uri | http://repositorio.ufes.br/handle/10/4256 | |
dc.language | eng | |
dc.publisher | Universidade Federal do Espírito Santo | |
dc.publisher.country | BR | |
dc.publisher.course | Mestrado em Informática | |
dc.publisher.department | Centro Tecnológico | |
dc.publisher.initials | UFES | |
dc.publisher.program | Programa de Pós-Graduação em Informática | |
dc.rights | open access | |
dc.subject.br-rjbn | Estatística | |
dc.subject.br-rjbn | Amostragem (Estatística) | |
dc.subject.br-rjbn | Análise por agrupamento | |
dc.subject.br-rjbn | Programação heurística | |
dc.subject.br-rjbn | Algoritmos de computador | |
dc.subject.cnpq | Ciência da Computação | |
dc.subject.udc | 004 | |
dc.title | A novel cooperative algorithm for clustering large databases with sampling | |
dc.type | masterThesis |
Arquivos
Pacote Original
1 - 1 de 1
Carregando...
- Nome:
- Dissertação_5121_.pdf
- Tamanho:
- 718.73 KB
- Formato:
- Adobe Portable Document Format
- Descrição: