An´alisis de medidas no-supervisadas de calidad en clusters obtenidos por K-means y Particle Swarm Optimization
Abstract
El clustering de datos ayuda a discernir la estructura y simplifica la complejidad de cantidades masivas de datos. Es
una t´ecnica com´un y se utiliza en diversos campos como, aprendizaje de m´aquina, miner´ıa de datos, reconocimiento
de patrones, an´alisis de im´agenes y bioinform´atica, donde la distribuci´on de la informaci´on puede ser de cualquier
tama˜no y forma. La eficiencia de los algoritmos de clustering es extremadamente necesaria cuando se trabaja con
enormes bases de datos y tipos de datos de grandes dimensiones. Este trabajo presenta una evaluaci´on desde distintas
perspectivas de una serie de medidas relevantes no-supervisadas de calidad como por ejemplo, cuantizaci´on del error,
distancias intra- e inter- cluster, de los clusters obtenidos por el conocido algoritmo de K-means, una metaheur´ıstica
poblacional denominada Particle Swarm Optimization (PSO) y un algoritmo h´ıbrido, que combina las caracter´ısticas
de los dos algoritmos anteriores, denominado PSO+Kmeans. De los resultados obtenidos se observa que en general el
algoritmo PSO+K-means obtiene mejores resultados en cada una de las medidas generando clusters m´as compactos y
separados entre ellos que los obtenidos por los otros algoritmos.
Downloads
References
Jain A.K., Murty M. N., and Flynn P. J. Data clustering: A review. ACM Computing Survey, 31(3):264–323,
Jain A.K. and Dubes R.C. Algorithms for Clustering Data. Englewood Cliffs, N.J.:Prentice Hall, 1988.
Chui-Yu Chui, Yi-Feng Chen, I-Ting Kou, and He Chun Ku. An intelligent market segmentation system using
k-means and particle swarm optimization. Expert Systems with Applications, 2008.
Kennedy J. and Eberhart R. Swarm Intelligence. Morgan Kaufmann, San Francisco, California, 2001.
MacQueen J. Some methods for classification and analysis of multivariate observations. In Proceedings of the
th Berkeley Symp. Math. Statist, Prob, pages 281–297, 1968.
Omran M., Salman A., and Engelbrecht A.P. Image classification using particle swarm optimization. In Conference
on Simulated Evolution and Learning, Computational intelligence for the E-age, 2002.
Tou J. T. and Gonzalez R. C. Pattern recognition principles. Addison-Wesley, 1974.
Fayyad U., Piatetsky-Shapiro G., and Smith P. From data mining to knowledge discovery in database. In
American Association for Artificial Intelligence, pages 37–54, 1996.
Backer U.E. Computer-assisted reasoning in cluster analysis. Prentice-Hall, 1995.
Huang T. W. Application of clustering analysis for reducing smt setup time- a case study on avantech company.
Master’s thesis, Department of National Taipei University of Technology, 2006.
Selim S. Z. and Ismail M.A. K-means type algorithms: A generalized convergence theorem and characterization
of local optimality. IEEE Trans. Pattern Anal. Mach. Intell., (6):81–87, 1984.
The articles published in the journal Ciencia y Tecnología are the exclusive property of their authors. Their opinions and content belong to their authors, and the Universidad de Palermo declines all responsibility for the rights that may arise from reading and/or interpreting the content of the published articles.
The reproduction, use or exploitation by any third party of the published articles is not authorized. Its use is only authorized for exclusively academic and/or research purposes.