An´alisis de medidas no-supervisadas de calidad en clusters obtenidos por K-means y Particle Swarm Optimization
Resumen
El clustering de datos ayuda a discernir la estructura y simplifica la complejidad de cantidades masivas de datos. Es
una t´ecnica com´un y se utiliza en diversos campos como, aprendizaje de m´aquina, miner´ıa de datos, reconocimiento
de patrones, an´alisis de im´agenes y bioinform´atica, donde la distribuci´on de la informaci´on puede ser de cualquier
tama˜no y forma. La eficiencia de los algoritmos de clustering es extremadamente necesaria cuando se trabaja con
enormes bases de datos y tipos de datos de grandes dimensiones. Este trabajo presenta una evaluaci´on desde distintas
perspectivas de una serie de medidas relevantes no-supervisadas de calidad como por ejemplo, cuantizaci´on del error,
distancias intra- e inter- cluster, de los clusters obtenidos por el conocido algoritmo de K-means, una metaheur´ıstica
poblacional denominada Particle Swarm Optimization (PSO) y un algoritmo h´ıbrido, que combina las caracter´ısticas
de los dos algoritmos anteriores, denominado PSO+Kmeans. De los resultados obtenidos se observa que en general el
algoritmo PSO+K-means obtiene mejores resultados en cada una de las medidas generando clusters m´as compactos y
separados entre ellos que los obtenidos por los otros algoritmos.
Descargas
Citas
Jain A.K., Murty M. N., and Flynn P. J. Data clustering: A review. ACM Computing Survey, 31(3):264–323,
Jain A.K. and Dubes R.C. Algorithms for Clustering Data. Englewood Cliffs, N.J.:Prentice Hall, 1988.
Chui-Yu Chui, Yi-Feng Chen, I-Ting Kou, and He Chun Ku. An intelligent market segmentation system using
k-means and particle swarm optimization. Expert Systems with Applications, 2008.
Kennedy J. and Eberhart R. Swarm Intelligence. Morgan Kaufmann, San Francisco, California, 2001.
MacQueen J. Some methods for classification and analysis of multivariate observations. In Proceedings of the
th Berkeley Symp. Math. Statist, Prob, pages 281–297, 1968.
Omran M., Salman A., and Engelbrecht A.P. Image classification using particle swarm optimization. In Conference
on Simulated Evolution and Learning, Computational intelligence for the E-age, 2002.
Tou J. T. and Gonzalez R. C. Pattern recognition principles. Addison-Wesley, 1974.
Fayyad U., Piatetsky-Shapiro G., and Smith P. From data mining to knowledge discovery in database. In
American Association for Artificial Intelligence, pages 37–54, 1996.
Backer U.E. Computer-assisted reasoning in cluster analysis. Prentice-Hall, 1995.
Huang T. W. Application of clustering analysis for reducing smt setup time- a case study on avantech company.
Master’s thesis, Department of National Taipei University of Technology, 2006.
Selim S. Z. and Ismail M.A. K-means type algorithms: A generalized convergence theorem and characterization
of local optimality. IEEE Trans. Pattern Anal. Mach. Intell., (6):81–87, 1984.
Los artículos publicados en la Revista Ciencia y Tecnología son de exclusiva propiedad de sus autores. Las opiniones y el contenido de los mismos pertenecen a sus autores, declinando la Universidad de Palermo toda responsabilidad por los derechos que pudiera derivarse de la lectura y/o interpretación del contenido de los artículos publicados.
No se autoriza la reproducción, utilización ni explotación por parte de ningún tercero de los artículos publicados. Sólo se autoriza su uso para fines exclusivamente académicos y/o de investigación.