Algoritmos Genéticos para la Extracción de Reglas de Predicción Interesantes Aplicadas al Posicionamiento de los Distintos Motores de Búsquedas
Abstract
El objetivo del trabajo se centra en inferir distintas estrategias de posicionamiento de páginas Web en motores de
búsqueda. El problema consiste en explorar la relación entre distintos elementos que componen la página y el
posicionamiento final en los motores de búsqueda según el criterio y el dominio de las páginas. El caso de estudio
propone aprender de las variables que determinan el posicionamiento de una página entre las primeras diez
posiciones en algunos motores de búsqueda. Utilizamos técnicas de aprendizaje inductivo, concretamente, un
algoritmo genético aplicado a la extracción de reglas de predicción con algoritmos de búsqueda global. Este
algoritmo contiene modificaciones con respecto a los clásicos, población inicial uniforme, discretización USD
(Unparametrized Supervised Discretization), el cual maximiza la bondad global de los intervalos que obtiene, y
codificación natural. Experimentamos con datos reales correspondientes al posicionamiento en los motores de
búsqueda, en el área de optimización de los mismos.
Downloads
References
J. S. Aguilar. “Generación de Reglas Jerárquicas de Decisión con Algoritmos Evolutivos en Aprendizaje
Supervisado”. Tesis Doctoral, Univ. de Sevilla. 2001.
Aguilar-Ruiz, J. S. & Riquelme, J. C. “Improving the Evolutionary Coding for machina Learning Tasks”.
European Conference on Artificial Intelligence, ECAI ’02 pp. 173-177, IOS Press, Lyon, France.
D. R. Carvalho, A. A. Freitas & N. F. F. Ebecken. “A Critical Review of Rule Surprisingness Measures”.
ICDM-Rio-2003.
Giradles, R., Aguilar-Ruiz, J., Riquelme, J. y Mateos, D. “Cogito*: Aprendizaje Evolutivo de reglas de
Decisión con Codificación Natural”. Departamento de Leguajes y Sistemas Informáticos. Universidad de
Sevilla.
James Dougherty, Ron Kohavi & Mehran Sahami. “Supervised and Unsupervised Discretization of Continuous
Features”. In Armand Prieditis & Stuart Russell. Eds, Machine Learning: Proccedings of the Twelfth
International Conference, 1995, Morgan Kaufmann Publishers, San Francisco, CA.
Freitas, A. A. “On objective measures of rule surprisingness”. Proc. 2nd European Symp. On Principles of
Data Mining and Knowledge Discovery (PKDD-98). 1998.
A. Freitas. “On Rule Interestingness Measures”. Knowledge-Based Systems Journal. Federal Center of
Technological Education 1999.
Freitas, A. A. “A genetic algorithm for generalized rule induction”. In: R. Roy et al. Advances in Soft
Computing - Engineering Design and Manufacturing. 1999.
A. Freitas. “Understanding the crucial differences between classification and discovery of association rules”.
ACM SIGKDD Explorations. 2(1) pp. 65-69. 2000.
A. Freitas. “Data Mining and Knowledge Discovery with Evolutionary Algorithms”. Springer-Verlag. 2002.
Giradles, R., Aguilar-Ruiz, J., Riquelme, J. “Discretización Supervisada No Paramétrica Orientada a la
Obtención de Reglas de Decisión”. Departamento de Lenguajes y Sistemas Informáticos. Universidad de
Sevilla.
Giradles, R., Aguilar-Ruiz, J., Riquelme, J. “Aprendizaje Evolutivo de Reglas: Mejoras en la Codificación y
Evaluación de Individuos”. Departamento de Lenguajes y Sistemas Informáticos. Universidad de Sevilla.
LMD27.
César Hervás-Martínez, Cristóbal Romero, Sebastián Ventura. “Selección de medidas de evaluación de reglas
obtenidas mediante programación genética basada en gramática”. Universidad de Córdoba, Córdoba, España.
LMD23.
Carlos Hurtado L. “Evaluación de Modelos de Clasificación”. Departamento de Ciencias de la Computación,
U de Chile.
Ali Karci and Ahmet Arslan. “Uniform population in genetic algorithms”. Istanbul University Engineering
Faculty. Journal of electrical & electronics. Elazig/Turkey 2002.
N. Lavrac, P. Flach, B. Zupan. “Rule Evaluation Measures: A Unifying View”. ILP-99, LNAI 1634. Springer-
Verlag Berlin Heidelberg. 1999.
Liu, B., Hsu, W. & Chen, S. “Using general impressions to analyze discovered classification rules”. Proc. 3rd
Int. Conf. on Knowledge Discovery & Data Mining (KDD-97), 31-36. AAAI Press, (1997).
Adam Marczyk. “Algoritmos genéticos y computación evolutiva”. 2004.
Edgar Noda, Alex A. Freitas, Akebo Yamakami. “A Distributed-Population Genetic Algorithm for Discovering
Interesting Prediction Rules”. WSC7-2002.
E. Noda, A. Freitas, H.S. Lopes. “Discovering interesting prediction rules with a genetic algorithm”. Proc.
Congress on Evolutionary Computation, CEC-99. Washington D.C., USA, July 1999. IEEE, Piscataway, NJ.
P. Berka and I. Bruha. “Empirical comparison of various discretization procedures”. Technical Report LISP-
-04, Laboratory of Intelligent Systems, Prage, 1995.
Wesley Romão, Alex A. Freitas y Roberto C. S. Pacheco. “A Genetic Algorithm for Discovering Interesting
Fuzzy Prediction. Rules: applications to science and technology data”. UEM, DIN-CTC; PUC-PR, PPGIACCET;
UFSC, PPGEP-CTC. GECCO (2002)
Soltero Domingo, Francisco José; Bodas Sagi, Diego José. “Clasificadores inductivos para el posicionamiento
web”. El profesional de la información, 2005, enero-febrero, v. 14, n. 1, pp. 4-13.
Weka home page http://www.cs.waikato.ac.nz/~ml/weka
The articles published in the journal Ciencia y Tecnología are the exclusive property of their authors. Their opinions and content belong to their authors, and the Universidad de Palermo declines all responsibility for the rights that may arise from reading and/or interpreting the content of the published articles.
The reproduction, use or exploitation by any third party of the published articles is not authorized. Its use is only authorized for exclusively academic and/or research purposes.