Resumen:
Con los volúmenes de información que se manejan hoy en día y que están disponibles ya sea de forma privada para una empresa o pública a través de la web, se puede pensar en diferentes estrategias de análisis que permitan beneficiar la ciencia y otras áreas de conocimiento. Un ejemplo de esto son las grandes bases de datos denominadas Big Data, bases de datos del orden los Peta Bytes (Google, Facebook,
Twitter , Amazon, entre otras).
Se presenta como una oportunidad explotar las fuentes de información que se encuentran en bases de datos normalizadas y des normalizadas . Se debe hacer un análisis de la información contenida en dichas bases de datos, logrando encontrar tendencias de consumo respecto a algún producto o servicio, así como también es posible analizar la popularidad de un candidato a la presidencia en un país.
En la web encontramos fuentes de información de todo tipo, por lo cual se hace indispensable una buena clasificación de documentos para su posterior análisis.