Resumen:
Uno de los principales riesgos a los que están sometidas las entidades financieras son los ataques de fraudes electrónicos. Billones de dólares en pérdidas son absorbidas cada año por las entidades financieras debido a transacciones fraudulentas. Para combatir el fraude de manera efectiva es primordial comprender los mecanismos utilizados por los atacantes para cometer estos actos ilícitos.
El diseño de algoritmos de detección de fraude es particularmente difícil debido a la distribución no estacionaria de los datos, las distribuciones de clases altamente desequilibradas (fraude o legítimo) y la disponibilidad de pocas transacciones etiquetadas por los investigadores de fraude; al igual que la falta de disponibilidad de los datos de transacciones por razones de confidencialidad.
El presente trabajo plantea un modelo para detección de fraudes en transacciones financieras. Debido a la falta de información pública de transacciones financieras, el modelo fue planteado utilizando datos de transacciones de autorización de tarjetas de crédito, pero puede ser fácilmente adaptado para otro tipo de transacciones financieras.
El modelo planteado considera los principales retos en el diseño de un sistema de detección de fraudes: a) clases altamente desequilibradas, b) distribución de estacionaria de los datos y c) la incorporación en línea de la retroalimentación de los investigadores de fraude ante las transacciones etiquetadas como sospechosas.
La implementación del modelo planteado en el presente trabajo en un conjunto de datos de prueba permitió predecir exitosamente la mayoría de casos de transacciones fraudulentas con un mínimo porcentaje de falsos negativos.