Machine learning contra el blanqueo de capitales

Sergio Gómez, Arquitecto Big Data en GFT
Cedida

TRIBUNA de Sergio Gómez Villamor, Arquitecto Big Data en GFT

¿Puede ser machine learning un arma contra los delitos financieros? ¿Podrían servirnos las nuevas tecnologías para luchar contra la financiación de organizaciones terroristas? Como parte de nuestras actividades de investigación, en GFT disponemos de un centro de competencia de datos donde precisamente se ha investigado sobre la lucha contra el blanqueo de capitales. El objetivo: proporcionar una aplicación que ofrezca un análisis mucho más profundo de la actividad del cliente y que permita a la entidad mitigar los riesgos y ayudarla en la toma de decisiones.

En general, los departamentos de gestión de patrimonios privados (Private Wealth Management) protegen a los particulares con un patrimonio neto alto, ofreciendo asesoramiento de inversión, servicios bancarios y, por supuesto, de gestión de patrimonios, como por ejemplo la planificación de la sucesión. Normalmente, estos clientes tienen más de un millón de euros disponibles para invertir. Las presiones reguladoras internacionales están aumentando para que los bancos realicen revisiones periódicas de estos clientes con el objetivo de detectar posibles casos de actividades ilegales, específicamente blanqueo de capitales y financiación de organizaciones terroristas.

Cuando una entidad incorpora un cliente nuevo debe procederse a una revisión inicial y, a partir de ese momento y dependiendo de la sensibilidad del mismo, debe realizar revisiones anuales o incluso semestrales. Éstas llevan bastante tiempo y, generalmente, incluyen la recogida de determinados documentos (declaraciones de impuestos, etc.), búsquedas en repositorios de información externa (listas de personas conocidas e involucradas en actividades ilegales) o en formato libre, es decir, áquellas realizadas en Internet para localizar el nombre del cliente junto con ciertos términos clave, como por ejemplo "lavado/blanqueo de dinero".

Hasta ahora estas investigaciones se han estado realizando de forma manual y, normalmente, siguen un procedimiento que no es ni estándar ni auditable. En GFT, nos marcamos como objetivo proporcionar una aplicación que realmente sirva de apoyo en la toma de decisiones de los programas de lucha contra el blanqueo de dinero. Los requisitos que tenía que satisfacer esta aplicación para un determinado cliente eran:

  • Asistencia en el descubrimiento de perfiles de redes sociales
  • Descubrimiento y clasificación automática de los contactos relevantes
  • Identificación automatizada de entidades relacionadas en redes sociales: personas, lugares y organizaciones
  • Recopilación de “información relevante adversa” automatizada de Google con interés en el descubrimiento de blanqueo de capitales automático
  • Predicción y registro de individuos sospechosos de ALM (preliminar)
  • Persistencia en procesos due diligence para propósitos de auditoría

Técnicas de machine learning utilizadas

Como resultado de nuestro trabajo, en GFT hemos conseguido una aplicación web para el soporte de la toma de decisiones mediante el procesamiento automático de datos no estructurados, obtenidos de búsquedas tanto en la web como en las redes sociales.

Para apoyar la toma de decisiones, esta aplicación usa técnicas de machine learning como el agrupamiento K-Means (técnica de aprendizaje no supervisado que permite la clasificación y priorización automática de los contactos del individuo analizado); las técnicas de procesamiento de lenguaje natural (NLP) y Extracción de Entidades (Named-Entity Recognition) para obtener información de manera automática sin necesidad de procesar manualmente las búsquedas, obteniendo muy rápidamente un contexto concreto del individuo investigado; técnicas de agrupación y resumen automático sobre texto libre (reduce el tiempo y el coste de la investigación permitiendo obtener de manera completamente automática un resumen de los documentos a procesar por el analista investigador) y, por último, el reconocimiento de imágenes  que facilitan la incorporación de documentos gráficos al proceso de investigación sin la necesidad de que un humano interprete todas y cada una de esas imágenes.

En definitiva, la incorporación de información obtenida en internet y en las redes sociales es parte natural del proceso de investigación pero incorpora un volumen de datos difícil de procesar. El uso de técnicas de machine learing facilita muchísimo el examen de esta multitud de fuentes de datos digitales, incluyendo motores de búsqueda como Google y todo tipo de redes sociales, para detectar si algún cliente pudiera estar involucrado en delitos financieros. Los beneficios son la afinación y focalización en los resultados de la investigación mediante el soporte a la toma de decisiones y la reducción de tiempos y, por lo tanto, de los costes en procesos de investigación.