Como el dicho dice, la información es poder. ¿Qué es esto de la minería de datos? La minería de datos es el conjunto de técnicas de explotación de los datos con el objetivo de encontrar patrones. Simplemente con esto podemos entender que, si analizamos bien los datos que tenemos dentro de una compañía, podremos hacer predicciones precisas para tomar buenas decisiones.

Por ejemplo, en una entidad bancaria, podemos analizar lo bien acogidos que son los productos financieros que disponemos  y predecir cómo los clientes recibirán determinadas ofertas, realizar ofertas especializadas e incluso lo contrario, evidenciar la poca acogida de un producto financiero.

Mediante esta técnica, que lleva con nosotros muchos años, y gracias a la tecnología, que nos permite tratar cantidades muy grandes de información que harán más eficientes nuestros análisis y más robustas nuestras conclusiones, hacemos uso de la minería de datos para ir un paso por delante.

¿Cómo realizamos la minería de datos? El circuito siempre es el mismo, tenemos una fase de obtención de datos, otra en la que realizamos una limpieza del dato para a continuación fusionarlos y por último llega la interpretación de los mismos. Vamos a echar un vistazo rápido a estos 4 conceptos:

  • Recopilación de los datos: En primer lugar tenemos que obtener el conjunto de datos con el que haremos el estudio. Estos datos los podemos obtener de fuentes diferentes, como pueden ser un Excel. Ya que pusimos el ejemplo de una entidad bancaria seguro tendríamos datos en Host, también podemos obtener los datos de un origen SAS, etc. Lo que importa en este punto es identificar dónde encontrar los datos.
  • Limpieza de datos: A partir de los datos obtenidos, sin importar su origen, realizaremos una selección de lo que nos aporta conocimiento para el caso que vamos a analizar y lo que no. También entraría en este punto una “estandarización” de los datos. Por ejemplo, podemos obtener DNIs de distintos orígenes y en uno de ellos nos viene la letra separada con guión y en otros no.
  • Análisis de los datos: Aplicaremos transformaciones en los datos para relacionarlos, compactarlos y realizar cálculos para la obtención de nuestros informes finales.
  • Interpretación de los datos: Aquí no tendríamos mucho que explicar, una vez obtenidos los resultados, obtendremos las conclusiones y, cuanto mejores sean, mejores decisiones podremos obtener o más precisas serán nuestras predicciones.

Este circuito repetitivo lo vamos mejorando gracias a los avances tecnológicos y de software. Esto nos permite realizar estudios con cada vez mayores volúmenes de datos y poder así obtener resultados más precisos, realizar los procesamientos de manera más rápida o eficiente, produciendo así un ahorro en la inversión de la minería o unos resultados más inmediatos. Como todos sabemos, un punto en el que siempre se busca la mejora son los costes.

¿Para qué se utiliza la minería de datos?

La minería de datos se usa principalmente en el ámbito empresarial para mejorar su gestión y rendimiento o para, a partir de datos de terceros, ayudar en la captación o fidelización de los clientes mediante las predicciones u optimizar la toma de decisiones.

Respecto a la minería de empresas, podemos hablar de sectores muy diferentes que pueden hacer uso de los datos para la venta de sus productos, como puede ser la banca, telecomunicaciones, videojuegos, cine, ropa, etc. En todos ellos se pueden analizar los costes/beneficios de sus productos para desarrollar nuevas campañas personalizadas a partir de los buenos resultados que le hayan dado sus productos o todo lo contrario, darse cuenta de los malos resultados que han obtenido e intentar evitar esta situación en un futuro.

Poniendo el foco en el sector financiero, por experiencia propia la minería de datos ha sido aplicada para realizar informes cuyo destino son personas expertas en negocio y banca para que puedan tomar buenas decisiones. Un ejemplo muy concreto para mí fue el proyecto CIRBE (Central de Información de Riesgos del Banco de España), en el que se realizaron varios informes con todos los préstamos de una entidad financiera con los datos de sus clientes, los saldos,  la mora, etc… Otro sería IFRS9, en el que mediante la minería de datos se realizó el cálculo de las provisiones dinerarias que tiene que hacer una entidad financiera de cara a que sus clientes entren en mora.

La minería de datos está en todas partes

Aunque no nos demos cuenta, la minería de datos está presente en muchos momentos cotidianos, como pueden ser unas elecciones políticas, en las cuales la minería de datos intentaría predecir los resultados en un momento determinado y así poder orientar la campaña electoral. Los supermercados, por su parte, pueden comprobar mediante el minado de datos el volumen de ventas de productos determinados según los días de la semana y adaptar dichos días a una mejora en sus ventas o pueden analizar según ventas de productos qué stock aproximado deben tener en cada momento y así eficenciar sus costes. Lo mismo ocurriría con las tiendas de ropa o incluso en el sector de la hostelería, podemos sacar patrones de qué tipo de prenda o de comida son las más elegidas en cada día de la semana. Otro ejemplo en el que se utiliza la minería de datos es para evitar los fraudes y lavados de dinero, realizando minados de datos para detectar este tipo de comportamientos a partir de las tarjetas de crédito o transferencias.

Uno de los ganadores de la quiniela dedicó mucho tiempo a minería de datos basada en los resultados de la liga durante varios años, analizando los diferentes resultados de los equipos dependiendo de si jugaban en casa, fuera o contra un equipo determinado. La minería de datos también está muy presente en la actual situación de pandemia. Cada día los informativos nos presentan gráficos con la evolución en el tiempo, las tendencias de los contagios, etc. También oímos muchas veces que un estudio de la universidad de tal sitio ha concluido que tal cosa es beneficiosa para la población comprendida entre dos franjas de edades, por lo que podemos decir que, en muchos de estos casos, sus estudios se realizan mediante minería de datos.

Una apuesta por las buenas decisiones

Para terminar tenemos que tener en cuenta que la minería de datos inicialmente te va a generar un coste antes de obtener ningún beneficio. Debemos tener objetivos ambiciosos pero también ser realistas y minuciosos en la estimación de cuándo y cuánto obtendremos los resultados para que la inversión no supere al beneficio.

Así que, efectivamente, soy minero, ayudo al análisis y tratamiento de datos para ayudar a que con esta información se puedan obtener conclusiones robustas y buenas decisiones.

Héctor BernardStructural Data