El concepto de data mining, procedente de la lengua inglesa, suele mencionarse en nuestro idioma como minería de datos. La noción se vincula al procedimiento que se lleva a cabo para detectar patrones en una gran cantidad de datos.
La finalidad del data mining es extraer ciertas informaciones de una masa de datos para crear una estructura que pueda comprenderse y utilizarse. Para esto recurre a sistemas de bases de datos, técnicas de la estadística y otros recursos.
El data mining analiza y procesa los datos en búsqueda de algún patrón o modelo. Una vez descubierta una cierta estructura, busca hacerla visible para que resulte posible trabajar con ella.
De esta manera, a través de un análisis semi-automático o automático de los datos, el data mining logra descubrir patrones que, hasta el momento, no se conocían. A partir de entonces surgen tareas o actividades adicionales que, si bien no pertenecen al ámbito específico del data mining, forman parte de su universo.
Puede decirse que el proceso de data mining se inicia con la selección de la masa de datos. Luego se procede al análisis de sus propiedades para transformarlos y extraer informaciones que pueden ser interpretadas y evaluadas.
Más exactamente podemos exponer que el data mining se compone de tres etapas o fases claramente delimitadas:
-La determinación de los objetivos. Es decir, se trata de establecer qué fines se persiguen con ese proceso. Es quien encarga el mismo el que los decide y luego se los hace saber, como es lógico, al profesional de la minería de datos.
-El preprocesamiento de los datos. Consiste en lo que es la selección, limpieza, enriquecimiento, disminución e incluso cambio en lo que son las bases de datos que son claves en el proceso.
-La elección del modelo. Esta etapa, a su vez, podemos establecer que se divide en varias partes. Así, en primer lugar, se lleva a cabo el análisis estadístico de los datos. Y luego, en segundo lugar, se desarrolla lo que es la visualización gráfica de aquellos.
-El análisis de los resultados obtenidos, con el que se podrá conocer a qué punto se ha llegado y también a si se han alcanzado los fines que pretendía quien encargó el proceso del data mining.
El data mining puede emplearse, por ejemplo, para detectar a posibles terroristas. A través del análisis de millones de llamadas telefónicas, correos electrónicos y comunicaciones de distinto tipo, es posible descubrir algún patrón que permita identificar a personas que planeen cometer un atentado.
Una empresa también puede recurrir al data mining para buscar ciertas variables entre los datos que posee de sus clientes y así ofrecer un determinado producto solo a aquellos que cumplen con algunos requisitos.
Precisamente en ese sentido, los supermercados e hipermercados pueden encontrar en el data mining a un gran aliado. Y es que, por ejemplo, si gracias a ese conocen los hábitos de sus clientes respecto al fin de semana pueden tener claros cuáles son los productos que más se consumen durante ese periodo y así hacerlos más atractivos o incluso ponérselos más al alcance de la mano. De esta manera, lograrán satisfacer a los clientes y mejorar sus ventas.