El análisis de datos es la actividad que se lleva a cabo al examinar y procesar ciertos contenidos para obtener información de utilidad. La finalidad del proceso es favorecer la toma de decisiones y acceder a conclusiones.
Cabe resaltar que un análisis supone un estudio pormenorizado para descubrir los componentes o las características de algo. Los datos, en tanto, son informaciones que hacen posible el conocimiento preciso de un suceso o fenómeno y permiten realizar deducciones de los efectos que derivan de un hecho.
Es importante indicar que los datos en sí mismos carecen de valor si no son considerados en su contexto e interpretados correctamente. Es el análisis el procedimiento que transforma ese material en un saber útil.
Historia del análisis de datos
La historia del análisis de datos comienza en la década de 1960, considerando esta labor como la aplicación de técnicas y recursos para generar información útil. Por supuesto, a un nivel informal o espontáneo, el ser humano siempre ha analizado datos; sin embargo, recién en el último medio siglo la tarea se convirtió en una práctica profesional e incluso dio lugar al nacimiento de una disciplina conocida como ciencia de datos.
Se considera al psicólogo británico Charles Spearman (1863–1945) como un precursor en el análisis de datos ya que postuló la noción de factor y propuso la implementación del análisis factorial en 1904. De todos modos, pasaron muchos años hasta que el estadístico norteamericano John W. Tukey (1915–2000) realizó importantes aportes a este campo.
Tukey estudió desde la recolección de datos hasta su interpretación, pasando por los procedimientos de análisis. Su mirada se concentró sobre todo en la utilización de herramientas estadísticas. Así, en los años «60 definió el análisis de datos e impulsó una evolución de la estadística matemática. Al danés Peter Naur se le atribuye haber acuñado, en 1974, la idea de ciencia de datos.
Principales características
El análisis de datos implica estudiar una determinada cantidad de información que se recopiló con anterioridad. Como ya indicamos, el objetivo es sacar conclusiones que ayuden a tomar decisiones acertadas.
Puede afirmarse que el análisis de datos funciona como una guía. El trabajo realizado sirve para elaborar estrategias, modificar actuaciones o ratificar el rumbo, por ejemplo.
Los especialistas suelen enumerar diversas tareas que se efectúan en el marco del análisis de datos. De este modo, hablan de la limpieza de los mismos (para depurar los erróneos y quedarse solo con los relevantes), su transformación (adaptándolos al formato atinado y convirtiéndolos en información de utilidad) y su modelado (creando un esquema o representación visual). Se reconocen, por lo tanto, las siguientes etapas en el análisis:
- Recolección de datos (una fase de preprocesamiento de datos)
- Limpieza de datos
- Transformación de datos
- Modelado y visualización de datos
En la actualidad, el concepto de análisis de datos suele asociarse específicamente al big data. Así se denomina a una inmensa cantidad de información cuyo procesamiento solo puede realizarse utilizando computadoras y recursos informáticos. En este contexto, se recurre al uso de algoritmos, inteligencia artificial y herramientas de distinta clase como SQL, Google Sheets y Excel, entre muchas otras.
Tipos de análisis de datos
Los expertos reconocen dos grandes tipos de análisis de datos, que generalmente se complementan entre sí. En el análisis de datos cuantitativos, se trabaja con cifras que expresan información comprobable y medible.
El análisis de datos cualitativos, en cambio, no contempla el procesamiento de números. Lo habitual es que se trate de opiniones que se obtienen a partir de entrevistas, encuestas, etc.
Otras clasificaciones no se basan en la naturaleza de los datos, sino en el propósito del análisis. Un análisis descriptivo, en este marco, permite realizar una descripción de un fenómeno o una situación. A partir de él, se puede trazar un análisis de diagnóstico (orientándose a las causas de lo descripto), un análisis predictivo (proyectando el posible futuro) o un análisis prescriptivo (definiendo cuáles son las medidas a tomar).
Teniendo en cuenta estas cuestiones, debe considerarse que es esencial, en un primer momento, establecer para qué se realizará el análisis de datos. Luego tiene que definirse qué es lo que se medirá y cómo se ejecutará la medición. Cumplidos estos pasos, llegan las fases de obtención, análisis e interpretación de los datos en cuestión.
Algunos ejemplos
El análisis de datos se realiza en incontables ámbitos y sectores. Muchos de estos estudios son desarrollados en el marco de la llamada inteligencia de negocios (business intelligence) para mejorar la gestión empresarial.
Tomemos el caso de una cadena de hamburguesas que tiene cuatro locales, cada uno instalado en una ciudad diferente. Un dato indica que la compañía vende 12.000 hamburguesas al mes: dicho número, sin embargo, no aporta demasiada información para la administración y la estrategia comercial. Un análisis de ventas revela que, de esas 12.000 hamburguesas, 9.000 se comercializan en uno solo de los locales, mientras que las 3.000 restantes se reparten entre las otras tres sucursales. Esta información ya es más útil: la gerencia puede tomar decisiones para potenciar a los tres establecimientos que venden menos.
Supongamos ahora que un sitio web registra 25.000 visitas diarias. Es clave conocer cuántos visitantes únicos realizan esas visitas, desde qué lugares y utilizando qué dispositivos. Asimismo es relevante saber cuánto tiempo permanecen el sitio y otras variables. De esta forma, si se lleva a cabo un análisis de datos de marketing detallado, pueden obtenerse conclusiones de mucho valor.