El machine learning es un área de la inteligencia artificial (IA) que se especializa en la utilización de algoritmos y datos para que un sistema pueda imitar la manera en la que aprenden las personas. A este campo, reconocido asimismo como una disciplina que forma parte de las ciencias de la computación, también se lo menciona como aprendizaje automático.
Cabe destacar que el aprendizaje se asocia a adquirir conocimientos o habilidades. Lo automático, en tanto, es aquello que funciona por sí mismo, sin que un ser humano tenga que intervenir de manera directa o constante.
A través del machine learning, por lo tanto, una máquina puede aprender incluso cuando no fue programada explícitamente para eso. El dispositivo debe estar preparado para la identificación de patrones entre aquellos datos que procesa, de manera tal que pueda realizar pronósticos y predicciones a partir de dicho procesamiento.
Historia del machine learning
La historia del machine learning se construye a través de múltiples avances y descubrimientos de las matemáticas. Suele mencionarse al teorema de Bayes, postulado por el inglés Thomas Bayes (1701–1761), como el punto de partida ya que señala la probabilidad de que un suceso se produzca a partir del análisis de condiciones precedentes que pudieran tener vinculación con el evento en cuestión.
Mucho más adelante surgió la programación informática: instrucciones para que las computadoras ejecuten ciertas acciones. Ya en la década de 1940, Alan Turing comenzó a reflexionar sobre la posible capacidad de pensamiento de las máquinas, replicando de manera autónoma ciertos actos propios del ser humano.
La evolución hacia el machine learning continuó con las investigaciones acerca de las redes neuronales y sobre cómo la biología podía aplicarse para la creación de máquinas inteligentes. Así se llegó a las redes neuronales artificiales, con nodos que están interrelacionados para la transmisión y el procesamiento de datos.
Primeras experiencias
Finalmente el primer proceso de machine learning se logró en 1951 cuando Marvin Minsky y Dean Edmonds del Massachusetts Institute of Technology (MIT) pudieron diseñar un software con la capacidad de aprender de sus experiencias para encontrar la salida de un laberinto. La novedad radicó en que el sistema no fue programado para hallar dicha salida, sino que pudo descubrirla partiendo de casos que le fueron proporcionando.
Más allá de este logro, el machine learning se topó con dos grandes dificultades iniciales: la escasa potencia de cómputo de aquellos años y la poca disponibilidad de grandes cantidades de datos. Por eso los primeros sistemas no estaban en condiciones de proceder a la resolución de problemas complejos.
El machine learning recién tuvo un impulso renovado a fines del siglo XX con la masificación de Internet (que incrementó la información disponible) y el crecimiento de la potencia de cálculo. En 1997, por ejemplo, la supercomputadora Deep Blue de IBM consiguió vencer al campeón mundial de ajedrez, Garry Kasparov. El hito fue posible gracias a la subcategoría del aprendizaje automático conocida como aprendizaje profundo (deep learning), que hace que el sistema se entrene a sí mismo para optimizar la utilización de los datos.
Funcionamiento del machine learning
El machine learning se basa en el reconocimiento de patrones. A medida que va llevando a cabo el procesamiento de datos, el sistema aprende a realizar inferencias de nuevas informaciones que recibe y con las cuales no ha sido entrenado.
Esto es posible gracias a la estadística y los algoritmos. Las máquinas, que actualmente pueden trabajar con lo que se conoce como big data, analizan la información y, ante un cierto problema, deducen cuál es el mejor resultado.
En ese análisis y procesamiento de los datos, cada computadora hace una extracción de características y lleva a cabo una clasificación que le permite luego realizar predicciones y descubrir datos específicos.
Para crear los algoritmos y modelos de machine learning, se recurre a plataformas o bibliotecas como PyTorch, TensorFlow, Keras y Scikit-learn.
Clasificación según el tipo
Existen varios tipos de machine learning, que se asocian a los modelos de aprendizaje automático. En el aprendizaje supervisado, por ejemplo, se utilizan datos etiquetados para el entrenamiento de los algoritmos. El sistema, en este marco, se adapta según la introducción de los datos.
El aprendizaje no supervisado, por su parte, consiste en la agrupación de datos sin etiquetar. Los algoritmos buscan patrones ocultos analizando diferencias y similitudes.
El aprendizaje semi-supervisado, en tanto, recurre a pequeños conjuntos de datos etiquetados para orientar el procesamiento de otros conjuntos más amplios que presentan datos sin etiquetas. Otra modalidad es el aprendizaje por refuerzo, que se lleva a cabo mediante el mecanismo de ensayo y error hasta llegar a la forma de ejecutar una tarea.
Las aplicaciones del machine learning
Las aplicaciones del machine learning son variadas. El aprendizaje automático se utiliza para clasificar el correo no deseado (derivando el spam a una carpeta diferente de la bandeja de entrada), segmentar clientes (creando agrupaciones según sus características) y reconocer imágenes (mediante la detección de patrones), por mencionar algunas posibilidades.
El procesamiento de lenguaje natural (NLP) para la transcripción automática y el reconocimiento de voz; los chatbots que brindan servicios de atención al cliente; los motores de recomendaciones; y la visión por computadora (computer vision) también son posibles gracias al machine learning.