Definición de

Aprendizaje supervisado

Extracción de características

El aprendizaje supervisado permite la extracción de características.

El aprendizaje supervisado es un modelo de aprendizaje automático que se basa en la utilización de datos etiquetados para el entrenamiento de algoritmos que puedan clasificarlos o anticipar resultados a partir de ellos. Lo que hace el modelo es ir ajustando sus ponderaciones a medida que se le introducen más datos.

La supervisión a la que alude la denominación del modelo es realizada por un ser humano. Una persona es quien se encarga del etiquetado de los datos: por lo tanto, no se trata de un aprendizaje totalmente automatizado que un sistema pueda desarrollar sin intervención humana.

Concepto de aprendizaje supervisado

Para comprender qué es el aprendizaje supervisado, primero hay que prestar atención a varias nociones. Debe tenerse en claro que el aprendizaje supervisado es una técnica del aprendizaje automático o machine learning, que a su vez es un área de la inteligencia artificial.

La idea de inteligencia artificial refiere a determinadas capacidades de tipo intelectual o cognoscitivo que expresan los algoritmos o los sistemas. De este modo, las máquinas pueden imitar -en cierta forma- la inteligencia humana.

El aprendizaje automático, en este marco, es un conjunto de técnicas que hacen posible que un sistema aprenda: es decir, que mejore su desempeño a partir de la utilización de datos y de la experiencia. Como ya indicamos, en el caso del aprendizaje supervisado se necesita que un individuo interactúe con el modelo.

Big data

Con el aprendizaje supervisado se optimiza el análisis de datos.

Las técnicas

El aprendizaje supervisado puede llevarse a cabo apelando de distintas técnicas y algoritmos. Entre estos recursos se encuentran las redes neuronales artificiales, que buscan imitar el funcionamiento del cerebro humano recurriendo a capas de nodos para el procesamiento de los datos de entrada.

Cada uno de los nodos se forma con las entradas, las ponderaciones, un umbral (sesgo) y la salida. La activación del nodo se da cuando el valor de entrada consigue superar el umbral; en ese caso, el dato avanza a la próxima capa de la red neuronal. El aprendizaje supervisado, en este contexto, se logra con ajustes que se sustentan en la función de pérdida vía gradiente descendente.

La regresión lineal, en tanto, reconoce el vínculo entre una variable dependiente y una o varias variables independientes. Así puede predecir resultados. Si hay una única variable independiente, se habla de regresión lineal simple; si hay más, se trata de una regresión lineal múltiple.

La regresión logística, por su parte, se emplea si las variables dependientes presentan salidas binarias (es decir, si son categóricas). Por eso se aprovechan sobre todo para la resolución de problemas de esta clase de clasificación.

Las máquinas de soporte vectorial (SVM), asimismo, se usan para la regresión y para la clasificación de datos. Con ellas se realiza la construcción de un hiperplano (el límite de decisión) que separa los datos de acuerdo a su clase.

Entre los algoritmos de aprendizaje automático también se encuentra aquel conocido como K-vecino más cercano o, en inglés, K-nearest neighbors (KNN). Se emplea para clasificar los puntos de datos de acuerdo a su asociación y la proximidad con otros datos, calculando la distancia y luego asignando una categoría que se basa en el promedio de mayor frecuencia.

El algoritmo mencionado como random forest, por otro lado, es una serie de árboles de decisión no correlacionados que, al fusionarse, minimizan la varianza y elaboran predicciones de mayor precisión.

Análisis de preferencias

Los sistemas de recomendación suelen utilizar el aprendizaje supervisado.

Ejemplos de aprendizaje supervisado

Un ejemplo de aprendizaje supervisado es la detección de correo no deseado (spam). A través de estos algoritmos, es posible entrenar a los sistemas para el reconocimiento de patrones. De esta manera, se examinan los mensajes que ingresan y aquellos que se consideran spam son identificados y separados del resto.
Otro ejemplo de aprendizaje supervisado se da en el análisis de opiniones. En este marco, los algoritmos trabajan con big data, extrayendo y clasificando la información que se vuelca en  los comentarios. La inteligencia artificial permite generar conocimientos sobre las emociones e incluso el contexto.

El análisis de imágenes para la localización y categorización de objetos y el modelo predictivo para anticipar resultados que ayuden a tomar decisiones son otros ejemplos de uso del aprendizaje supervisado.

El machine learning sin supervisión

Es habitual que, al aludir al aprendizaje supervisado, también se haga referencia al aprendizaje no supervisado. La diferencia entre ambos es que el aprendizaje supervisado usa datos etiquetados, mientras que el aprendizaje no supervisado emplea datos sin etiquetar.

Lo que hace el machine learning no supervisado es buscar patrones que contribuyan a generar asociaciones o agrupaciones sin que las personas intervengan. La mezcla gaussiana, los k-medias y los modelos jerárquicos son los algoritmos más utilizados en este caso.

Cabe destacar que un tercer modelo es el aprendizaje semi-supervisado, que trabaja con un conjunto de datos etiquetados y otros sin etiquetar.

Al optar por uno u otro, debe considerarse que el aprendizaje supervisado resulta más costoso y lleva más tiempo ya que no es sencillo etiquetar los datos adecuadamente.

¿Te sirvió este artículo?

Cómo citar este artículo Julián Pérez PortoPublicado por Julián Pérez Porto, el 18 de julio de 2024. Aprendizaje supervisado - Qué es, ejemplos, definición y concepto. Disponible en https://definicion.de/aprendizaje-supervisado/
Buscar otra definición
x