Apprentissage supervisé

Un article de Wikipédia, l'encyclopédie libre.

L'apprentissage supervisé est une technique d'apprentissage automatique où l'on cherche à produire automatiquement des règles à partir d'une base de données d'apprentissage contenant des exemples de cas déjà traités.

Plus précisément, la base de données d'apprentissage est un ensemble de couples entrée-sortie  (x_n, y_n)_{1 \le n \le N} avec  x_n \in X et  y_n \in Y , que l'on considère être tirées selon une loi sur X \times Y inconnue, par exemple xn suit une loi uniforme et yn = f(xn) + wnwn est un bruit centré.

Le but de la méthode d'apprentissage supervisé est alors d'utiliser cette base d'apprentissage afin de déterminer une représentation compacte de f notée g et appelée fonction de prédiction, qui à une nouvelle entrée x associe une sortie g(x). Le but d'un algorithme d'apprentissage supervisé est donc de généraliser pour des entrées inconnues ce qu'il a pu « apprendre » grâce aux données déjà traitées par des experts, ceci de façon « raisonnable ».


On distingue généralement deux types de problèmes que l'on cherche à résoudre avec une méthode d'apprentissage automatique supervisée :

  • Y \subset \Bbb{R} : Lorsque la sortie que l'on cherche à associer à une entrée est une valeur dans un ensemble continu de réels, on parle d'un problème de régression.
  • Y = \{1, \ldots, I\} : Lorsque l'ensemble des valeurs de sortie est de cardinal fini, on parle d'un problème de classification car le but est en fait d'attribuer une étiquette à une entrée donnée.

[modifier] Méthodes d'apprentissage supervisé

[modifier] Applications