Apprentissage supervisé

Un article de Wikipédia, l'encyclopédie libre.

L'apprentissage supervisé est une technique d'apprentissage automatique où l'on cherche à produire automatiquement des règles à partir d'une base de données d'apprentissage contenant des exemples de cas déjà traités.

Plus précisément, la base de données d'apprentissage est un ensemble de couples entrée-sortie $(x_n, y_n)_{1 \le n \le N}$ avec $x_n \in X$ et $y_n \in Y$ , que l'on considère être tirées selon une loi sur $X \times Y$ inconnue, par exemple x_n suit une loi uniforme et y_n = f(x_n) + w_n où w_n est un bruit centré.

Le but de la méthode d'apprentissage supervisé est alors d'utiliser cette base d'apprentissage afin de déterminer une représentation compacte de f notée g et appelée fonction de prédiction, qui à une nouvelle entrée x associe une sortie g(x). Le but d'un algorithme d'apprentissage supervisé est donc de généraliser pour des entrées inconnues ce qu'il a pu « apprendre » grâce aux données déjà traitées par des experts, ceci de façon « raisonnable ».

On distingue généralement deux types de problèmes que l'on cherche à résoudre avec une méthode d'apprentissage automatique supervisée :

$Y \subset \Bbb{R}$ : Lorsque la sortie que l'on cherche à associer à une entrée est une valeur dans un ensemble continu de réels, on parle d'un problème de régression.
$Y = \{1, \ldots, I\}$ : Lorsque l'ensemble des valeurs de sortie est de cardinal fini, on parle d'un problème de classification car le but est en fait d'attribuer une étiquette à une entrée donnée.