Modèle de similarité textuelle

Un article de Wikipédia, l'encyclopédie libre.

Un modèle de similarité textuelle est un tuple (V,RR,repD), avec :

  • V un vocabulaire fini m_1, \ldots, m_{|V|} (ensemble des formes de surface des mots)
  • R l'espace de représentation des documents
  • \delta_{R}: R \times R \to \mathbb{R}^+ une mesure de dissimilarité sur R (typiquement, une distance)
  • \mathrm{rep}_D: V^* \to R la fonction de représentation qui, à chaque document, fait correspondre sa représentation.