Modèle de similarité textuelle
Un article de Wikipédia, l'encyclopédie libre.
Cet article est une ébauche concernant l’informatique.
Vous pouvez partager vos connaissances en l’améliorant. (Comment ?).
|
Un modèle de similarité textuelle est un tuple (V,R,δR,repD), avec :
- V un vocabulaire fini (ensemble des formes de surface des mots)
- R l'espace de représentation des documents
- une mesure de dissimilarité sur R (typiquement, une distance)
- la fonction de représentation qui, à chaque document, fait correspondre sa représentation.