Précision et rappel

Un article de Wikipédia, l'encyclopédie libre.

Lorsqu’une personne interroge une base de donnée (que ce soit un logiciel documentaire ou un moteur de recherche) elle attend un ensemble de réponses (sous forme de documents) égal ou supérieur à un. A partir de cet ensemble de réponses mis en regard de l’attente de l’utilisateur on peut établir la valeur de la base de donnée. Les critères en sont le rappel et la précision.

[modifier] Le rappel

Le rappel est défini par le nombre de documents pertinents retrouvés au regard du nombre de documents pertinents que possède la base de donnée. Cela signifie que lorsque l’utilisateur interroge la base il souhaite voir apparaître tous les documents qui pourraient répondre à son besoin d'information. Si cette adéquation entre le questionnement de l’utilisateur et le nombre de documents présentés est importante alors le taux de rappel est élevé. A l’inverse si le système possède de nombreux documents intéressants mais que ceux-ci n’apparaissent pas on parle de silence. Le silence s’oppose au rappel.

[modifier] La précision

La précision est le nombre de documents pertinents retrouvés rapporté au nombre de documents (pertinents ou non) retrouvés. Si l’utilisateur interroge une base de données, il souhaite ne voir que les documents qui répondent à son attente. Tous les documents superflus constituent du bruit. La précision s’oppose à ce bruit documentaire. Si elle est élevée, cela signifie que peu de documents inutiles sont présentés par le système.

[modifier] Exemples

Si une personne s’intéresse aux chats siamois et que dans une barre de recherche d’une interface de base de données elle tape « chat siamois », les documents qui ont été indexés avec pour seul terme le mot « chat » n’apparaîtront pas. Or certains de ces documents pourraient être pertinents. Cela va donc produire un silence documentaire et la valeur du rappel diminuera d’autant. Inversement si pour pallier ce risque la personne tape seulement « chat », alors qu’elle s’intéresse seulement aux chats siamois, le système lui présentera des documents dans lesquels les chats siamois ne sont pas mentionnés (ce pourra être les momies de chat en Égypte voire la vie du poisson chat). La précision sera faible et le bruit important.

Autres langues