CHAID

Un article de Wikipédia, l'encyclopédie libre.

CHAID (CHi-squared Automatic Interaction Detector) est une technique de type arbre de décision. Elle a été publiée, en 1980, par Gordon V. Kass. Elle peut être utilisée pour la prédiction (comme la régression linéaire) ou pour la détection d'interaction entre variables.

En pratique, elle est souvent utilisée en marketing direct pour sélectionner un groupe de consommateurs et prédire leurs réponses à certaines variables et comment ils affectent d'autres variables.

Comme avec les autres arbres de décision, ces avantages sont un résultat essentiellement visuel et facilement interprétable. À cause de la segmentation de la population lors de l'analyse, l'échantillonnage doit être suffisamment large de manière à ce que la taille de chaque groupe ne devienne pas trop petite, ce qui rendrait l'analyse peu fiable.

CHAID détecte l'interaction entre variables dans un jeu de données. En utilisant cette technique on peut établir des relations de dépendance entre variables. En prenant la lecture d'un journal, par exemple, il sera possible d'étudier l'influence de variables explicatives comme le prix, la taille, les suppléments etc. CHAID opère cela par l'identification de groupes discrets puis en prenant le lien aux variables explicatives cherchant quel serait l'impact sur la variable initiale.

CHAID est souvent utilisé comme technique d'exploration et est une alternative aux multiples régressions, en particulier quand le jeu de données n'est pas parfaitement adapté aux analyses par régression.

[modifier] Voir aussi

[modifier] Références

  • G. V. Kass. An Exploratory Technique for Investigating Large Quantities of Categorical Data. Journal of Applied Statistics, Vol. 29, No. 2 (1980), pp. 119-127.

[modifier] Liens externes

Autres langues