|
LES ARBRES DE DECISION
Le but du
Data Mining est de trouver la réponse
à une question portant sur des données
que vous avez recueillies. Cette question doit être
définie dans un champ à expliquer. La
question sera de la forme: "quelles entrées,
dans ma base de données, ont une certaine valeur
pour le champ à expliquer?
Ensuite, avec l'outil de Data Mining, vous découvrez
quels critères ont un impact significatif sur
le champ à expliquer, ce qui signifie que vous
pouvez éclater la population totale en sous-populations
se comportant différemment l'une de l'autre
selon le champ à expliquer.
Les arbres de
décision sont les outils les plus rapides
et les plus faciles pour le
Data Mining .
Prenons l'exemple d'une banque. Sa base de données
contient des informations au sujet des prêts
clients à court-terme.
L'âge, les salaires, l'ancienneté, le
nombre d'enfants, etc... sont autant d'informations
présentes dans la base de données.
Un champ de la base de données, appelé
'Succès', indique si le client a eu des problèmes
pour rembourser le prêt.
Après avoir importé ces données
dans Alice d'ISoft, le responsable crédit construit
un arbre.
|
|

Noeud Parent
Noeuds Enfants
Un arbre se compose de noeuds.
Le noeud gauche est la racine
de l'arbre.
Les noeuds droits sont les feuilles.
Chaque noeud, excepté la racine possède
un noeud parent qui est lié à ses fils.
Chaque noeud contient un sous-ensemble de la population
initiale. La racine contient la population entière.
Les noeuds peuvent afficher de nombreuses
informations: le nombre
de clients, le nombre et le pourcentage de clients
qui ont eu des problèmes pour rembourser leurs
prêts (valeur N), le nombre et le pourcentage
de clients qui n'ont pas eu de problème pour
rembourser leurs prêts (valeur Y), la représentation
graphique des valeurs Y et N...etc...
|
|