Data-Mining ?
Le data-mining, au même titre que les statistiques, entre dans à peu près tous les domaines :
-
l'infini petit : la génomique
-
l'infini grand : l'astrophysique
-
le quotidien : la relation client
-
le singulier : aide au pilotage aéronautique
-
l'ouvert : le e-commerce
-
le sécuritaire : détection de fraude de carte bancaire ou sim, prévention du terrorisme
-
théorique : enquêtes en sciences humaines, études biologiques, médicales...
-
industriel : contrôle qualité, pilotage de production
-
alimentaire : études agronomiques
-
divertissement : prédiction d'audience TV
Les finalités sont :
-
compréhension et modélisation de phénomènes
-
mais surtout : aide à la décision (parfois en temps réel) en limitant la subjectivité humaine
C'est l'ensemble des méthodes et techniques destinées à l'exploration et l'analyse de (souvent grandes) bases de données informatiques, de façon automatique ou semi-automatique en vue de détecter dans ces données des règles, des associations, des tendances inconnues ou cachées, des structures particulières restituant l'essentiel de l'information utile tout en réduisant la quantité de données.
Data-mining descriptif :
Ce que l'on appelle l'exploration de données : mettre en évidence des informations présentes mais cachées par le volume.
-
Techniques de classification ou d'association (clustering).
Data-mining prédictif :
Ce que l'on appelle l'explication de données : extrapoler de nouvelles informations à partir de celles présentes.
-
Qualitatif : Techniques de classement ou discrimination (classification) ou de score (scoring)
-
Quantitatif : Techniques de prédiction ou régression (regression).