Introduction au Data Mining
CoursOutils transverses

Data-Mining ?

Domaines d'application

Le data-mining, au même titre que les statistiques, entre dans à peu près tous les domaines :

  • l'infini petit : la génomique

  • l'infini grand : l'astrophysique

  • le quotidien : la relation client

  • le singulier : aide au pilotage aéronautique

  • l'ouvert : le e-commerce

  • le sécuritaire : détection de fraude de carte bancaire ou sim, prévention du terrorisme

  • théorique : enquêtes en sciences humaines, études biologiques, médicales...

  • industriel : contrôle qualité, pilotage de production

  • alimentaire : études agronomiques

  • divertissement : prédiction d'audience TV

Finalités

Les finalités sont :

  • compréhension et modélisation de phénomènes

  • mais surtout : aide à la décision (parfois en temps réel) en limitant la subjectivité humaine

DéfinitionData-Mining

C'est l'ensemble des méthodes et techniques destinées à l'exploration et l'analyse de (souvent grandes) bases de données informatiques, de façon automatique ou semi-automatique en vue de détecter dans ces données des règles, des associations, des tendances inconnues ou cachées, des structures particulières restituant l'essentiel de l'information utile tout en réduisant la quantité de données.

Différents types

Data-mining descriptif :

Ce que l'on appelle l'exploration de données : mettre en évidence des informations présentes mais cachées par le volume.

  • Techniques de classification ou d'association (clustering).

Data-mining prédictif :

Ce que l'on appelle l'explication de données : extrapoler de nouvelles informations à partir de celles présentes.

  • Qualitatif : Techniques de classement ou discrimination (classification) ou de score (scoring)

  • Quantitatif : Techniques de prédiction ou régression (regression).

Les données (page suivante)Méthodologie générale (page Précédente)
AccueilImprimerRéalisé avec SCENARI