KDD

Knowledge Discovery in Databases (découverte de connaissances dans les bases de données) puis Knowledge Discovery and Data Mining (découverte de connaissances et exploration de données).

Motivation

Processus d'étude de données.

Conception

Les étapes du processus KDD
Les étapes du processus KDD

Les étapes du processus KDD sont :s1Overview of the KDD Process

  1. Compréhension métier :
    • du domaine de l'application
    • de la connaissance antérieure pertinente
    • des objectifs du client final
  2. créer un ensemble de données cible : sélectionner un ensemble de données, ou se concentrer sur un sous-ensemble de variables, ou des échantillons de données, sur lesquels la découverte doit être faite.
  3. Nettoyage et prétraitement des données
    • Suppression du bruit ou des valeurs aberrantes (outliers)
    • Recueil de l'information nécessaire pour modéliser ou expliquer le bruit
    • Stratégies pour gérer les colonnes où manquent des données
    • Expliquer la séquence temporelle et les changements connus
  4. Réduction et projection de données
    • Recherche des colonnes utiles pour représenter les données en fonction de l'objectif de la tâche.
    • Utiliser la réduction de dimensions ou des méthodes de transformation pour réduire le nombre effectif de variables prises consideration ou pour trouver des représentations invariantes des données.
    • U
  5. Choix de la tâche de data mining : Décider si l'objectif du processus KDD est la classification, la régression, le clustering, etc.
  6. Choix d(es) algorithme(s) de Data Mining
    • Sélectionner la ou les méthodes à utiliser pour rechercher des schémas dans les données.
    • Décider quels modèles et paramètres pourraient être appropriés.
    • Faire correspondre une méthode de data mining donnée avec l'ensemble des critères du processus KDD.
  7. Data mining : Rechercher des schémas intéressants dans une forme particulière de représentation ou un ensemble de ces représentations en tant que arbres ou règles de classification, regression, clustering, etc.
  8. Interpréter les schémas trouvés.
  9. Consolider la connaissance découverte.

Notes