TP 1 de Data-mining, GMM3, 2012

$k$-plus proches voisins

Pour cette partie, l'objectif est de coder la fonction $kppv$ qui prendra en entrée une matrice contenant les points d'apprentissage, un vecteur contenant les étiquettes de ces points, une matrice contenant les points à étiquetter (de test) et une structure de parametres. En sortie, la function renverra un vecteur d'etiquettes prédites.

Les données

Afin de tester les kppv, nous allons générer des données synthétiques en 2 dimensions (ce qui permettra de les visualiser).

La validation croisée

Pour choisir le meilleur nombre de voisin pour un problème donné, il faut utiliser une méthode de validation. Nous allons implémenter la validation croisée