3. Qu'est-ce que la classification ?

La classification est le processus d'allocation d'objets à une classe, au choix dans un nombre discret de classes, basées sur les données et informations disponibles sur l'objet et en accord avec certaines règles qui permettent de créer des surfaces de décision entre les classes. Habituellement, les classes sont physiquement significatives. Ainsi, la couleur peut être utilisée pour différencier les oranges, citrons et pommes dans une usine d'emballage, ou des données d'une bande spectrale peuvent être utilisées pour créer une carte de couverture du sol à partir d'une image satellite.

Zoom Sign
Scattergrams
Distributions typiques pour des données d'images satellite à 4 bandes.

La classification implique la définition de classes, généralement en définissant des aires d'entrainement pour chaque classe, ou automatiquement à partir des données elles-mêmes. Il faut ensuite fixer les règles qui définissent les surfaces de décision qui permettent que classificateur de décider quelles valeurs de données appartiennent quelles classes. Finalement, il faut effectuer la classification proprement dite.

Zoom Sign
Process of classification
Le processus de classification

Les classes peuvent être définies de deux manières. D'un côté, on peut identifiez des zones typiques de chaque classes et les utiliser comme aires d'entrainement afin d'obtenir les statistiques des classes. De l'autre, on peut utiliser un algorithme de clusterisation pour identifier les clusters (groupes similaires) dans les données, et d'obtenir les statistiques pour chaque cluster. La première méthode est appelée " classification supervisée ", la deuxième est la " classification non-supervisée ".

Zoom Sign
Scattergrams
1 - Définir les classes et les statistiques par classe ; 2- Sélectionner la FDP à utiliser afin d'utiliser les probabilités pour définir les surfaces de décision des classes ; 3- Utiliser les données des aires d'entrainement pour ajuster les paramètres de la FDP, et ce faisant définir les surfaces de décision, et donc les domaines de chaque classe.

Il y a de nombreuses façons de faire cela. Nous allons ici nous concentrer sur les méthodes paramétriques, qui supposent que les données d'une classe respectent un modèle standard, généralement la distribution normale.

Zoom Sign
Process of classification
La signification physique des classes de couverture de sol représentées dans un des graphiques repris plus haut. La position d'une couverture de sol dans chaque distribution dépend de la réflectance typique du type de couverture de sol dans la bande d'ondes du graphique.