6. Klasyfikacje

Klasyfikacja nienadzorowana

"Klasyfikacja nienadzorowana bierze pod uwagę statystyczną dystrybucję pikseli w przestrzeni cech i różnicuje je pomiędzy klasami."

Czym jest przestrzeń cech?

Przestrzeń cech i jej wymiary definiowane są poprzez liczbę rejestrowanych kanałów (przestrzeni spektralnych). Na przykład satelita LANDSAT 7 ma sześć kanałów, tak też każdy zarejestrowany piksel (punkt obrazu) z tej satelity ma sześć różnych odcieni szarości. Taki piksel posiada charakterystyczną krzywą w przestrzeni cech z sześcioma wymiarami. Zwizualizować można maksymalnie trzy kanały (przestrzenie spektralne). Zazwyczaj jednak dwie przestrzenie spektralne będą przedstawione na wykresie (rycina poniżej). Każdy piksel posiada, ze względu na swój wektor (posiadaną wartość), konkretne miejsce w tej "przestrzeni".

Zoom Sign
Feature space
Przestrzeń cech dla kanałów 3 i 4 z satelity Landsat.


Zbiór lub też tak zwane grupy pikseli wewnątrz przestrzeni cech przedstawiają poszczególne klasy. Im bliżej siebie znajdują się piksele względem siebie w przestrzeni cech, tym bardziej są do siebie podobne i tym większe jest prawdopodobieństwo, że przynależą do tej samej klasy.

Istnieją dwie procedury klasyfikacji lub też grupowania pikseli:

  • Rozpoczynająca się na pojedynczym pikselu: piksele najbardziej do siebie podobne zostają zgrupowane razem, tak aby na koniec każdy piksel posiadał przynależność do danej klasy.
  • Rozpoczynająca się na wszystkich pikselach: celem działania jest konkretna liczba klas. Ta procedura jest nazywana łączeniem w klastry.

Dobry i rzetelny klasyfikator rozpoznaje różnice w wektorach charakterystyk i przydziela je do poszczególnych klas. Te różnice i podobieństwa prawie zawsze rozważane są poprzez trzy lub więcej wymiary.

Klasyfikacja nienadzorowana jest często traktowana jako proces przygotowawczy, na przykład jako krok prowadzący do klasyfikacji nadzorowanej. Na tym etapie można sprawdzić czy dane da się podzielić na wymaganą liczbę klas.