PDA

View Full Version : [Frage] bsp 2.1 - knn


seimen
14-04-2006, 13:44
wie bringe ich hier einen testvektor mit den trainingsvektoren in beziehung? geht das über die mahalanobis-distanz oder gibt es da auch eine einfachere lösung?


mein erster ansatz war für jeden testvektor die differenz der einzelnen features zu den features der trainingsvektoren zu berechnen. dadurch krieg ich 75x5 (bzw 75x4) werte/testvektor , wo ich mir dann für jede spalte die (k) nähesten raussuchen kann. aber wie gehts dann weiter?

buschti
14-04-2006, 16:01
wie bringe ich hier einen testvektor mit den trainingsvektoren in beziehung? geht das über die mahalanobis-distanz oder gibt es da auch eine einfachere lösung?


mein erster ansatz war für jeden testvektor die differenz der einzelnen features zu den features der trainingsvektoren zu berechnen. dadurch krieg ich 75x5 (bzw 75x4) werte/testvektor , wo ich mir dann für jede spalte die (k) nähesten raussuchen kann. aber wie gehts dann weiter?

Bin mir nicht ganz sicher was Du meinst, aber pro Trainingsvektor/TestVektor-Paar bekommst du einen skalaren Wert als Distanz (euklid. Distanz).
Für ein Trainingsset mit 75 Samples bekommst du pro Sample, daß du im Testset klassifizieren willst, 75 euklidische Distanzen. Und davon schaust Du Dir die Klassenzugehörigkeiten der k kleinsten Distanzen an -> das Sample wird zu der Klasse gezählt, die in den k kleinsten Distanzen am häufigsten vorkommt.

lg
Sebastian (EFME-Tutor)