Mehrklassenklassifikation
Mehrklassenklassifikation mit k-NN ist genauso einfach wie die binäre Klassifikation. Es wird einfach die Klasse gewählt, die in der Nachbarschaft überwiegt.
Der KNeighborsClassifier führt automatisch eine Mehrklassenklassifikation durch, wenn y mehr als zwei Merkmale enthält, sodass keine Änderungen erforderlich sind. Das Einzige, was sich ändert, ist die y-Variable, die an die .fit()-Methode übergeben wird.
Nun wird eine Mehrklassenklassifikation mit k-NN durchgeführt. Betrachten Sie dazu den folgenden Datensatz:
1234import pandas as pd df = pd.read_csv('https://codefinity-content-media.s3.eu-west-1.amazonaws.com/b71ff7ac-3932-41d2-a4d8-060e24b00129/starwars_multiple.csv') print(df.head())
Es ist dasselbe wie im Beispiel des vorherigen Kapitels, aber nun kann das Ziel drei Werte annehmen:
- 0: "Fand ich schrecklich" (Bewertung ist weniger als 3/5);
- 1: "Geht so" (Bewertung zwischen 3/5 und 4/5);
- 2: "Fand ich gut" (Bewertung ist 4/5 oder höher).
Swipe to start coding
Das Star Wars-Bewertungsdatenset ist als DataFrame in der Variablen df gespeichert.
- Einen geeigneten Skalierer initialisieren und in der Variablen
scalerspeichern. - Die Skalierungsparameter anhand der Trainingsdaten berechnen, die Daten skalieren und das Ergebnis in der Variablen
X_trainspeichern. - Die Testdaten skalieren und das Ergebnis in der Variablen
X_testspeichern. - Eine Instanz des k-NN mit
13Nachbarn erstellen, auf dem Trainingsdatensatz trainieren und in der Variablenknnspeichern. - Vorhersagen für den Testdatensatz treffen und in der Variablen
y_predspeichern.
Lösung
Danke für Ihr Feedback!
single
Fragen Sie AI
Fragen Sie AI
Fragen Sie alles oder probieren Sie eine der vorgeschlagenen Fragen, um unser Gespräch zu beginnen
Großartig!
Completion Rate verbessert auf 3.33
Mehrklassenklassifikation
Swipe um das Menü anzuzeigen
Mehrklassenklassifikation mit k-NN ist genauso einfach wie die binäre Klassifikation. Es wird einfach die Klasse gewählt, die in der Nachbarschaft überwiegt.
Der KNeighborsClassifier führt automatisch eine Mehrklassenklassifikation durch, wenn y mehr als zwei Merkmale enthält, sodass keine Änderungen erforderlich sind. Das Einzige, was sich ändert, ist die y-Variable, die an die .fit()-Methode übergeben wird.
Nun wird eine Mehrklassenklassifikation mit k-NN durchgeführt. Betrachten Sie dazu den folgenden Datensatz:
1234import pandas as pd df = pd.read_csv('https://codefinity-content-media.s3.eu-west-1.amazonaws.com/b71ff7ac-3932-41d2-a4d8-060e24b00129/starwars_multiple.csv') print(df.head())
Es ist dasselbe wie im Beispiel des vorherigen Kapitels, aber nun kann das Ziel drei Werte annehmen:
- 0: "Fand ich schrecklich" (Bewertung ist weniger als 3/5);
- 1: "Geht so" (Bewertung zwischen 3/5 und 4/5);
- 2: "Fand ich gut" (Bewertung ist 4/5 oder höher).
Swipe to start coding
Das Star Wars-Bewertungsdatenset ist als DataFrame in der Variablen df gespeichert.
- Einen geeigneten Skalierer initialisieren und in der Variablen
scalerspeichern. - Die Skalierungsparameter anhand der Trainingsdaten berechnen, die Daten skalieren und das Ergebnis in der Variablen
X_trainspeichern. - Die Testdaten skalieren und das Ergebnis in der Variablen
X_testspeichern. - Eine Instanz des k-NN mit
13Nachbarn erstellen, auf dem Trainingsdatensatz trainieren und in der Variablenknnspeichern. - Vorhersagen für den Testdatensatz treffen und in der Variablen
y_predspeichern.
Lösung
Danke für Ihr Feedback!
single