Datentypen
Jede Spalte (Feature) in einem Trainingsdatensatz besitzt einen zugehörigen Datentyp. Diese Datentypen lassen sich in numerisch, kategorisch sowie Datum und/oder Zeit gruppieren.
Leider funktionieren die meisten ML-Algorithmen nur gut mit Zahlen. Daher benötigen wir eine Möglichkeit, kategoriale Daten sowie Datums- und Zeitangaben in Zahlen umzuwandeln.
Bezüglich Datum und Zeit können Sie Merkmale wie 'year'
, 'month'
usw. entsprechend Ihrer Aufgabe verwenden. Diese Merkmale sind numerische Werte und stellen daher kein Problem dar.
Mit kategorialen Daten ist die Verarbeitung etwas anspruchsvoller.
Arten von kategorialen Daten
Kategoriale Daten werden in zwei Typen unterteilt:
-
Ordinale Daten sind eine Art von kategorialen Daten, bei denen die Kategorien einer natürlichen Reihenfolge folgen. Zum Beispiel Bildungsniveau (von Grundschule bis Promotion) oder Bewertungen (von sehr schlecht bis sehr gut) usw.;
-
Nominale Daten sind eine Art von kategorialen Daten, die keiner natürlichen Reihenfolge folgen. Zum Beispiel Name, Geschlecht, Herkunftsland usw.
Wie Sie in späteren Kapiteln sehen werden, unterscheidet sich die Umwandlung von ordinalen und nominalen Datentypen in numerische Werte, weshalb wir sie voneinander trennen müssen.
Danke für Ihr Feedback!
Fragen Sie AI
Fragen Sie AI
Fragen Sie alles oder probieren Sie eine der vorgeschlagenen Fragen, um unser Gespräch zu beginnen
Awesome!
Completion rate improved to 3.13
Datentypen
Swipe um das Menü anzuzeigen
Jede Spalte (Feature) in einem Trainingsdatensatz besitzt einen zugehörigen Datentyp. Diese Datentypen lassen sich in numerisch, kategorisch sowie Datum und/oder Zeit gruppieren.
Leider funktionieren die meisten ML-Algorithmen nur gut mit Zahlen. Daher benötigen wir eine Möglichkeit, kategoriale Daten sowie Datums- und Zeitangaben in Zahlen umzuwandeln.
Bezüglich Datum und Zeit können Sie Merkmale wie 'year'
, 'month'
usw. entsprechend Ihrer Aufgabe verwenden. Diese Merkmale sind numerische Werte und stellen daher kein Problem dar.
Mit kategorialen Daten ist die Verarbeitung etwas anspruchsvoller.
Arten von kategorialen Daten
Kategoriale Daten werden in zwei Typen unterteilt:
-
Ordinale Daten sind eine Art von kategorialen Daten, bei denen die Kategorien einer natürlichen Reihenfolge folgen. Zum Beispiel Bildungsniveau (von Grundschule bis Promotion) oder Bewertungen (von sehr schlecht bis sehr gut) usw.;
-
Nominale Daten sind eine Art von kategorialen Daten, die keiner natürlichen Reihenfolge folgen. Zum Beispiel Name, Geschlecht, Herkunftsland usw.
Wie Sie in späteren Kapiteln sehen werden, unterscheidet sich die Umwandlung von ordinalen und nominalen Datentypen in numerische Werte, weshalb wir sie voneinander trennen müssen.
Danke für Ihr Feedback!