Notice: This page requires JavaScript to function properly.
Please enable JavaScript in your browser settings or update your browser.
Lernen Datentypen | Konzepte des Maschinellen Lernens
ML-Einführung Mit Scikit-Learn

bookDatentypen

Jede Spalte (Feature) in einem Trainingsdatensatz besitzt einen zugehörigen Datentyp. Diese Datentypen lassen sich in numerisch, kategorisch sowie Datum und/oder Zeit gruppieren.

Leider funktionieren die meisten ML-Algorithmen nur gut mit Zahlen. Daher benötigen wir eine Möglichkeit, kategoriale Daten sowie Datums- und Zeitangaben in Zahlen umzuwandeln.

Bezüglich Datum und Zeit können Sie Merkmale wie 'year', 'month' usw. entsprechend Ihrer Aufgabe verwenden. Diese Merkmale sind numerische Werte und stellen daher kein Problem dar.

Mit kategorialen Daten ist die Verarbeitung etwas anspruchsvoller.

Arten von kategorialen Daten

Kategoriale Daten werden in zwei Typen unterteilt:

  • Ordinale Daten sind eine Art von kategorialen Daten, bei denen die Kategorien einer natürlichen Reihenfolge folgen. Zum Beispiel Bildungsniveau (von Grundschule bis Promotion) oder Bewertungen (von sehr schlecht bis sehr gut) usw.;

  • Nominale Daten sind eine Art von kategorialen Daten, die keiner natürlichen Reihenfolge folgen. Zum Beispiel Name, Geschlecht, Herkunftsland usw.

Wie Sie in späteren Kapiteln sehen werden, unterscheidet sich die Umwandlung von ordinalen und nominalen Datentypen in numerische Werte, weshalb wir sie voneinander trennen müssen.

question-icon

Ordnen Sie das Merkmal und seinen Datentyp zu.

Price (100, 235) –
Color (blue, orange) –

Academic grades (A, B, C, and so on) –

Click or drag`n`drop items and fill in the blanks

War alles klar?

Wie können wir es verbessern?

Danke für Ihr Feedback!

Abschnitt 1. Kapitel 4

Fragen Sie AI

expand

Fragen Sie AI

ChatGPT

Fragen Sie alles oder probieren Sie eine der vorgeschlagenen Fragen, um unser Gespräch zu beginnen

Awesome!

Completion rate improved to 3.13

bookDatentypen

Swipe um das Menü anzuzeigen

Jede Spalte (Feature) in einem Trainingsdatensatz besitzt einen zugehörigen Datentyp. Diese Datentypen lassen sich in numerisch, kategorisch sowie Datum und/oder Zeit gruppieren.

Leider funktionieren die meisten ML-Algorithmen nur gut mit Zahlen. Daher benötigen wir eine Möglichkeit, kategoriale Daten sowie Datums- und Zeitangaben in Zahlen umzuwandeln.

Bezüglich Datum und Zeit können Sie Merkmale wie 'year', 'month' usw. entsprechend Ihrer Aufgabe verwenden. Diese Merkmale sind numerische Werte und stellen daher kein Problem dar.

Mit kategorialen Daten ist die Verarbeitung etwas anspruchsvoller.

Arten von kategorialen Daten

Kategoriale Daten werden in zwei Typen unterteilt:

  • Ordinale Daten sind eine Art von kategorialen Daten, bei denen die Kategorien einer natürlichen Reihenfolge folgen. Zum Beispiel Bildungsniveau (von Grundschule bis Promotion) oder Bewertungen (von sehr schlecht bis sehr gut) usw.;

  • Nominale Daten sind eine Art von kategorialen Daten, die keiner natürlichen Reihenfolge folgen. Zum Beispiel Name, Geschlecht, Herkunftsland usw.

Wie Sie in späteren Kapiteln sehen werden, unterscheidet sich die Umwandlung von ordinalen und nominalen Datentypen in numerische Werte, weshalb wir sie voneinander trennen müssen.

question-icon

Ordnen Sie das Merkmal und seinen Datentyp zu.

Price (100, 235) –
Color (blue, orange) –

Academic grades (A, B, C, and so on) –

Click or drag`n`drop items and fill in the blanks

War alles klar?

Wie können wir es verbessern?

Danke für Ihr Feedback!

Abschnitt 1. Kapitel 4
some-alt