Notice: This page requires JavaScript to function properly.
Please enable JavaScript in your browser settings or update your browser.
Lernen Trainingssatz | Konzepte des Maschinellen Lernens
ML-Einführung Mit Scikit-Learn

bookTrainingssatz

Im überwachten oder unüberwachten Lernen wird das Trainingsset üblicherweise in tabellarischer Form dargestellt.

Ein Beispiel ist der diabetes dataset, der verwendet wird, um vorherzusagen, ob eine Person an Diabetes erkrankt ist. Er enthält Datensätze von 768 Frauen mit Parametern wie Alter, Body-Mass-Index und Blutdruck. Diese Parameter werden als Features bezeichnet.

Der Datensatz enthält außerdem eine 'Outcome'-Spalte, die angibt, ob die Person Diabetes hat. Dies ist die Target-Variable.

Jede Zeile in der Tabelle ist eine Instance (auch Data Point oder Sample genannt) und repräsentiert Informationen über eine einzelne Person.

Die Tabelle (Trainingsset) enthält eine Target-Spalte, was bedeutet, dass sie gelabelt ist.

Die Aufgabe besteht darin, das ML-Modell mit diesem Trainingsset zu trainieren. Sobald es trainiert ist, kann es für andere Personen (neue Instanzen) anhand der Features vorhersagen, ob sie Diabetes haben.

Note
Hinweis

Dieses Trainingsset ist ein Beispiel für einen biased Datensatz, da es ausschließlich Informationen über Frauen ab 21 Jahren enthält. Daher kann das Modell für Männer oder für Frauen unter 21 Jahren weniger genaue Vorhersagen treffen, da es nicht mit diesen Gruppen trainiert wurde.

Beim Programmieren werden Merkmals-Spalten üblicherweise X zugewiesen und Zielspalten als y zugeordnet.

Und Merkmale neuer Instanzen werden als X_new zugewiesen.

question-icon

Ordnen Sie die Variablennamen den Daten zu, die sie üblicherweise enthalten.

X –
y –

X_new –

Click or drag`n`drop items and fill in the blanks

War alles klar?

Wie können wir es verbessern?

Danke für Ihr Feedback!

Abschnitt 1. Kapitel 3

Fragen Sie AI

expand

Fragen Sie AI

ChatGPT

Fragen Sie alles oder probieren Sie eine der vorgeschlagenen Fragen, um unser Gespräch zu beginnen

Awesome!

Completion rate improved to 3.13

bookTrainingssatz

Swipe um das Menü anzuzeigen

Im überwachten oder unüberwachten Lernen wird das Trainingsset üblicherweise in tabellarischer Form dargestellt.

Ein Beispiel ist der diabetes dataset, der verwendet wird, um vorherzusagen, ob eine Person an Diabetes erkrankt ist. Er enthält Datensätze von 768 Frauen mit Parametern wie Alter, Body-Mass-Index und Blutdruck. Diese Parameter werden als Features bezeichnet.

Der Datensatz enthält außerdem eine 'Outcome'-Spalte, die angibt, ob die Person Diabetes hat. Dies ist die Target-Variable.

Jede Zeile in der Tabelle ist eine Instance (auch Data Point oder Sample genannt) und repräsentiert Informationen über eine einzelne Person.

Die Tabelle (Trainingsset) enthält eine Target-Spalte, was bedeutet, dass sie gelabelt ist.

Die Aufgabe besteht darin, das ML-Modell mit diesem Trainingsset zu trainieren. Sobald es trainiert ist, kann es für andere Personen (neue Instanzen) anhand der Features vorhersagen, ob sie Diabetes haben.

Note
Hinweis

Dieses Trainingsset ist ein Beispiel für einen biased Datensatz, da es ausschließlich Informationen über Frauen ab 21 Jahren enthält. Daher kann das Modell für Männer oder für Frauen unter 21 Jahren weniger genaue Vorhersagen treffen, da es nicht mit diesen Gruppen trainiert wurde.

Beim Programmieren werden Merkmals-Spalten üblicherweise X zugewiesen und Zielspalten als y zugeordnet.

Und Merkmale neuer Instanzen werden als X_new zugewiesen.

question-icon

Ordnen Sie die Variablennamen den Daten zu, die sie üblicherweise enthalten.

X –
y –

X_new –

Click or drag`n`drop items and fill in the blanks

War alles klar?

Wie können wir es verbessern?

Danke für Ihr Feedback!

Abschnitt 1. Kapitel 3
some-alt