Notice: This page requires JavaScript to function properly.
Please enable JavaScript in your browser settings or update your browser.
Lära Träningsmängd | Maskininlärningskoncept
Quizzes & Challenges
Quizzes
Challenges
/
Introduktion till maskininlärning med Python

bookTräningsmängd

Vid övervakad eller oövervakad inlärning presenteras träningsuppsättningen vanligtvis i tabellformat.

Ett exempel är diabetesdatasetet, som används för att förutsäga om en person har diabetes. Det innehåller poster om 768 kvinnor med parametrar såsom ålder, kroppsmassaindex och blodtryck. Dessa parametrar kallas funktioner.

Datasetet innehåller även en 'Outcome'-kolumn som anger om personen har diabetes. Detta är målvariabeln.

Varje rad i tabellen är en instans (även kallad datapunkt eller prov), som representerar information om en enskild individ.

Tabellen (träningsuppsättningen) har en målkolumn, vilket innebär att den är märkt.

Uppgiften är att träna ML-modellen på denna träningsuppsättning, och när den är tränad kan den förutsäga för andra personer (nya instanser) om de har diabetes baserat enbart på funktionerna.

Note
Notering

Denna träningsuppsättning är ett exempel på ett partiskt dataset eftersom det uteslutande innehåller information om kvinnor som är minst 21 år gamla. Därför kan modellen ge mindre tillförlitliga förutsägelser för män eller för kvinnor under 21, eftersom den inte har tränats på dessa grupper.

Vid kodning tilldelas vanligtvis funktionskolumner till X och målkolumner tilldelas som y.

Och egenskaper för nya instanser tilldelas som X_new.

question-icon

Matcha variabelnamnen med de data de vanligtvis innehåller.

X –
y –

X_new –

Click or drag`n`drop items and fill in the blanks

Var allt tydligt?

Hur kan vi förbättra det?

Tack för dina kommentarer!

Avsnitt 1. Kapitel 3

Fråga AI

expand

Fråga AI

ChatGPT

Fråga vad du vill eller prova någon av de föreslagna frågorna för att starta vårt samtal

Suggested prompts:

What is the difference between features and the target variable?

Can you explain what X, y, and X_new represent in machine learning?

How does the model use X_new to make predictions?

bookTräningsmängd

Svep för att visa menyn

Vid övervakad eller oövervakad inlärning presenteras träningsuppsättningen vanligtvis i tabellformat.

Ett exempel är diabetesdatasetet, som används för att förutsäga om en person har diabetes. Det innehåller poster om 768 kvinnor med parametrar såsom ålder, kroppsmassaindex och blodtryck. Dessa parametrar kallas funktioner.

Datasetet innehåller även en 'Outcome'-kolumn som anger om personen har diabetes. Detta är målvariabeln.

Varje rad i tabellen är en instans (även kallad datapunkt eller prov), som representerar information om en enskild individ.

Tabellen (träningsuppsättningen) har en målkolumn, vilket innebär att den är märkt.

Uppgiften är att träna ML-modellen på denna träningsuppsättning, och när den är tränad kan den förutsäga för andra personer (nya instanser) om de har diabetes baserat enbart på funktionerna.

Note
Notering

Denna träningsuppsättning är ett exempel på ett partiskt dataset eftersom det uteslutande innehåller information om kvinnor som är minst 21 år gamla. Därför kan modellen ge mindre tillförlitliga förutsägelser för män eller för kvinnor under 21, eftersom den inte har tränats på dessa grupper.

Vid kodning tilldelas vanligtvis funktionskolumner till X och målkolumner tilldelas som y.

Och egenskaper för nya instanser tilldelas som X_new.

question-icon

Matcha variabelnamnen med de data de vanligtvis innehåller.

X –
y –

X_new –

Click or drag`n`drop items and fill in the blanks

Var allt tydligt?

Hur kan vi förbättra det?

Tack för dina kommentarer!

Avsnitt 1. Kapitel 3
some-alt