Notice: This page requires JavaScript to function properly.
Please enable JavaScript in your browser settings or update your browser.
Lära Sammanfattning | Jämföra Modeller
Klassificering med Python

Sammanfattning

Svep för att visa menyn

Sammanfattningsvis har du lärt dig fyra algoritmer: k-NN, logistisk regression, beslutsträd och random forest. Var och en har sina egna fördelar och nackdelar, vilka diskuterades i slutet av respektive avsnitt.

Följande visualisering visar hur varje algoritm presterar på olika syntetiska datamängder:

jämför modeller3

Här gäller att ju djupare färg, desto mer säker är modellen i sina förutsägelser.

Du kommer att märka att varje datamängd har en olika modell som presterar bäst. Det är svårt att veta i förväg vilken modell som fungerar bättre, så det bästa tillvägagångssättet är att prova flera. Det är idén bakom No Free Lunch Theorem.

I vissa situationer kan dock din förståelse av algoritmerna hjälpa dig att utesluta vissa modeller i förväg om de inte passar uppgiften.

Till exempel gäller detta för logistisk regression (utan att använda PolynomialFeatures), som vi vet skapar en linjär beslutsgräns. Så genom att titta på komplexiteten i den andra datamängden i bilden kan vi förutse att den inte skulle prestera bra.

Ett annat exempel är om din uppgift kräver extremt snabb prediktion – till exempel vid realtidsförutsägelser i en app – då är k-NN ett dåligt val. Detsamma gäller för en random forest med många beslutsträd. Du kan minska antalet träd med parametern n_estimators för att förbättra hastigheten, men det kan ske på bekostnad av lägre prestanda.

Följande tabell kan hjälpa dig att förstå vilket förbehandlingssteg som krävs innan du tränar varje modell, och hur modellens prestanda påverkas när antalet variabler eller instanser ökar:

  • n – antal instanser (exempel);
  • m – antal funktioner;
  • t – antal träd i en Random Forest;
  • k – antal grannar i k-NN;
  • * Skalning krävs inte om penalty=None i logistisk regression;
  • ** PolynomialFeatures lägger till fler funktioner, så det effektiva antalet funktioner m ökar.
question mark

Vilken modell använder flera beslutsträd för att göra en prediktion?

Vänligen välj det korrekta svaret

Var allt tydligt?

Hur kan vi förbättra det?

Tack för dina kommentarer!

Avsnitt 5. Kapitel 4

Fråga AI

expand

Fråga AI

ChatGPT

Fråga vad du vill eller prova någon av de föreslagna frågorna för att starta vårt samtal

Avsnitt 5. Kapitel 4
some-alt