Notice: This page requires JavaScript to function properly.
Please enable JavaScript in your browser settings or update your browser.
Lære Hvad er Random Forest | Random Forest
Klassifikation med Python

Hvad er Random Forest

Stryg for at vise menuen

Random Forest er en algoritme, der anvendes bredt til klassifikations- og regressionsproblemer. Den opbygger mange forskellige beslutningstræer og tager deres flertalsafgørelse ved klassifikation og gennemsnit i tilfælde af regression.

Skovfisk

I stedet for at bruge ét enkelt bedste træ, opbygger Random Forest mange "svagere" træer. Det kan lyde kontraintuitivt – hvorfor bruge modeller, der er dårligere?

Forestil dig det sådan: Et enkelt beslutningstræ er som en generalist – det forsøger at tage højde for alle egenskaber og give et fuldstændigt billede. Det kan dog blive for selvsikkert og begå fejl ved at overtilpasse til støj i dataene.

En Random Forest er derimod som et team af specialister. Hvert træ trænes på forskellige dele af dataene og fokuserer på forskellige aspekter af problemet. Alene er hvert træ måske ikke særlig stærkt – det kan endda overse det store billede. Men sammen, når du kombinerer deres "stemmer", dækker de hinandens svagheder og giver en mere balanceret, præcis forudsigelse.

Du kan også sammenligne det med at spørge 100 kompetente studerende i stedet for at stole på en enkelt professor. Selvom professoren måske er mere vidende, kan selv eksperter være forudindtagede eller blive vildledt. Men hvis flertallet af studerende uafhængigt når frem til det samme svar, er denne konsensus ofte mere robust.

I praksis fungerer det meget godt at kombinere mange svagere beslutningstræer til en stærk Random Forest, og det overgår ofte et optimeret individuelt beslutningstræ på store datasæt. Beslutningsgrænsen for en Random Forest er mere glidende og generaliserer bedre til nye data end et enkelt beslutningstræ, så Random Forests er mindre tilbøjelige til overtilpasning.

dt vs rf grænser

Dog vil nøjagtigheden ikke blive forbedret, hvis vi kombinerer mange modeller, der begår de samme fejl. For at denne tilgang skal være effektiv, bør modellerne være så forskellige fra hinanden som muligt, så de laver forskellige fejl.

forskellig
question mark

Random Forest-algoritmen kombinerer flere svagere beslutningstræer i en enkelt model, som typisk overgår det bedste enkelte beslutningstræ. Er denne påstand korrekt?

Vælg det korrekte svar

Var alt klart?

Hvordan kan vi forbedre det?

Tak for dine kommentarer!

Sektion 4. Kapitel 1

Spørg AI

expand

Spørg AI

ChatGPT

Spørg om hvad som helst eller prøv et af de foreslåede spørgsmål for at starte vores chat

Sektion 4. Kapitel 1
some-alt