Kursinhalt
Erkennung Handgeschriebener Ziffern
Klassenbalance
Die Sicherstellung eines ausgewogenen Klassenverhältnisses in Machine-Learning-Datensätzen ist entscheidend, um eine Verzerrung des Modells zugunsten einer bestimmten Klasse zu vermeiden. Wenn ein Datensatz ausgewogen ist, bedeutet dies eine gerechte Repräsentation aller Klassen, was von großer Bedeutung ist. Ein unausgewogener Datensatz kann zu suboptimalen Leistungen des Modells führen, insbesondere bei der Vorhersage der Minderheitsklasse.
Betrachten Sie einen Datensatz, der Kunden-Transaktionen umfasst, bei denen 90 % legitim und nur 10 % betrügerisch sind. Das Trainieren eines Modells mit solch verzerrten Daten kann dazu führen, dass es die meisten Transaktionen als legitim einstuft. Diese Tendenz entsteht, weil das Modell darauf ausgelegt ist, den Gesamtfehler zu minimieren, und die Identifizierung der meisten Transaktionen als legitim die Genauigkeit oberflächlich verbessert.
Daher ist es unabdingbar, ein ausgewogenes Klassenverhältnis beizubehalten, um Modelle mit einer vielfältigen Stichprobe aus jeder Klasse zu trainieren und ihre Fähigkeit zu präzisen Vorhersagen insgesamt zu verbessern.
Swipe to start coding
-
Extrahiere die Ziel-Labels (Ziffernwerte) aus dem MNIST-Datensatz und weise sie der Variable
Y
zu. -
Visualisiere die Häufigkeitsverteilung der Ziffern-Labels aus dem MNIST-Datensatz, indem du ein Count-Plot erstellst.
Lösung
Danke für Ihr Feedback!