Notice: This page requires JavaScript to function properly.
Please enable JavaScript in your browser settings or update your browser.
Lernen Non-Maximum Suppression (NMS) | Objekterkennung
Computer Vision Essentials
course content

Kursinhalt

Computer Vision Essentials

Computer Vision Essentials

1. Einführung in die Computer Vision
2. Bildverarbeitung mit OpenCV
3. Convolutional Neural Networks
4. Objekterkennung
5. Überblick Über Fortgeschrittene Themen

book
Non-Maximum Suppression (NMS)

Objekterkennungsmodelle sagen häufig mehrere überlappende Begrenzungsrahmen für dasselbe Objekt voraus. Dies geschieht, weil Modelle ein Bild auf verschiedenen Skalen und Positionen analysieren, was zu redundanten Vorhersagen führt. Non-Max Suppression (NMS) ist ein entscheidender Nachbearbeitungsschritt, der diese Erkennungen verfeinert, indem die relevantesten Begrenzungsrahmen ausgewählt und unnötige verworfen werden.

Warum mehrere überlappende Rahmen entstehen

Objektdetektoren sagen für ein einzelnes Objekt mehrere Begrenzungsrahmen voraus aufgrund von:

  • Ankerboxen: Einige Modelle wie Faster R-CNN und YOLO verwenden vordefinierte Ankerboxen unterschiedlicher Größen, was zu mehrfachen Erkennungen desselben Objekts führt;

  • Sliding-Window-Ansätzen: Einige Erkennungsmethoden analysieren ein Bild in kleinen Regionen, wodurch wiederholte Erkennungen eines Objekts in überlappenden Bereichen entstehen;

  • Hohe Konfidenzwerte: Das Modell weist jeder Vorhersage einen Konfidenzwert zu, und ähnliche Vorhersagen mit hoher Konfidenz können sich stark überlappen.

Wenn diese redundanten Rahmen nicht gefiltert werden, kann dies die Leistung der Objekterkennung negativ beeinflussen, indem die Rechenkomplexität erhöht und die Objektanzahl unzuverlässig wird.

Funktionsweise von Non-Max Suppression

NMS wird angewendet, um doppelte Erkennungen zu entfernen und dabei den Begrenzungsrahmen mit der höchsten Konfidenz beizubehalten. Das Verfahren umfasst folgende Schritte:

  • Sortierung nach Score: Alle vorhergesagten Begrenzungsrahmen werden absteigend nach ihren Konfidenzwerten sortiert;

  • Auswahl des besten Rahmens: Der Rahmen mit dem höchsten Wert wird ausgewählt und zur endgültigen Liste der Erkennungen hinzugefügt;

  • IoU-Berechnung: Die Intersection Over Union (IoU) zwischen dem ausgewählten Rahmen und allen verbleibenden Rahmen wird berechnet;

  • Schwellwertsetzung: Rahmen, deren IoU über einem festgelegten Schwellenwert liegt (z. B. 0,5), werden unterdrückt (entfernt), da sie wahrscheinlich dasselbe Objekt darstellen;

  • Wiederholung: Dieser Prozess wird für den jeweils nächsthöchst bewerteten Rahmen fortgesetzt, bis alle Rahmen verarbeitet wurden.

Soft-NMS: Eine intelligentere Alternative

Standard-NMS entfernt alle überlappenden Boxen oberhalb eines bestimmten IoU-Schwellenwerts, wodurch manchmal nützliche Erkennungen verloren gehen können. Soft-NMS verbessert dieses Verfahren, indem es die Konfidenzwerte der überlappenden Boxen reduziert, anstatt sie vollständig zu entfernen. Diese Methode ermöglicht einen sanfteren Unterdrückungsprozess und kann die Erkennungsleistung in Szenarien mit vielen Objekten verbessern.

Zentrale Unterschiede zwischen Standard-NMS und Soft-NMS:

  • Standard-NMS: entfernt überlappende Boxen oberhalb des IoU-Schwellenwerts;

  • Soft-NMS: reduziert die Konfidenzwerte überlappender Boxen anstatt sie zu eliminieren, was die Erkennung teilweise verdeckter Objekte flexibler macht.

Ausgleich zwischen Genauigkeit und Geschwindigkeit bei NMS

Die Wahl des richtigen IoU-Schwellenwerts ist entscheidend:

  • Höhere Schwellenwerte (z. B. 0,6 - 0,7): aggressivere Filterung, es bleiben nur die Boxen mit der höchsten Konfidenz erhalten, wodurch jedoch einige gültige Erkennungen verloren gehen können;

  • Niedrigere Schwellenwerte (z. B. 0,3 - 0,4): mehr überlappende Boxen bleiben erhalten, was in überfüllten Szenen nützlich sein kann, jedoch die Anzahl der Fehlalarme erhöhen kann.

Der Einsatz optimierter Implementierungen, wie die integrierten NMS-Funktionen von TensorFlow oder OpenCV, kann die Verarbeitung für Echtzeitanwendungen beschleunigen.

Non-Max Suppression ist eine zentrale Technik in der Objekterkennung, um redundante Begrenzungsrahmen zu entfernen und die Modellgenauigkeit zu verbessern. Standard-NMS eliminiert effizient doppelte Erkennungen, während Soft-NMS den Prozess durch Anpassung der Konfidenzwerte verfeinert, anstatt sie vollständig zu entfernen. Durch die Feinabstimmung der IoU-Schwellenwerte lässt sich ein ausgewogenes Verhältnis zwischen Erkennungsgenauigkeit und Recheneffizienz erzielen.

1. Was ist der Hauptzweck von Non-Max Suppression (NMS) in der Objekterkennung?

2. Wie entscheidet das Standard-NMS, welche Begrenzungsrahmen unterdrückt werden?

3. Was ist der Hauptunterschied zwischen Standard-NMS und Soft-NMS?

question mark

Was ist der Hauptzweck von Non-Max Suppression (NMS) in der Objekterkennung?

Select the correct answer

question mark

Wie entscheidet das Standard-NMS, welche Begrenzungsrahmen unterdrückt werden?

Select the correct answer

question mark

Was ist der Hauptunterschied zwischen Standard-NMS und Soft-NMS?

Select the correct answer

War alles klar?

Wie können wir es verbessern?

Danke für Ihr Feedback!

Abschnitt 4. Kapitel 5

Fragen Sie AI

expand
ChatGPT

Fragen Sie alles oder probieren Sie eine der vorgeschlagenen Fragen, um unser Gespräch zu beginnen

course content

Kursinhalt

Computer Vision Essentials

Computer Vision Essentials

1. Einführung in die Computer Vision
2. Bildverarbeitung mit OpenCV
3. Convolutional Neural Networks
4. Objekterkennung
5. Überblick Über Fortgeschrittene Themen

book
Non-Maximum Suppression (NMS)

Objekterkennungsmodelle sagen häufig mehrere überlappende Begrenzungsrahmen für dasselbe Objekt voraus. Dies geschieht, weil Modelle ein Bild auf verschiedenen Skalen und Positionen analysieren, was zu redundanten Vorhersagen führt. Non-Max Suppression (NMS) ist ein entscheidender Nachbearbeitungsschritt, der diese Erkennungen verfeinert, indem die relevantesten Begrenzungsrahmen ausgewählt und unnötige verworfen werden.

Warum mehrere überlappende Rahmen entstehen

Objektdetektoren sagen für ein einzelnes Objekt mehrere Begrenzungsrahmen voraus aufgrund von:

  • Ankerboxen: Einige Modelle wie Faster R-CNN und YOLO verwenden vordefinierte Ankerboxen unterschiedlicher Größen, was zu mehrfachen Erkennungen desselben Objekts führt;

  • Sliding-Window-Ansätzen: Einige Erkennungsmethoden analysieren ein Bild in kleinen Regionen, wodurch wiederholte Erkennungen eines Objekts in überlappenden Bereichen entstehen;

  • Hohe Konfidenzwerte: Das Modell weist jeder Vorhersage einen Konfidenzwert zu, und ähnliche Vorhersagen mit hoher Konfidenz können sich stark überlappen.

Wenn diese redundanten Rahmen nicht gefiltert werden, kann dies die Leistung der Objekterkennung negativ beeinflussen, indem die Rechenkomplexität erhöht und die Objektanzahl unzuverlässig wird.

Funktionsweise von Non-Max Suppression

NMS wird angewendet, um doppelte Erkennungen zu entfernen und dabei den Begrenzungsrahmen mit der höchsten Konfidenz beizubehalten. Das Verfahren umfasst folgende Schritte:

  • Sortierung nach Score: Alle vorhergesagten Begrenzungsrahmen werden absteigend nach ihren Konfidenzwerten sortiert;

  • Auswahl des besten Rahmens: Der Rahmen mit dem höchsten Wert wird ausgewählt und zur endgültigen Liste der Erkennungen hinzugefügt;

  • IoU-Berechnung: Die Intersection Over Union (IoU) zwischen dem ausgewählten Rahmen und allen verbleibenden Rahmen wird berechnet;

  • Schwellwertsetzung: Rahmen, deren IoU über einem festgelegten Schwellenwert liegt (z. B. 0,5), werden unterdrückt (entfernt), da sie wahrscheinlich dasselbe Objekt darstellen;

  • Wiederholung: Dieser Prozess wird für den jeweils nächsthöchst bewerteten Rahmen fortgesetzt, bis alle Rahmen verarbeitet wurden.

Soft-NMS: Eine intelligentere Alternative

Standard-NMS entfernt alle überlappenden Boxen oberhalb eines bestimmten IoU-Schwellenwerts, wodurch manchmal nützliche Erkennungen verloren gehen können. Soft-NMS verbessert dieses Verfahren, indem es die Konfidenzwerte der überlappenden Boxen reduziert, anstatt sie vollständig zu entfernen. Diese Methode ermöglicht einen sanfteren Unterdrückungsprozess und kann die Erkennungsleistung in Szenarien mit vielen Objekten verbessern.

Zentrale Unterschiede zwischen Standard-NMS und Soft-NMS:

  • Standard-NMS: entfernt überlappende Boxen oberhalb des IoU-Schwellenwerts;

  • Soft-NMS: reduziert die Konfidenzwerte überlappender Boxen anstatt sie zu eliminieren, was die Erkennung teilweise verdeckter Objekte flexibler macht.

Ausgleich zwischen Genauigkeit und Geschwindigkeit bei NMS

Die Wahl des richtigen IoU-Schwellenwerts ist entscheidend:

  • Höhere Schwellenwerte (z. B. 0,6 - 0,7): aggressivere Filterung, es bleiben nur die Boxen mit der höchsten Konfidenz erhalten, wodurch jedoch einige gültige Erkennungen verloren gehen können;

  • Niedrigere Schwellenwerte (z. B. 0,3 - 0,4): mehr überlappende Boxen bleiben erhalten, was in überfüllten Szenen nützlich sein kann, jedoch die Anzahl der Fehlalarme erhöhen kann.

Der Einsatz optimierter Implementierungen, wie die integrierten NMS-Funktionen von TensorFlow oder OpenCV, kann die Verarbeitung für Echtzeitanwendungen beschleunigen.

Non-Max Suppression ist eine zentrale Technik in der Objekterkennung, um redundante Begrenzungsrahmen zu entfernen und die Modellgenauigkeit zu verbessern. Standard-NMS eliminiert effizient doppelte Erkennungen, während Soft-NMS den Prozess durch Anpassung der Konfidenzwerte verfeinert, anstatt sie vollständig zu entfernen. Durch die Feinabstimmung der IoU-Schwellenwerte lässt sich ein ausgewogenes Verhältnis zwischen Erkennungsgenauigkeit und Recheneffizienz erzielen.

1. Was ist der Hauptzweck von Non-Max Suppression (NMS) in der Objekterkennung?

2. Wie entscheidet das Standard-NMS, welche Begrenzungsrahmen unterdrückt werden?

3. Was ist der Hauptunterschied zwischen Standard-NMS und Soft-NMS?

question mark

Was ist der Hauptzweck von Non-Max Suppression (NMS) in der Objekterkennung?

Select the correct answer

question mark

Wie entscheidet das Standard-NMS, welche Begrenzungsrahmen unterdrückt werden?

Select the correct answer

question mark

Was ist der Hauptunterschied zwischen Standard-NMS und Soft-NMS?

Select the correct answer

War alles klar?

Wie können wir es verbessern?

Danke für Ihr Feedback!

Abschnitt 4. Kapitel 5
Wir sind enttäuscht, dass etwas schief gelaufen ist. Was ist passiert?
some-alt