Notice: This page requires JavaScript to function properly.
Please enable JavaScript in your browser settings or update your browser.
Impara Previsioni del Riquadro di Delimitazione | Rilevamento Oggetti
Fondamenti di Computer Vision
course content

Contenuti del Corso

Fondamenti di Computer Vision

Fondamenti di Computer Vision

1. Introduzione alla Computer Vision
2. Elaborazione delle Immagini con OpenCV
3. Reti Neurali Convoluzionali
4. Rilevamento Oggetti
5. Panoramica degli Argomenti Avanzati

book
Previsioni del Riquadro di Delimitazione

I riquadri di delimitazione sono fondamentali per il rilevamento degli oggetti, poiché forniscono un modo per segnare la posizione degli oggetti. I modelli di rilevamento degli oggetti utilizzano questi riquadri per definire la posizione e le dimensioni degli oggetti rilevati all'interno di un'immagine. Predire con precisione i riquadri di delimitazione è essenziale per garantire un rilevamento affidabile degli oggetti.

Come le CNN predicono le coordinate dei riquadri di delimitazione

Le reti neurali convoluzionali (CNN) elaborano le immagini attraverso strati di convoluzioni e pooling per estrarre le caratteristiche. Per il rilevamento degli oggetti, le CNN generano mappe delle caratteristiche che rappresentano diverse parti di un'immagine. La previsione dei riquadri di delimitazione viene generalmente ottenuta tramite:

  1. Estrazione delle rappresentazioni delle caratteristiche dall'immagine;

  2. Applicazione di una funzione di regressione per prevedere le coordinate dei riquadri di delimitazione;

  3. Classificazione degli oggetti rilevati all'interno di ciascun riquadro.

Le previsioni dei riquadri di delimitazione sono rappresentate come valori numerici corrispondenti a:

  • (x, y): le coordinate del centro del riquadro;

  • (w, h): la larghezza e l'altezza del riquadro.

Esempio: Previsione dei riquadri di delimitazione utilizzando un modello preaddestrato

Invece di addestrare una CNN da zero, è possibile utilizzare un modello preaddestrato come Faster R-CNN dal model zoo di TensorFlow per prevedere i riquadri di delimitazione su un'immagine. Di seguito è riportato un esempio di caricamento di un modello preaddestrato, caricamento di un'immagine, generazione delle previsioni e visualizzazione dei riquadri di delimitazione con le etichette di classe.

Importa le librerie

Carica il modello e l'immagine

Pre-elabora l'immagine

Effettuare la previsione ed estrarre le caratteristiche del bounding box

Disegnare i bounding box

Visualizzare

Risultato:

Predizioni delle Bounding Box Basate sulla Regressione

Un approccio per prevedere le bounding box è la regressione diretta, in cui una CNN restituisce quattro valori numerici che rappresentano la posizione e la dimensione della box. Modelli come YOLO (You Only Look Once) utilizzano questa tecnica suddividendo un'immagine in una griglia e assegnando le predizioni delle bounding box alle celle della griglia.

Tuttavia, la regressione diretta presenta delle limitazioni:

  • Difficoltà nella gestione di oggetti di dimensioni e proporzioni variabili;

  • Gestione inefficace di oggetti sovrapposti;

  • Possibili spostamenti imprevedibili delle bounding box, causando incoerenze.

Approcci Basati su Anchor vs. Anchor-Free

Metodi Basati su Anchor

Gli anchor box sono bounding box predefinite con dimensioni e proporzioni fisse. Modelli come Faster R-CNN e SSD (Single Shot MultiBox Detector) utilizzano gli anchor box per migliorare l'accuratezza delle predizioni. Il modello prevede aggiustamenti agli anchor box invece di prevedere le bounding box da zero. Questo metodo è efficace per rilevare oggetti di diverse scale, ma aumenta la complessità computazionale.

Metodi Anchor-Free

I metodi anchor-free, come CenterNet e FCOS (Fully Convolutional One-Stage Object Detection), eliminano le anchor box predefinite e prevedono direttamente i centri degli oggetti. Questi metodi offrono:

  • Architetture di modello più semplici;

  • Velocità di inferenza superiori;

  • Migliore generalizzazione a dimensioni di oggetti non viste.

La predizione del bounding box è una componente fondamentale del rilevamento degli oggetti, e diversi approcci bilanciano accuratezza ed efficienza. Mentre i metodi basati su anchor migliorano la precisione utilizzando forme predefinite, i metodi anchor-free semplificano la rilevazione prevedendo direttamente le posizioni degli oggetti. Comprendere queste tecniche aiuta a progettare sistemi di rilevamento oggetti migliori per varie applicazioni reali.

1. Quali informazioni contiene tipicamente una predizione di bounding box?

2. Qual è il principale vantaggio dei metodi basati su anchor nell'individuazione degli oggetti?

3. Quale sfida affronta la regressione diretta nella previsione dei riquadri di delimitazione?

question mark

Quali informazioni contiene tipicamente una predizione di bounding box?

Select the correct answer

question mark

Qual è il principale vantaggio dei metodi basati su anchor nell'individuazione degli oggetti?

Select the correct answer

question mark

Quale sfida affronta la regressione diretta nella previsione dei riquadri di delimitazione?

Select the correct answer

Tutto è chiaro?

Come possiamo migliorarlo?

Grazie per i tuoi commenti!

Sezione 4. Capitolo 3

Chieda ad AI

expand
ChatGPT

Chieda pure quello che desidera o provi una delle domande suggerite per iniziare la nostra conversazione

course content

Contenuti del Corso

Fondamenti di Computer Vision

Fondamenti di Computer Vision

1. Introduzione alla Computer Vision
2. Elaborazione delle Immagini con OpenCV
3. Reti Neurali Convoluzionali
4. Rilevamento Oggetti
5. Panoramica degli Argomenti Avanzati

book
Previsioni del Riquadro di Delimitazione

I riquadri di delimitazione sono fondamentali per il rilevamento degli oggetti, poiché forniscono un modo per segnare la posizione degli oggetti. I modelli di rilevamento degli oggetti utilizzano questi riquadri per definire la posizione e le dimensioni degli oggetti rilevati all'interno di un'immagine. Predire con precisione i riquadri di delimitazione è essenziale per garantire un rilevamento affidabile degli oggetti.

Come le CNN predicono le coordinate dei riquadri di delimitazione

Le reti neurali convoluzionali (CNN) elaborano le immagini attraverso strati di convoluzioni e pooling per estrarre le caratteristiche. Per il rilevamento degli oggetti, le CNN generano mappe delle caratteristiche che rappresentano diverse parti di un'immagine. La previsione dei riquadri di delimitazione viene generalmente ottenuta tramite:

  1. Estrazione delle rappresentazioni delle caratteristiche dall'immagine;

  2. Applicazione di una funzione di regressione per prevedere le coordinate dei riquadri di delimitazione;

  3. Classificazione degli oggetti rilevati all'interno di ciascun riquadro.

Le previsioni dei riquadri di delimitazione sono rappresentate come valori numerici corrispondenti a:

  • (x, y): le coordinate del centro del riquadro;

  • (w, h): la larghezza e l'altezza del riquadro.

Esempio: Previsione dei riquadri di delimitazione utilizzando un modello preaddestrato

Invece di addestrare una CNN da zero, è possibile utilizzare un modello preaddestrato come Faster R-CNN dal model zoo di TensorFlow per prevedere i riquadri di delimitazione su un'immagine. Di seguito è riportato un esempio di caricamento di un modello preaddestrato, caricamento di un'immagine, generazione delle previsioni e visualizzazione dei riquadri di delimitazione con le etichette di classe.

Importa le librerie

Carica il modello e l'immagine

Pre-elabora l'immagine

Effettuare la previsione ed estrarre le caratteristiche del bounding box

Disegnare i bounding box

Visualizzare

Risultato:

Predizioni delle Bounding Box Basate sulla Regressione

Un approccio per prevedere le bounding box è la regressione diretta, in cui una CNN restituisce quattro valori numerici che rappresentano la posizione e la dimensione della box. Modelli come YOLO (You Only Look Once) utilizzano questa tecnica suddividendo un'immagine in una griglia e assegnando le predizioni delle bounding box alle celle della griglia.

Tuttavia, la regressione diretta presenta delle limitazioni:

  • Difficoltà nella gestione di oggetti di dimensioni e proporzioni variabili;

  • Gestione inefficace di oggetti sovrapposti;

  • Possibili spostamenti imprevedibili delle bounding box, causando incoerenze.

Approcci Basati su Anchor vs. Anchor-Free

Metodi Basati su Anchor

Gli anchor box sono bounding box predefinite con dimensioni e proporzioni fisse. Modelli come Faster R-CNN e SSD (Single Shot MultiBox Detector) utilizzano gli anchor box per migliorare l'accuratezza delle predizioni. Il modello prevede aggiustamenti agli anchor box invece di prevedere le bounding box da zero. Questo metodo è efficace per rilevare oggetti di diverse scale, ma aumenta la complessità computazionale.

Metodi Anchor-Free

I metodi anchor-free, come CenterNet e FCOS (Fully Convolutional One-Stage Object Detection), eliminano le anchor box predefinite e prevedono direttamente i centri degli oggetti. Questi metodi offrono:

  • Architetture di modello più semplici;

  • Velocità di inferenza superiori;

  • Migliore generalizzazione a dimensioni di oggetti non viste.

La predizione del bounding box è una componente fondamentale del rilevamento degli oggetti, e diversi approcci bilanciano accuratezza ed efficienza. Mentre i metodi basati su anchor migliorano la precisione utilizzando forme predefinite, i metodi anchor-free semplificano la rilevazione prevedendo direttamente le posizioni degli oggetti. Comprendere queste tecniche aiuta a progettare sistemi di rilevamento oggetti migliori per varie applicazioni reali.

1. Quali informazioni contiene tipicamente una predizione di bounding box?

2. Qual è il principale vantaggio dei metodi basati su anchor nell'individuazione degli oggetti?

3. Quale sfida affronta la regressione diretta nella previsione dei riquadri di delimitazione?

question mark

Quali informazioni contiene tipicamente una predizione di bounding box?

Select the correct answer

question mark

Qual è il principale vantaggio dei metodi basati su anchor nell'individuazione degli oggetti?

Select the correct answer

question mark

Quale sfida affronta la regressione diretta nella previsione dei riquadri di delimitazione?

Select the correct answer

Tutto è chiaro?

Come possiamo migliorarlo?

Grazie per i tuoi commenti!

Sezione 4. Capitolo 3
Siamo spiacenti che qualcosa sia andato storto. Cosa è successo?
some-alt