Set di Addestramento
Nel contesto dell'apprendimento supervisionato o non supervisionato, il set di addestramento viene solitamente presentato in formato tabellare.
Un esempio è il diabetes dataset, utilizzato per prevedere se una persona è affetta da diabete. Contiene i dati di 768 donne con parametri come età, indice di massa corporea e pressione sanguigna. Questi parametri sono chiamati feature.
Il dataset include anche una colonna 'Outcome' che indica se la persona ha il diabete. Questa è la variabile target.
Ogni riga della tabella rappresenta un'istanza (chiamata anche data point o sample), ovvero le informazioni relative a un singolo individuo.
La tabella (set di addestramento) contiene una colonna target, il che significa che è etichettata.
L'obiettivo è addestrare il modello di ML su questo set di addestramento e, una volta addestrato, sarà in grado di prevedere per altre persone (nuove istanze) la presenza di diabete basandosi solo sulle feature.
Questo set di addestramento è un esempio di dataset biased poiché contiene esclusivamente informazioni su donne di almeno 21 anni. Di conseguenza, il modello potrebbe produrre previsioni meno accurate per uomini o per donne sotto i 21 anni, poiché non è stato addestrato su questi gruppi.
Durante la programmazione, le colonne delle caratteristiche sono solitamente assegnate a X e le colonne target assegnate come y.
E le caratteristiche delle nuove istanze sono assegnate come X_new.
Grazie per i tuoi commenti!
Chieda ad AI
Chieda ad AI
Chieda pure quello che desidera o provi una delle domande suggerite per iniziare la nostra conversazione
What is the difference between features and the target variable?
Can you explain what X, y, and X_new represent in machine learning?
How does the model use X_new to make predictions?
Awesome!
Completion rate improved to 3.13
Set di Addestramento
Scorri per mostrare il menu
Nel contesto dell'apprendimento supervisionato o non supervisionato, il set di addestramento viene solitamente presentato in formato tabellare.
Un esempio è il diabetes dataset, utilizzato per prevedere se una persona è affetta da diabete. Contiene i dati di 768 donne con parametri come età, indice di massa corporea e pressione sanguigna. Questi parametri sono chiamati feature.
Il dataset include anche una colonna 'Outcome' che indica se la persona ha il diabete. Questa è la variabile target.
Ogni riga della tabella rappresenta un'istanza (chiamata anche data point o sample), ovvero le informazioni relative a un singolo individuo.
La tabella (set di addestramento) contiene una colonna target, il che significa che è etichettata.
L'obiettivo è addestrare il modello di ML su questo set di addestramento e, una volta addestrato, sarà in grado di prevedere per altre persone (nuove istanze) la presenza di diabete basandosi solo sulle feature.
Questo set di addestramento è un esempio di dataset biased poiché contiene esclusivamente informazioni su donne di almeno 21 anni. Di conseguenza, il modello potrebbe produrre previsioni meno accurate per uomini o per donne sotto i 21 anni, poiché non è stato addestrato su questi gruppi.
Durante la programmazione, le colonne delle caratteristiche sono solitamente assegnate a X e le colonne target assegnate come y.
E le caratteristiche delle nuove istanze sono assegnate come X_new.
Grazie per i tuoi commenti!