Sfida: Previsione Dei Prezzi Utilizzando la Regressione Polinomiale
Per questa sfida, verrà costruita la stessa Regressione Polinomiale di grado 2 come nella sfida precedente. Tuttavia, sarà necessario suddividere il set in un set di addestramento e un set di test per calcolare l'RMSE per entrambi i set. Questo è necessario per valutare se il modello è soggetto a overfitting o underfitting.
Di seguito un promemoria della funzione train_test_split()
da utilizzare.
Inoltre, promemoria della funzione mean_squared_error()
necessaria per calcolare l'RMSE:
rmse = mean_squared_error(y_true, y_predicted, squared=False)
Swipe to start coding
- Assegnare al variabile
'age'
il DataFrame con una sola colonnadf
diX
. - Pre-elaborare
X
utilizzando la classePolynomialFeatures
. - Suddividere il dataset utilizzando la funzione appropriata di
sklearn
. - Costruire e addestrare un modello sul set di addestramento.
- Predire i target sia del set di addestramento che di test.
- Calcolare l'RMSE sia per il set di addestramento che per quello di test.
- Stampare la tabella di riepilogo.
Soluzione
Al termine dell'attività, si noterà che l'RMSE del test è persino inferiore a quello dell'addestramento. Di solito, i modelli non mostrano risultati migliori su istanze non viste. In questo caso, la differenza è minima ed è dovuta al caso. Il nostro dataset è relativamente piccolo e, durante la suddivisione, il set di test ha ricevuto punti dati leggermente migliori (più facili da prevedere).
Grazie per i tuoi commenti!
single
Chieda ad AI
Chieda ad AI
Chieda pure quello che desidera o provi una delle domande suggerite per iniziare la nostra conversazione
Can you explain how to interpret RMSE values for training and test sets?
What does it mean if the test RMSE is lower than the training RMSE?
Can you provide an example of how to use train_test_split and mean_squared_error together?
Awesome!
Completion rate improved to 5.26
Sfida: Previsione Dei Prezzi Utilizzando la Regressione Polinomiale
Scorri per mostrare il menu
Per questa sfida, verrà costruita la stessa Regressione Polinomiale di grado 2 come nella sfida precedente. Tuttavia, sarà necessario suddividere il set in un set di addestramento e un set di test per calcolare l'RMSE per entrambi i set. Questo è necessario per valutare se il modello è soggetto a overfitting o underfitting.
Di seguito un promemoria della funzione train_test_split()
da utilizzare.
Inoltre, promemoria della funzione mean_squared_error()
necessaria per calcolare l'RMSE:
rmse = mean_squared_error(y_true, y_predicted, squared=False)
Swipe to start coding
- Assegnare al variabile
'age'
il DataFrame con una sola colonnadf
diX
. - Pre-elaborare
X
utilizzando la classePolynomialFeatures
. - Suddividere il dataset utilizzando la funzione appropriata di
sklearn
. - Costruire e addestrare un modello sul set di addestramento.
- Predire i target sia del set di addestramento che di test.
- Calcolare l'RMSE sia per il set di addestramento che per quello di test.
- Stampare la tabella di riepilogo.
Soluzione
Al termine dell'attività, si noterà che l'RMSE del test è persino inferiore a quello dell'addestramento. Di solito, i modelli non mostrano risultati migliori su istanze non viste. In questo caso, la differenza è minima ed è dovuta al caso. Il nostro dataset è relativamente piccolo e, durante la suddivisione, il set di test ha ricevuto punti dati leggermente migliori (più facili da prevedere).
Grazie per i tuoi commenti!
single