Sfida: Previsione Dei Prezzi Utilizzando la Regressione Polinomiale
Per questa sfida, verrà costruita la stessa Regressione Polinomiale di grado 2 come nella sfida precedente. Tuttavia, sarà necessario suddividere il set in un set di addestramento e un set di test per calcolare l'RMSE per entrambi i set. Questo è necessario per valutare se il modello è soggetto a overfitting o underfitting.
Di seguito un promemoria della funzione train_test_split() da utilizzare.
Inoltre, promemoria della funzione mean_squared_error() necessaria per calcolare l'RMSE:
rmse = mean_squared_error(y_true, y_predicted, squared=False)
Swipe to start coding
- Assegnare al variabile
'age'il DataFrame con una sola colonnadfdiX. - Pre-elaborare
Xutilizzando la classePolynomialFeatures. - Suddividere il dataset utilizzando la funzione appropriata di
sklearn. - Costruire e addestrare un modello sul set di addestramento.
- Predire i target sia del set di addestramento che di test.
- Calcolare l'RMSE sia per il set di addestramento che per quello di test.
- Stampare la tabella di riepilogo.
Soluzione
Al termine dell'attività, si noterà che l'RMSE del test è persino inferiore a quello dell'addestramento. Di solito, i modelli non mostrano risultati migliori su istanze non viste. In questo caso, la differenza è minima ed è dovuta al caso. Il nostro dataset è relativamente piccolo e, durante la suddivisione, il set di test ha ricevuto punti dati leggermente migliori (più facili da prevedere).
Grazie per i tuoi commenti!
single
Chieda ad AI
Chieda ad AI
Chieda pure quello che desidera o provi una delle domande suggerite per iniziare la nostra conversazione
Awesome!
Completion rate improved to 5.26
Sfida: Previsione Dei Prezzi Utilizzando la Regressione Polinomiale
Scorri per mostrare il menu
Per questa sfida, verrà costruita la stessa Regressione Polinomiale di grado 2 come nella sfida precedente. Tuttavia, sarà necessario suddividere il set in un set di addestramento e un set di test per calcolare l'RMSE per entrambi i set. Questo è necessario per valutare se il modello è soggetto a overfitting o underfitting.
Di seguito un promemoria della funzione train_test_split() da utilizzare.
Inoltre, promemoria della funzione mean_squared_error() necessaria per calcolare l'RMSE:
rmse = mean_squared_error(y_true, y_predicted, squared=False)
Swipe to start coding
- Assegnare al variabile
'age'il DataFrame con una sola colonnadfdiX. - Pre-elaborare
Xutilizzando la classePolynomialFeatures. - Suddividere il dataset utilizzando la funzione appropriata di
sklearn. - Costruire e addestrare un modello sul set di addestramento.
- Predire i target sia del set di addestramento che di test.
- Calcolare l'RMSE sia per il set di addestramento che per quello di test.
- Stampare la tabella di riepilogo.
Soluzione
Al termine dell'attività, si noterà che l'RMSE del test è persino inferiore a quello dell'addestramento. Di solito, i modelli non mostrano risultati migliori su istanze non viste. In questo caso, la differenza è minima ed è dovuta al caso. Il nostro dataset è relativamente piccolo e, durante la suddivisione, il set di test ha ricevuto punti dati leggermente migliori (più facili da prevedere).
Grazie per i tuoi commenti!
single