セクション 1. 章 12
single
チャレンジ:前処理パイプライン
メニューを表示するにはスワイプしてください
タスク
スワイプしてコーディングを開始
seabornライブラリのTitanicデータセットが与えられています。
機械学習の前に必要となるすべての主要なデータ変換を行う完全な前処理パイプラインを構築してください。
以下の手順に従ってください:
sns.load_dataset("titanic")を使用してデータセットを読み込みます。- 欠損値の処理:
- 数値列 → 平均値で補完。
- カテゴリ列 → 最頻値で補完。
- カテゴリ特徴量
sexとembarkedを**pd.get_dummies()**でエンコードします。 - 数値列
ageとfareを**StandardScaler**でスケーリングします。 - 新しい特徴量
family_size = sibsp + parch + 1を作成します。 - すべての変換をまとめて、最終的な処理済みDataFrameを返す**
preprocess_titanic(data)**という関数を作成します。 - 処理済みデータセットを
processed_dataという変数に代入します。
最終的なDataFrameの先頭5行を出力してください。
解答
すべて明確でしたか?
フィードバックありがとうございます!
セクション 1. 章 12
single
AIに質問する
AIに質問する
何でも質問するか、提案された質問の1つを試してチャットを始めてください