Notice: This page requires JavaScript to function properly.
Please enable JavaScript in your browser settings or update your browser.
学ぶ チャレンジ:前処理パイプライン | セクション
データ前処理と特徴量エンジニアリング
セクション 1.  12
single

single

bookチャレンジ:前処理パイプライン

メニューを表示するにはスワイプしてください

タスク

スワイプしてコーディングを開始

seabornライブラリのTitanicデータセットが与えられています。 機械学習の前に必要となるすべての主要なデータ変換を行う完全な前処理パイプラインを構築してください。

以下の手順に従ってください:

  1. sns.load_dataset("titanic")を使用してデータセットを読み込みます。
  2. 欠損値の処理:
  • 数値列 → 平均値で補完。
  • カテゴリ列 → 最頻値で補完。
  1. カテゴリ特徴量sexembarkedを**pd.get_dummies()**でエンコードします。
  2. 数値列agefareを**StandardScaler**でスケーリングします。
  3. 新しい特徴量family_size = sibsp + parch + 1を作成します。
  4. すべての変換をまとめて、最終的な処理済みDataFrameを返す**preprocess_titanic(data)**という関数を作成します。
  5. 処理済みデータセットをprocessed_dataという変数に代入します。

最終的なDataFrameの先頭5行を出力してください。

解答

Switch to desktop実践的な練習のためにデスクトップに切り替える下記のオプションのいずれかを利用して、現在の場所から続行する
すべて明確でしたか?

どのように改善できますか?

フィードバックありがとうございます!

セクション 1.  12
single

single

AIに質問する

expand

AIに質問する

ChatGPT

何でも質問するか、提案された質問の1つを試してチャットを始めてください

some-alt