セクション 1. 章 4
single
チャレンジ:重複のカウント
メニューを表示するにはスワイプしてください
重複データは、同じ行がデータセット内に複数回出現する場合に発生します。これらの重複エントリは、特定の値が過剰に表現されることで分析結果を歪め、統計値の不正確さ、誤解を招く傾向、不信頼な結果につながります。重複行の検出と定量化はデータクリーニングの基本的な作業であり、問題の規模を把握し、重複の削除や統合など次の対応策を決定するための指針となります。
123456789import pandas as pd data = { "Name": ["Alice", "Bob", "Alice", "Charlie", "Bob", "Alice"], "Age": [25, 30, 25, 35, 30, 25], "City": ["NY", "LA", "NY", "SF", "LA", "NY"] } df = pd.DataFrame(data) print(df)
タスク
スワイプしてコーディングを開始
与えられたDataFrame内の重複行の数を返す関数を作成してください。pandasのメソッドを使用して重複を特定します。この関数は、DataFrame内で見つかった重複行の合計数を表す整数を返す必要があります。
解答
すべて明確でしたか?
フィードバックありがとうございます!
セクション 1. 章 4
single
AIに質問する
AIに質問する
何でも質問するか、提案された質問の1つを試してチャットを始めてください