重複データ

下記の設問に対する答えとして相応しものを選択肢から選び、次のコードの空欄(##########)を埋めてください.

Q1:変数 df の “col2″ 列のうち、重複している行を全て確認してください.このとき、重複している行が全て ” True” と出力されるようにしてください.

Q2:変数 df の “col2” 列のうち、重複のある行を全て削除してください.
import pandas as pd

df = pd.DataFrame({“col1” : [0, 9, 3, 3, 6, 1, 2, 2, 8],
“col2” : [“a”, “c”, “d”, “b”, “c”, “c”, “a”, “a”, “e”]})
#Q1
print(##########)

#Q2
print(##########)

[Q1, Q2 の選択肢]
1. df.drop_dupulicates(subset=”col2″, keep=False)
2. df.drop_dupulicates(keep=False)
3. df.drop_dupulicates(subset=”col2″, keep=True)
4. df.drop_dupulicates(keep=True)
5. df.duplicated(keep=”True”)
6. df.duplicated(keep=”False”)
7. df.duplicated(keep=”first”)
8. df.duplicated(keep=”last”)

Leave a comment

Your email address will not be published. Required fields are marked *