ピボットテーブル化と逆変換

下記の設問に対する答えとして相応しものを選択肢から選び、次のコードの空欄(##########)を埋めてください.

変数 df を以下に示す配列へ Tidy Data(整然データ)化してください.

########## 配列 ##########
# index variable value
# 0 a A 101
# 1 b A 102
# 2 c A 103
# 3 a B 201
# 4 b B 202
# 5 c B 203
# 6 a C 301
# 7 b C 302
# 8 c C 303
#########################

import pandas as pd

df = pd.DataFrame({“A” : [101, 102, 103],
“B” : [201, 202, 203],
“C” : [301, 302, 303]}, index=[“a”, “b”, “c”])

converted_df = ##########

[選択肢]
1. df.melt(id_vars=[“index”])
2. df.melt(id_vars=[“index”], value_vars=[“B”])
3. df.reset_index().melt(id_vars=[“index”])
4. df.reset_index().melt(id_vars=[“index”], value_vars=[“B”])

ピボットテーブル化と逆変換

下記の設問に対する答えとして相応しものを選択肢から選び、次のコードの空欄(##########)を埋めてください.

変数 df を以下に示す配列へ Tidy Data(整然データ)化してください.

########## 配列 ##########
# A B variable value
# 0 101 201 C 301
# 1 102 202 C 302
# 2 103 203 C 303
#########################

import pandas as pd

df = pd.DataFrame({“A” : [101, 102, 103],
“B” : [201, 202, 203],
“C” : [301, 302, 303]}, index=[“a”, “b”, “c”])

converted_df = ##########

[選択肢]
1. df.reset_index().melt(id_vars=[“index”], value_vars=[“A”, “B”, “C”])
2. df.reset_index().melt(id_vars=[“A”, “B”], value_vars=[“C”])
3. df.reset_index().melt(id_vars=[“A”, “B”])
4. df.reset_index().melt(id_vars=[“A”, “B”], value_vars=[“index”, “C”])

ピボットテーブル化と逆変換

下記の設問に対する答えとして相応しものを選択肢から選び、次のコードの空欄(##########)を埋めてください.

変数 df を以下に示す配列へ Tidy Data(整然データ)化し、変数 coverted_df に代入へ代入してあります.
変数 converted_df を元の配列(変数 df と同じ配列)に逆変換してください.

import pandas as pd

df = pd.DataFrame({“A” : [101, 102, 103],
“B” : [201, 202, 203],
“C” : [301, 302, 303]}, index=[“a”, “b”, “c”])

converted_df = df.reset_index().melt(id_vars=[“index”], value_vars=[“A”, “B”, “C”])
print(converted_df)
########################
# index variable value
# 0 a A 101
# 1 b A 102
# 2 c A 103
# 3 a B 201
# 4 b B 202
# 5 c B 203
# 6 a C 301
# 7 b C 302
# 8 c C 303
#########################

reconverted_df = ##########

[選択肢]
1. df.reset_index().melt(id_vars=[“index”], value_vars=[“A”, “B”, “C”])
2. converted_df.pivot(index=”variable””, columns=”value”)
3. df.melt(index=”index”, columns=”variable”, values=”value”)
4. converted_df.pivot(index=”index”, columns=”variable”, values=”value”)

重複データ

下記の設問に対する答えとして相応しものを選択肢から選び、次のコードの空欄(##########)を埋めてください.

Q1:変数 df の重複のある行を確認してください.このとき、重複ている行のうち、最後の行が “True” と出力されるようにしてください.

Q2:変数 df の重複のある行を削除してください.
import pandas as pd

df = pd.DataFrame({“col1” : [0, 9, 3, 3, 6, 1, 2, 2, 8],
“col2” : [“a”, “c”, “b”, “b”, “c”, “c”, “a”, “a”, “b”]})
#Q1
print(##########)

#Q2
print(##########)

[Q1, Q2 の選択肢]
1. df.drop_dupulicated
2. df.drop_dupulicates
3. df.duplicated(keep=”first”)
4. df.duplicated(keep=”last”)

重複データ

下記の設問に対する答えとして相応しものを選択肢から選び、次のコードの空欄(##########)を埋めてください.

Q1:変数 df の “col2″ 列のうち、重複している行を全て確認してください.このとき、重複している行が全て ” True” と出力されるようにしてください.

Q2:変数 df の “col2” 列のうち、重複のある行を全て削除してください.
import pandas as pd

df = pd.DataFrame({“col1” : [0, 9, 3, 3, 6, 1, 2, 2, 8],
“col2” : [“a”, “c”, “d”, “b”, “c”, “c”, “a”, “a”, “e”]})
#Q1
print(##########)

#Q2
print(##########)

[Q1, Q2 の選択肢]
1. df.drop_dupulicates(subset=”col2″, keep=False)
2. df.drop_dupulicates(keep=False)
3. df.drop_dupulicates(subset=”col2″, keep=True)
4. df.drop_dupulicates(keep=True)
5. df.duplicated(keep=”True”)
6. df.duplicated(keep=”False”)
7. df.duplicated(keep=”first”)
8. df.duplicated(keep=”last”)

重複データとグループ化

下記の設問に対する答えとして相応しものを選択肢から選び、次のコードの空欄(##########)を埋めてください.

変数 df の “col2” 列の各要素が、それぞれどれだけ重複しているのかを確認するために、各要素の個数をカウントしてください.

import pandas as pd

df = pd.DataFrame({“col1” : [0, 9, 3, 3, 6, 1, 2, 2, 8],
“col2” : [“a”, “c”, “d”, “b”, “c”, “c”, “a”, “a”, “e”]})

print(##########)

[選択肢]
1. df.groupby(“col2”).sum().sum()
2. df[“df2”].count_valuse()
3. df.duplicated().value_counts()
4. df.groupby(“col2”).counts()

重複データとグループ化

下記の設問に対する答えとして相応しものを選択肢から選び、次のコードの空欄(##########)を埋めてください.

変数 df の “col2” 列の各要素が、それぞれどれだけ重複しているのかを確認するために、重複した行の数をカウントしてください.

import pandas as pd

df = pd.DataFrame({“col1” : [0, 9, 3, 3, 6, 1, 2, 2, 8],
“col2” : [“a”, “c”, “d”, “b”, “c”, “c”, “a”, “a”, “e”]})

print(##########)

[選択肢]
1. df.groupby(“col2”).sum().sum()
2. df[“df2”].valuse_counts()
3. df.duplicated().value_counts()
4. df.groupby(“col2”).counts()

重複データのカウント

下記の設問に対する答えとして相応しものを選択肢から選び、次のコードの空欄(##########)を埋めてください.

変数 df の “col2” 列には、何パターンの要素があるか調べてください.
(要素のパターン = 重複を除いた行数の意)

import pandas as pd

df = pd.DataFrame({“col1” : [0, 9, 3, 3, 6, 1, 2, 2, 8],
“col2” : [“a”, “c”, “d”, “b”, “c”, “c”, “a”, “a”, “e”]})

print(##########)

[選択肢]
1. pd.value_counts(set(df.col2.unique()))
2. set(df.col2.unique()).count()
3. len(set(df.col2.unique()))
4. set(df.col2.unique).shpae

重複データのカウント

下記の設問に対する答えとして相応しものを選択肢から選び、次のコードの空欄(##########)を埋めてください.

変数 df の “col2” 列には、何パターンの要素があるか調べてください.
(要素のパターン = 重複を除いた行数の意)

import pandas as pd

df = pd.DataFrame({“col1” : [0, 9, 3, 3, 6, 1, 2, 2, 8],
“col2” : [“a”, “c”, “d”, “b”, “c”, “c”, “a”, “a”, “e”]})

print(##########)

[選択肢]
1. pd.value_counts(set(df.col2.unique()))
2. set(df.col2.unique()).counts()
3. set(df.col2.unique())
4. set(df.col2.unique).shpae[0]

値の置換/追加

下記の設問に対する答えとして相応しものを選択肢から選び、次のコードの空欄(##########)を埋めてください.

関数 GetGrade を用いて、”School Year” 列の各データに対応して、それぞれ 3 より小さければ “Low” 、
3 以上 5 未満であれば “Middle” 、5それ以外は ” High” となるような Series を作成してください.
また、変数 df に “Grade” 列を用意しその Series を代入してください.

def GetGrade(x):
if x < 3: return "Low" elif x >= 3 and x < 5: return "Middle" else: return "High" import pandas as pd import numpy as np df = pd.DataFrame({"Height" : np.arange(155, 185, 3), "Weight" : np.arange(45, 85, 4), "Sex" : ["Female", "Male", "Male", "Female", "Female", "FeMale", "Female", "Male", "Male", "Male"], "School Year" : [1, 1, 2, 4, 3, 4, 5, 5, 6, 6]}) grade_dict = {1 : "Low", 2 : "Low", 3 : "Middle", 4 : "Middle", 5 : "High", 6 : "High"} ########## [選択肢] 1. df["Grade"] = GetGrade(df["School Year"]) 2. df["Grade"] = df["School Year"].map(lambda x : GetGrade(x)) 3. df["Grade"] = df["School Year"].map(GetGrade) 4. df["Grade"] = df["School Year"].apply(GetGrade(x))