値の置換/追加

下記の設問に対する答えとして相応しものを選択肢から選び、次のコードの空欄(##########)を埋めてください.

辞書型の変数 grade_dict を用いて、変数 df のカラム “School Year” をベースとしてマッピングしてください.
また、変数 df にマッピングで得られて Series をカラム “Grade” として代入してください

import pandas as pd
import numpy as np

df = pd.DataFrame({“Height” : np.arange(155, 185, 3),
“Weight” : np.arange(45, 85, 4),
“Sex” : [“Female”, “Male”, “Male”, “Female”, “Female”, “FeMale”, “Female”, “Male”, “Male”, “Male”],
“School Year” : [1, 1, 2, 4, 3, 4, 5, 5, 6, 6]})

grade_dict = {1 : “Low”,
2 : “Low”,
3 : “Middle”,
4 : “Middle”,
5 : “High”,
6 : “High”}

##########

[選択肢]
1. df[“Grade”] = df[“School Year”].map(grade_dict)
2. df[“Grade”].map(grade_dict)
3. df[“Grade”].map(df[“School Year”], grade_dict)
4. df[“School Year”] = df[“Grade”].map(grade_dict)

値の置換/追加

下記の設問に対する答えとして相応しものを選択肢から選び、次のコードの空欄(##########)を埋めてください.

関数 GetGrade を用いて、”School Year” 列の各データに対応して、それぞれ 3 より小さければ “Low” 、
3 以上 5 未満であれば “Middle” 、5それ以外は ” High” となるような Series を作成してください.
また、変数 df に “Grade” 列を用意しその Series を代入してください.

def GetGrade(x):
if x < 3: return "Low" elif x >= 3 and x < 5: return "Middle" else: return "High" import pandas as pd import numpy as np df = pd.DataFrame({"Height" : np.arange(155, 185, 3), "Weight" : np.arange(45, 85, 4), "Sex" : ["Female", "Male", "Male", "Female", "Female", "FeMale", "Female", "Male", "Male", "Male"], "School Year" : [1, 1, 2, 4, 3, 4, 5, 5, 6, 6]}) grade_dict = {1 : "Low", 2 : "Low", 3 : "Middle", 4 : "Middle", 5 : "High", 6 : "High"} ########## [選択肢] 1. df["Grade"] = GetGrade(df["School Year"]) 2. df["Grade"] = df["School Year"].map(lambda x : GetGrade(x)) 3. df["Grade"] = df["School Year"].map(GetGrade) 4. df["Grade"] = df["School Year"].apply(GetGrade(x))

欠損値のカウント

下記の設問に対する答えとして相応しものを選択肢から選び、次のコードの空欄( ##########)を埋めてください.

変数 df の欠損値に対処します.変数 df で、各行ごとに欠損値ではないデータの個数をカウントしてください.

import numpy as np
from numpy import nan as NA
import pandas as pd

df = pd.DataFrame(np.random.rand(100, 10))

# データを欠損させます
df.iloc[3, 0] = NA
df.iloc[10:20, 2] = NA
df.iloc[45 , :8] = NA
df.iloc[85:95 , 3] = NA

##########

[選択肢]
1. df.count(axis=1)
2. df.isnull(axis=1)
3. df.count().sum()
4. df.isnull().sum()
5. df.count().sum(axis=1)
6. df.isnull().sum(axis=1)

欠損値のカウント

下記の設問に対する答えとして相応しものを選択肢から選び、次のコードの空欄( ##########)を埋めてください.

変数 df の欠損値に対処します.変数 df に含まれる欠損値の総数をカウントしてください.

import numpy as np
from numpy import nan as NA
import pandas as pd

df = pd.DataFrame(np.random.rand(100, 10))

# データを欠損させます
df.iloc[3, 0] = NA
df.iloc[10:20, 2] = NA
df.iloc[45 , :8] = NA
df.iloc[85:95 , 3] = NA

##########

[選択肢]
1. df.count().sum()
2. df.isnull().sum()
3. df.count().sum(axis=1).sum()
4. df.isnull().sum(axis=1).sum()

欠損値の削除

下記の設問に対する答えとして相応しものを選択肢から選び、次のコードの空欄( ##########)を埋めてください.

変数 df の欠損値に対処します.3 列目の欠損値が存在する行を変数 df から削除してください.
(※ 変数 df の中身は書き換えないでください.)

import numpy as np
from numpy import nan as NA
import pandas as pd

df = pd.DataFrame(np.random.rand(100, 10))

# データを欠損させます
df.iloc[3, 0] = NA
df.iloc[10:20, 2] = NA
df.iloc[45, :8] = NA
df.iloc[85:95 , 3] = NA

##########

[選択肢]
1. df[~df[3].isnull()]
2. df[3].isnull()
3. df.dropna(axis=3, inplace=True)
4. df[3].dropna()

欠損値の補間

下記の設問に対する答えとして相応しものを選択肢から選び、次のコードの空欄(##########)を埋めてください.

変数 df の欠損値に対処します.欠損値をそれぞれの列ごとの平均値で補間してください.
(※ 変数 df の中身は書き換えないでください.)

import numpy as np
from numpy import nan as NA
import pandas as pd

df = pd.DataFrame(np.random.rand(100, 10))

# データを欠損させます
df.iloc[3, 0] = NA
df.iloc[10:20, 2] = NA
df.iloc[45, :8] = NA
df.iloc[85:95, 3] = NA

##########

1. df.fillna()
2. df.fillna(df.mean())
3. df.fillna(df.median())
4. df.fillna(df.mode().iloc[0])
5. df.fillna(method=’ffill’)
6. df.fillna(method=’bfill’)

欠損値の補間

下記の設問に対する答えとして相応しものを選択肢から選び、次のコードの空欄(##########)を埋めてください.

変数 df の欠損値に対処します.欠損値をそれぞれの欠損値の 1 つ前の行のデータで補間してください.
(※ 変数 df の中身は書き換えないでください.)

import numpy as np
from numpy import nan as NA
import pandas as pd

df = pd.DataFrame(np.random.rand(100, 10))

# データを欠損させます
df.iloc[3, 0] = NA
df.iloc[10:20, 2] = NA
df.iloc[45, :8] = NA
df.iloc[85:95, 3] = NA

##########

1. df.fillna()
2. df.fillna(df.mean())
3. df.fillna(df.median())
4. df.fillna(df.mode().iloc[0])
5. df.fillna(method=’ffill’)
6. df.fillna(method=’bfill’)

欠損値の補間

下記の設問に対する答えとして相応しものを選択肢から選び、次のコードの空欄(##########)を埋めてください.

変数 df の欠損値に対処します.欠損値をそれぞれの列の中央値で補間してください.
(※ 変数 df の中身は書き換えないでください.)

import numpy as np
from numpy import nan as NA
import pandas as pd

df = pd.DataFrame(np.random.rand(100, 10))

# データを欠損させます
df.iloc[3, 0] = NA
df.iloc[10:20, 2] = NA
df.iloc[45, :8] = NA
df.iloc[85:95, 3] = NA

##########

1. df.fillna()
2. df.fillna(df.mean())
3. df.fillna(df.median())
4. df.fillna(df.mode().iloc[0])
5. df.fillna(method=’ffill’)
6. df.fillna(method=’bfill’)

DataFrame からの統計量の算出

下記の設問に対する答えとして相応しものを選択肢から選び、次のコードの空欄(##########)を埋めてください.

変数 wine_df の”Flavanoids” 列の最頻値を算出し、出力してください.

import pandas as pd

wine_df = pd.read_csv(“http://archive.ics.uci.edu/ml/machine-learning-databases/wine/wine.data”, header=None)
wine_col = [”, ‘Alcohol’, “Malic acid”, “Ash”, “Alcalinity of ash”, “Magnesium”, “Total phenols”, “Flavanoids”, “Nonflavanoid phenol”, “Proanthocyanis”,
“Color intensity”, “Hue”, “OD280/0D315 of diluted wines”, “Proline”]
wine_df.columns = wine_col

print(##########)

1. wine_df[“Flavanoids”].mean()
2. wine_df[Flavanoids”].median()
3. wine_df[Flavanoids”].mode().iloc[0]
4. wine_df[Flavanoids”].ilco[0]

欠損値のカウント

下記の設問に対する答えとして相応しものを選択肢から選び、次のコードの空欄( ##########)を埋めてください.

変数 df の欠損値に対処します.変数 df で、各列ごとに欠損値ではにデータの個数をカウントしてください.

import numpy as np
from numpy import nan as NA
import pandas as pd

df = pd.DataFrame(np.random.rand(100, 10))

# データを欠損させます
df.iloc[3, 0] = NA
df.iloc[10:20, 2] = NA
df.iloc[45 , :8] = NA
df.iloc[85:95 , 3] = NA

##########

[選択肢]
1. df.count()
2. df.isnull()
3. df.count().sum()
4. df.isnull().sum()
5. df.count().sum(axis=1)
6. df.isnull().sum(axis=1)