欠損値

下記の設問に対する答えとして相応しものを選択肢から選び、次のコードの空欄( ##########)を埋めてください.

変数 df の欠損値に対処します.欠損値がある列を削除してください.
(※ 変数 df の中身は書き換えないでください.)

import numpy as np
from numpy import nan as NA
import pandas as pd

df = pd.DataFrame(np.random.rand(100, 10))

# データを欠損させます
df.iloc[3, 0] = NA
df.iloc[10:20, 2] = NA
df.iloc[45 , :8] = NA
df.iloc[85:95 , 3] = NA

##########

[選択肢]
1. df.dropna(axis=0, inplace=True)
2. df.dropna(axis=1)
3. ddf.dropna()
4. df[[1, 3, 8]].dropna()

欠損値 – ペアワイズ削除

下記の設問に対する答えとして相応しものを選択肢から選び、次のコードの空欄( ##########)を埋めてください.

変数 df の欠損値に対処します.欠損値が多い 2, 3 列を削除し、残りの列から欠損値のある行を削除(ペアワイズ削除)してください
(※ 変数 df の中身は書き換えないでください.)

import numpy as np
from numpy import nan as NA
import pandas as pd

df = pd.DataFrame(np.random.rand(100, 10))

# データを欠損させます
df.iloc[3, 0] = NA
df.iloc[10:20, 2] = NA
df.iloc[45 , :8] = NA
df.iloc[85:95 , 3] = NA

##########

[選択肢]
1. df[[2, 3]].deopna(axis=1, inplace=True)
2. df[[2, 3]].deopna(axis=0, inplace=True)
3. df[[0, 1, 4, 5, 6, 7, 8, 9]].dropna(inplace=True)
4. df[[[0, 1, 4, 5, 6, 7, 8, 9]].dropna(iaxis=1, nplace=True)

欠損値のカウント

下記の設問に対する答えとして相応しものを選択肢から選び、次のコードの空欄( ##########)を埋めてください.

変数 df の欠損値に対処します.変数 df の各列ごとの欠損値の個数をカウントしてください.

import numpy as np
from numpy import nan as NA
import pandas as pd

df = pd.DataFrame(np.random.rand(100, 10))

# データを欠損させます
df.iloc[3, 0] = NA
df.iloc[10:20, 2] = NA
df.iloc[45 , :8] = NA
df.iloc[85:95 , 3] = NA

##########

[選択肢]
1. df.count()
2. df.isnull()
3. df.count().sum()
4. df.isnull().sum()
5. df.count().sum(axis=1)
6. df.isnull().sum(axis=1)

欠損値のカウント

下記の設問に対する答えとして相応しものを選択肢から選び、次のコードの空欄( ##########)を埋めてください.

変数 df の欠損値に対処します.変数 df の各行ごとの欠損値の個数をカウントしてください.

import numpy as np
from numpy import nan as NA
import pandas as pd

df = pd.DataFrame(np.random.rand(100, 10))

# データを欠損させます
df.iloc[3, 0] = NA
df.iloc[10:20, 2] = NA
df.iloc[45 , :8] = NA
df.iloc[85:95 , 3] = NA

##########

[選択肢]
1. df.count()
2. df.isnull()
3. df.count().sum()
4. df.isnull().sum()
5. df.count().sum(axis=1)
6. df.isnull().sum(axis=1)

欠損値のカウント

下記の設問に対する答えとして相応しものを選択肢から選び、次のコードの空欄( ##########)を埋めてください.

変数 df の欠損値に対処します.変数 df で、各列ごとに欠損値ではにデータの個数をカウントしてください.

import numpy as np
from numpy import nan as NA
import pandas as pd

df = pd.DataFrame(np.random.rand(100, 10))

# データを欠損させます
df.iloc[3, 0] = NA
df.iloc[10:20, 2] = NA
df.iloc[45 , :8] = NA
df.iloc[85:95 , 3] = NA

##########

[選択肢]
1. df.count()
2. df.isnull()
3. df.count().sum()
4. df.isnull().sum()
5. df.count().sum(axis=1)
6. df.isnull().sum(axis=1)

欠損値 – ペアワイズ削除

下記の設問に対する答えとして相応しものを選択肢から選び、次のコードの空欄( ##########)を埋めてください.

変数 df の欠損値に対処します.重要な特徴があり欠損値が少ない0, 1, 5, 6 列だけを残して、そこから欠損値のある行を削除(ペアワイズ削除)してください
(※ 変数 df の中身を書き換えてください.)

import numpy as np
from numpy import nan as NA
import pandas as pd

df = pd.DataFrame(np.random.rand(100, 10))

# データを欠損させます
df.iloc[3, 0] = NA
df.iloc[10:20, 2] = NA
df.iloc[45 , :8] = NA
df.iloc[85:95 , 3] = NA

##########

[選択肢]
1. df[[0, 1, 5, 6]].deopna(axis=1, inplace=True)
2. df[[0, 1, 5, 6]].deopna(axis=0, inplace=True)
3. df[[2, 3, 4, 8, 9]].dropna(inplace=True)
4. df[[2, 3, 4, 8, 9]].dropna(iaxis=1, nplace=True)

欠損値

下記の設問に対する答えとして相応しものを選択肢から選び、次のコードの空欄( ##########)を埋めてください.

変数 df の欠損値に対処します.欠損値がある行を削除(リストワイズ)してください.
(※ 変数 df の中身は書き換えられないようにしてください.)

import numpy as np
from numpy import nan as NA
import pandas as pd

df = pd.DataFrame(np.random.rand(100, 10))

# データを欠損させます
df.iloc[3, 0] = NA
df.iloc[10:20, 2] = NA
df.iloc[45 , :8] = NA
df.iloc[85:95 , 3] = NA

##########

[選択肢]
1. df.dropna(axis=0, inplace=True)
2. df.dropna(axis=1)
3. df.dropna()
4. df[[1, 3, 8]].dropna()

csv の読み込み

下記の設問に対する答えとして相応しものを選択肢から選び、次のコードの空欄(##########)を埋めてください.

Q1: “http://archive.ics.uci.edu/ml/machine-learning-databases/wine/wine.data” から csv 形式のワインに関数データを読み込み、DataFrame 形式で変数 df_wine に代入してください.
また、列名は “連番” で読み込んでください.

Q2:wine_df のカラムに、”, ‘Alcohol’, “Malic acid”, “Ash”, “Alcalinity of ash”, “Magnesium”, “Total phenols”, “Flavanoids”, “Nonflavanoid phenol”, “Proanthocyanis”,
“Color intensity”, “Hue”, “OD280/0D315 of diluted wines”, “Proline” を追加してください.

import pandas as pd

# Q1
wine_df = ##########

# Q2
##########

wine_df.head()

[Q1 の選択肢]
1. pd.read_csv(“http://archive.ics.uci.edu/ml/machine-learning-databases/wine/wine.data”, header=True)
2. pd.read_csv(“http://archive.ics.uci.edu/ml/machine-learning-databases/wine/wine.data”, header=None)
3. pd.csv_read(“http://archive.ics.uci.edu/ml/machine-learning-databases/wine/wine.data”, header=True)
4. pd.csv_read(“http://archive.ics.uci.edu/ml/machine-learning-databases/wine/wine.data”, header=None)

[Q2 の選択肢]
1. wine_df.columns = {0 : ”, 1 : ‘Alcohol’, 2 : “Malic acid”, 3 : “Ash”, 4 : “Alcalinity of ash”, 5 : “Magnesium”, 6 : “Total phenols”, 7 : “Flavanoids”, 8 : “Nonflavanoid phenol”, 9 : “Proanthocyanis”,
10 : “Color intensity”, 11 : “Hue”, 12 : “OD280/0D315 of diluted wines”, “Proline”}
2. wine_df.columns = [”, ‘Alcohol’, “Malic acid”, “Ash”, “Alcalinity of ash”, “Magnesium”, “Total phenols”, “Flavanoids”, “Nonflavanoid phenol”, “Proanthocyanis”,
“Color intensity”, “Hue”, “OD280/0D315 of diluted wines”, “Proline”]
3. wine_d[“columns”] = {0 : ”, 1 : ‘Alcohol’, 2 : “Malic acid”, 3 : “Ash”, 4 : “Alcalinity of ash”, 5 : “Magnesium”, 6 : “Total phenols”, 7 : “Flavanoids”, 8 : “Nonflavanoid phenol”, 9 : “Proanthocyanis”,
10 : “Color intensity”, 11 : “Hue”, 12 : “OD280/0D315 of diluted wines”, “Proline”}
4. wine_df[“columns”] = [”, ‘Alcohol’, “Malic acid”, “Ash”, “Alcalinity of ash”, “Magnesium”, “Total phenols”, “Flavanoids”, “Nonflavanoid phenol”, “Proanthocyanis”,
“Color intensity”, “Hue”, “OD280/0D315 of diluted wines”, “Proline”]

csv の読み込み

下記の設問に対する答えとして相応しものを選択肢から選び、次のコードの空欄( ########## )を埋めてください.
Q1: “http://archive.ics.uci.edu/ml/machine-learning-databases/wine/wine.data” から csv 形式のワインに関数データを読み込み、DataFrame 形式で変数 df_wine に代入してください.
また、列名は “連番” で読み込んでください.

Q2:wine_df のカラムに変数 wine_col を追加してください.

import pandas as pd

# Q1
wine_df = ##########

wine_col = [”, ‘Alcohol’, “Malic acid”, “Ash”, “Alcalinity of ash”, “Magnesium”, “Total phenols”, “Flavanoids”, “Nonflavanoid phenol”, “Proanthocyanis”,
“Color intensity”, “Hue”, “OD280/0D315 of diluted wines”, “Proline”]

# Q2

wine_df.head()

[Q1 の選択肢]
1. pd.read_csv(“http://archive.ics.uci.edu/ml/machine-learning-databases/wine/wine.data”, header=None)
2. pd.csv_read(“http://archive.ics.uci.edu/ml/machine-learning-databases/wine/wine.data”, header=None)
3. pd.read_csv(“http://archive.ics.uci.edu/ml/machine-learning-databases/wine/wine.data”, header=True)
4. pd.csv_read(“http://archive.ics.uci.edu/ml/machine-learning-databases/wine/wine.data”, header=True)

[Q2 の選択肢]
1. wine_df.column = wine_col
2. wine_df[“columns”] = wine_col
3. wine_df.columns = wine_col
4. wine_df[wine_col]

グループ化

次のコードで空欄になっている行に入る適切な選択肢を 1 ~ 3 から選び、下記の設問に答えてください.

Q1:変数 df_propery を「Pre」についてグループ化し変数 grouped_Pre に代入してください
Q2:変数 mean_df の各列ごとの平均値を求め変数 mean_df に代入してください.
Q3:変数 mean_df の「Rent」について降順にソートし変数 asc_df に代入してください.

import pandas as pd

df_propery = pd.DataFrame([[“Shibuya”, 90000, 6.5, “Tokyo”],
[“Umeda”, 65000, 7.0, “Osaka”],
[“Kawasaki”, 55000, 7.0, “Kanagawa”],
[“Yokohama”, 80000, 6.0, “Kanagawa”],
[“Shinjuku”,88000, 8.0, “Tokyo” ],
[“Namba”, 47000, 10, “Osaka”]],
columns=[“Sta”, “Rent”, “Area”, “Pre”])
# Q1
grouped_Pre = ##########

[Q1の選択肢]
1. df_propery.group(“Pre”)
2. df_propery.groupby(“Pre”)
3. df_propery.DataFrame_to_group(“Pre”)

# Q2
mean_df= ##########

[Q2の選択肢]
1. grouped_Pre.mean(axis=0)
2. grouped_Pre.mean()
3. np.mean(grouped_Pre)

# Q3
asc_df= mean_df.sort_values(by=”Rent”, ascending=False)
print(asc_df)

[Q3の選択肢]
1. mean_df.sort_values(by=”Rent”, ascending=False)
2. mean_df.sort_values(by=”Rent”, ascending=True)
3. mean_df.sort_values(“Rent”, ascending=False)