下記の設問に対する答えとして相応しものを選択肢から選び、次のコードの空欄(##########)を埋めてください. Q1:各ビンに含まれる要素の項数が均等になるように、変数 df の “Weight” 列を 5 ビン詰めしてください.また、ビン名には bin_labels を指定してください. Q2:Q1 で得られた Category の各ビンごとのデータの個数をカウントしてください. import pandas as pd import numpy as np df = pd.DataFrame({“Height” : np.arange(155, 185, 3), “Weight” : np.arange(45, 85, 4), “Sex” : [“Female”, “Male”, “Male”, “Female”, “Female”, “FeMale”, “Female”, “Male”, “Male”, “Male”], “School Year” : [1, 1, 2, 4, 3, 4, […]
Category Archives: 未分類
ピボットテーブル化と逆変換
下記の設問に対する答えとして相応しものを選択肢から選び、次のコードの空欄(##########)を埋めてください. 変数 df を以下に示す配列へ Tidy Data(整然データ)化してください. ########## 配列 ########## # index variable value # 0 a A 101 # 1 b A 102 # 2 c A 103 # 3 a B 201 # 4 b B 202 # 5 c B 203 # 6 a C 301 # 7 b C 302 # 8 […]
ピボットテーブル化と逆変換
下記の設問に対する答えとして相応しものを選択肢から選び、次のコードの空欄(##########)を埋めてください. 変数 df を以下に示す配列へ Tidy Data(整然データ)化してください. ########## 配列 ########## # index variable value # 0 a A 101 # 1 b A 102 # 2 c A 103 # 3 a B 201 # 4 b B 202 # 5 c B 203 # 6 a C 301 # 7 b C 302 # 8 […]
DataFrame からの統計量の算出
下記の設問に対する答えとして相応しものを選択肢から選び、次のコードの空欄(##########)を埋めてください. 変数 wine_df の “Flavanoids” 列の分散を算出し、出力してください. import pandas as pd wine_df = pd.read_csv(“http://archive.ics.uci.edu/ml/machine-learning-databases/wine/wine.data”, header=None) wine_col = [”, ‘Alcohol’, “Malic acid”, “Ash”, “Alcalinity of ash”, “Magnesium”, “Total phenols”, “Flavanoids”, “Nonflavanoid phenol”, “Proanthocyanis”, “Color intensity”, “Hue”, “OD280/0D315 of diluted wines”, “Proline”] wine_df.columns = wine_col print(##########) 1. wine_df[Flavanoids”].std() 2. wine_df[Flavanoids”].var() 3. wine_df[Flavanoids”].sample() 4. wine_df[Flavanoids”].median()
重複データ
下記の設問に対する答えとして相応しものを選択肢から選び、次のコードの空欄(##########)を埋めてください. Q1:変数 df の重複のある行を確認してください.このとき、重複ている行のうち、最後の行が “True” と出力されるようにしてください. Q2:変数 df の重複のある行を削除してください. import pandas as pd df = pd.DataFrame({“col1” : [0, 9, 3, 3, 6, 1, 2, 2, 8], “col2” : [“a”, “c”, “b”, “b”, “c”, “c”, “a”, “a”, “b”]}) #Q1 print(##########) #Q2 print(##########) [Q1, Q2 の選択肢] 1. df.drop_dupulicated 2. df.drop_dupulicates 3. df.duplicated(keep=”first”) 4. df.duplicated(keep=”last”)
重複データ
下記の設問に対する答えとして相応しものを選択肢から選び、次のコードの空欄(##########)を埋めてください. Q1:変数 df の “col2″ 列のうち、重複している行を全て確認してください.このとき、重複している行が全て ” True” と出力されるようにしてください. Q2:変数 df の “col2” 列のうち、重複のある行を全て削除してください. import pandas as pd df = pd.DataFrame({“col1” : [0, 9, 3, 3, 6, 1, 2, 2, 8], “col2” : [“a”, “c”, “d”, “b”, “c”, “c”, “a”, “a”, “e”]}) #Q1 print(##########) #Q2 print(##########) [Q1, Q2 の選択肢] 1. df.drop_dupulicates(subset=”col2″, keep=False) 2. df.drop_dupulicates(keep=False) 3. […]
重複データとグループ化
下記の設問に対する答えとして相応しものを選択肢から選び、次のコードの空欄(##########)を埋めてください. 変数 df の “col2” 列の各要素が、それぞれどれだけ重複しているのかを確認するために、各要素の個数をカウントしてください. import pandas as pd df = pd.DataFrame({“col1” : [0, 9, 3, 3, 6, 1, 2, 2, 8], “col2” : [“a”, “c”, “d”, “b”, “c”, “c”, “a”, “a”, “e”]}) print(##########) [選択肢] 1. df.groupby(“col2”).sum().sum() 2. df[“df2”].count_valuse() 3. df.duplicated().value_counts() 4. df.groupby(“col2”).counts()
重複データとグループ化
下記の設問に対する答えとして相応しものを選択肢から選び、次のコードの空欄(##########)を埋めてください. 変数 df の “col2” 列の各要素が、それぞれどれだけ重複しているのかを確認するために、重複した行の数をカウントしてください. import pandas as pd df = pd.DataFrame({“col1” : [0, 9, 3, 3, 6, 1, 2, 2, 8], “col2” : [“a”, “c”, “d”, “b”, “c”, “c”, “a”, “a”, “e”]}) print(##########) [選択肢] 1. df.groupby(“col2”).sum().sum() 2. df[“df2”].valuse_counts() 3. df.duplicated().value_counts() 4. df.groupby(“col2”).counts()
重複データのカウント
下記の設問に対する答えとして相応しものを選択肢から選び、次のコードの空欄(##########)を埋めてください. 変数 df の “col2” 列には、何パターンの要素があるか調べてください. (要素のパターン = 重複を除いた行数の意) import pandas as pd df = pd.DataFrame({“col1” : [0, 9, 3, 3, 6, 1, 2, 2, 8], “col2” : [“a”, “c”, “d”, “b”, “c”, “c”, “a”, “a”, “e”]}) print(##########) [選択肢] 1. pd.value_counts(set(df.col2.unique())) 2. set(df.col2.unique()).count() 3. len(set(df.col2.unique())) 4. set(df.col2.unique).shpae
重複データのカウント
下記の設問に対する答えとして相応しものを選択肢から選び、次のコードの空欄(##########)を埋めてください. 変数 df の “col2” 列には、何パターンの要素があるか調べてください. (要素のパターン = 重複を除いた行数の意) import pandas as pd df = pd.DataFrame({“col1” : [0, 9, 3, 3, 6, 1, 2, 2, 8], “col2” : [“a”, “c”, “d”, “b”, “c”, “c”, “a”, “a”, “e”]}) print(##########) [選択肢] 1. pd.value_counts(set(df.col2.unique())) 2. set(df.col2.unique()).counts() 3. set(df.col2.unique()) 4. set(df.col2.unique).shpae[0]