過学習 – 正規化

過学習の説明として正しいものを選択肢 1 ~ 3 から選んでください. 1. パラメータが数が少ないほど学習が早く進むため、過学習しやすくなる. 2. 過学習しているモデルは、データのノイズに敏感に反応する 3. 過学習しているモデルは、一般的に訓練が足りていないので、訓練回数をさらに増やすと良い.

訓練セット、テストセット

Q1:選択肢 1 ~ 3 のうち誤りがあるものを選んでください. 1. 訓練セットでモデルを訓練し、未知のデータを予測することは機械学習といえる. 2. 統計学とは、データを解析し、その事象の背景を調べる学問体系である. 3. 回帰問題では、訓練セットよりもテストセットの方がデータの量は多い.

訓練セット、テストセット

Q1:選択肢 1 ~ 3 のうち文章の内容が正しいものを選んでください. 1. モデルが新しいデータに汎化できているかを確認するのが検証セットである 2. 教師あり学習では、テストセットも検証セットも必要ない 3. 分類問題では、テストセットは必要なく、検証セットだけで十分である.

特徴量エンジニアリング – 特徴量の洗濯 / 抽出

特徴量エンジニアリングの説明として正しくないものを選択肢 1 ~ 3 から選んでください. 1. 既存の特徴から訓練に最も役立つ特徴量を選択する. 2. 既存の特徴量を組み合わせて、より役立つ新たな特徴量を生成する. 3. 汎化性能の高いモデルを作るために、外れ値のような特徴量を追加する.

モデルの訓練 – パラメータ

モデルの訓練の説明となるように以下の空欄に該当するものを選択肢 1 ~ 3 から選んでください. モデルの訓練とは、(Q1 ____ ) を最小化するモデルの (Q2 _____ ) の組み合わせを見つけ出すこと. [Q1、Q2 の選択肢] 1. 汎化性能 2. 類似度 3. パラメータ 4. コスト関数 5. ハイパーパラメータ 6. 訓練インスタンス