収縮

正則化テクニックである収縮について説明している以下の文の空欄入る適切な単語を選択肢 1 ~ 3 からそれぞれ選んでください.

勾配ブースティングに代表されるようなアンサンブルメソッドでは、学習率を低い値に設定すると、
訓練セットへの適合率が小さくなるため ( Q1 ____ ) する必要が出てくるが、( Q2 ____ ) は上がる.
裏を返せば、それぞれの木が学習結果に与える影響を小さくすることで( Q3____ )できる.これが収束である.

[Q1の選択肢]
1. 多OOB 検証
2.くの学習器を追加
3. 訓練セットを大きく

[Q2の選択肢]
1. 分散
2. 汎化性能
3. バイアス

[Q3の選択肢]
1. 正則化
2. 計算を高速化
3. モデルを縮小化

スタッキング、バンピング

スタッキングの説明として正しくない文を選択肢 1 ~ 3 から選んでください.

1. スタッキングでは、ハード投票分類器のように集計用の関数を用意する必要がある.
2. scikit-learn にはスタッキング用のクラスは存在しない.
3. スタッキングでは、複数の学習器の予測結果を入力として学習するブレンダーと呼ばれる学習器が最終的な数値を決定する.

スタッキング、バンピング

スタッキングの説明として正しくない文を選択肢 1 ~ 3 から選んでください.

1. ブートストラップと同じ流れで各学習器を訓練し、それぞれの学習器の出力を入力として加重総和を求める新たな学習器を用意することで、最終的な予測値を決定する.
2. ブートストラップと同じ流れで各学習器を訓練し、それぞれの学習器の中から最良のものを選択肢する.
3. 勾配ブースティングと同じ流れで各学習器を訓練し、それぞれの学習器の出力を入力として加重総和を求める新たな学習器を用意することで、最終的な予測値を決定する.
4. 勾配ブースティングと同じ流れで各学習器を訓練し、それぞれの学習器の中から最良のものを選択肢する.

スタッキング、バンピング

スタッキングの説明として正しくない文を選択肢 1 ~ 3 から選んでください.

1. ブートストラップと同じ流れで各学習器を訓練し、それぞれの学習器の出力を入力として加重総和を求める新たな学習器を用意することで、最終的な予測値を決定する.
2. ブートストラップと同じ流れで各学習器を訓練し、それぞれの学習器の中から最良のものを選択肢する.
3. 勾配ブースティングと同じ流れで各学習器を訓練し、それぞれの学習器の出力を入力として加重総和を求める新たな学習器を用意することで、最終的な予測値を決定する.
4. 勾配ブースティングと同じ流れで各学習器を訓練し、それぞれの学習器の中から最良のものを選択肢する.

次元の呪い、次元削減

次元削減の説明として正しいものを選択肢 1 ~ 3 から選んでください.

1. 次元削減すると学習スピードが上がるが、まれに情報が失われ学習に時間がかかることがある.
2. 次元削減を行うとパイプラインが単純となり、システムのメンテナンスがしやすくなる.
3. データの可視化に役立つ.

次元の呪い、次元削減

次元削減の説明として正しいものを選択肢 1 ~ 3 から選んでください.

1. 次元削減を行うとパイプラインが単純となり、システムのメンテナンスがしやすくなる.
2. データの可視化に役立つ.
3. 次元削減すると学習スピードが上がるが、まれに情報が失われ学習に時間がかかることがある.

次元の呪い、次元削減

次元削減の説明として正しいものを選択肢 1 ~ 3 から選んでください.

1. 次元削減を行うとパイプラインが単純となり、システムのメンテナンスがしやすくなる.
2. 低次元のデータを高次元に変換することで、データの可視性がよくなる.
3. 次元削減すると学習スピードが上がるが、いくらかはデータから情報が失われる.
 しかし、情報が失われたことでモデルの汎化性能が向上することある.
4. 機械学習モデルに与えるデータは、学習スピード上げるためにも必ず次元削減をすべきである.

アダブースト

アダブーストの説明として正しいものを選択肢から選んでください.

[選択肢]
1. 前の学習器の予測値と各データとの差をとることおで残差をえる.次の学習器は、一つ前の学習器から得られた残差とを訓練データとして学習する.
 同様の流れで残差を求め、この学習器と一つ前の学習器を足し合わせる.このようにして、最優的な予測を行う.(モデルのコスト関数は二乗誤差とする)
2. 一つ目の学習器の予測結果から、訓練データに重みを付与する.このように重み付きデータを用いて逐次学習器を訓練していく.
 最終的に、最後の学習器を用いて予測を行う.
3. 一つ目の学習器の予測結果から、訓練データに重みを付与する.このように重み付きデータを用いて逐次学習器を訓練していく.
 最終的に、全ての学習器から得られた重み付きの予測値から、最終的な予測値を決定する.