AdaGrad を説明している以下の文で空欄に入る適切な単語を選択肢からそれぞれ選んでください.
AdaGrad では,勾配に応じて ( Q1 ___ ) を変化させていくことで訓練を最適化する.
具体的には,勾配が大きな時,つまり傾斜が急な場合には学習率を大きくし,傾斜が緩やかになると学習率を小さくする.
これを (Q2 ___ ) と呼ぶ.ただし ( Q3 ___ ) では,学習率が下がりすぎてしまい,全体の最適解が求まる前に訓練が終了することがある.
AdaGrad は単純な ( Q4 ___ ) 問題では効率よく最適解を見つけ出すことができる.
[Q1の選択肢]
1. 勾配降下速度
2. 勾配降下加速度
3. 学習率
4. 慣性
[Q2の選択肢]
1. 適応勾配率
2. 適応慣性率
3. 適応学習率
[Q3, Q4の選択肢]
1. ユニット数の小さい DNN モデル
2. 深層な DNN モデル
3. 高次元
4. 2 次元