インスタンス間の距離

多次元のデータセットの説明として正しいものを選択肢 1 ~ 3 から選んでください.

1. 多次元のデータセットで学習したモデルは低次元のモデルと比べて信頼性は高い.
2. 多次元のデータセットではデータ点どうしの距離が遠く、非常に疎であるリスクがある.
3. 次元が低ければ低いほど過学習のリスクは上がる.

インスタンス間の距離

多次元のデータセットの説明として正しいものを選択肢 1 ~ 3 から選んでください.

1. 機械学習モデルは高次元のデータほど予測精度が向上するため、出来るだけ多くの特徴量をモデルに与えるのが好ましい
2. 次元の呪いの解決方法として、高次元なデータであってもそれぞれのインスタンス間の距離が十分近くなるように
 データ数を増やすことで、データセットを密にするといった方法がある.この方法は比較的用意に実践できる.
3. 高次元のデータは、それぞれのデータ間の距離が遠く互いに疎であると考えられる.このようなデータでモデルを訓練して、
  新たなインスタンスに対して何らかの予測を行うのは非常に困難であるといえる.

多様体学習、多様体仮説

多様体仮説の説明として正しいものを選択肢 1 ~ 3 から選んでください.

1. 高次元のデータセットは、それよりも低次元の多様体に近いという仮説.
2. 高次元の多様体で各インスタンス間の距離が非常に大きい場合は次元削減できないという仮説.
3. 高次元多様体を次元削減すると多くの特徴量が確実に失われ、学習用のデータとして成立しなくなるとうい仮説.

多様体学習、多様体仮説

多様体仮説の説明として正しいものを選択肢 1 ~ 3 から選んでください.

1. 高次元の多様体で各インスタンス間の距離が非常に大きい場合は次元削減できないという仮説.
2. 高次元多様体を次元削減すると多くの特徴量が確実に失われ、学習用のデータとして成立しなくなるとうい仮説.
3. 高次元のデータセットは、それよりも低次元の多様体に近いという仮説.

次元の呪い、次元削減

次元削減の説明として正しいものを選択肢 1 ~ 3 から選んでください.

1. 次元削減を行うとパイプラインが単純となり、システムのメンテナンスがしやすくなる.
2. 低次元のデータを高次元に変換することで、データの可視性がよくなる.
3. 次元削減すると学習スピードが上がるが、いくらかはデータから情報が失われる.
 しかし、情報が失われたことでモデルの汎化性能が向上することある.
4. 機械学習モデルに与えるデータは、学習スピード上げるためにも必ず次元削減をすべきである.

次元の呪い、次元削減

次元削減の説明として正しいものを選択肢 1 ~ 3 から選んでください.

1. 次元削減を行うとパイプラインが単純となり、システムのメンテナンスがしやすくなる.
2. データの可視化に役立つ.
3. 次元削減すると学習スピードが上がるが、まれに情報が失われ学習に時間がかかることがある.