多次元のデータセットの説明として正しいものを選択肢 1 ~ 3 から選んでください.
1. 機械学習モデルは高次元のデータほど予測精度が向上するため、出来るだけ多くの特徴量をモデルに与えるのが好ましい
2. 次元の呪いの解決方法として、高次元なデータであってもそれぞれのインスタンス間の距離が十分近くなるように
データ数を増やすことで、データセットを密にするといった方法がある.この方法は比較的用意に実践できる.
3. 高次元のデータは、それぞれのデータ間の距離が遠く互いに疎であると考えられる.このようなデータでモデルを訓練して、
新たなインスタンスに対して何らかの予測を行うのは非常に困難であるといえる.