多次元のデータセットの説明として正しいものを選択肢 1 ~ 3 から選んでください. 1. 多次元のデータセットで学習したモデルは低次元のモデルと比べて信頼性は高い. 2. 多次元のデータセットではデータ点どうしの距離が遠く、非常に疎であるリスクがある. 3. 次元が低ければ低いほど過学習のリスクは上がる.
Author Archives: admin_uhs64
インスタンス間の距離
多次元のデータセットの説明として正しいものを選択肢 1 ~ 3 から選んでください. 1. 機械学習モデルは高次元のデータほど予測精度が向上するため、出来るだけ多くの特徴量をモデルに与えるのが好ましい 2. 次元の呪いの解決方法として、高次元なデータであってもそれぞれのインスタンス間の距離が十分近くなるように データ数を増やすことで、データセットを密にするといった方法がある.この方法は比較的用意に実践できる. 3. 高次元のデータは、それぞれのデータ間の距離が遠く互いに疎であると考えられる.このようなデータでモデルを訓練して、 新たなインスタンスに対して何らかの予測を行うのは非常に困難であるといえる.
射影 – 部分空間
射影について説明している以下の文の空欄入る適切な単語を選択肢 1 ~ 3 から選んでください. 実際には、高次元空間全体に訓練インスタンスが散らばっているのではなく、次数の低い ( Q1 ____ ) に収まっている. 1. 平面空間 2. 1 つの点 3. 部分空間
射影 – 部分空間
射影について説明している以下の文の空欄入る適切な単語を選択肢 1 ~ 3 から選んでください. 実際には、高次元空間全体に訓練インスタンスが散らばっているのではなく、次数の低い ( Q1 ____ ) に収まっている. 1. 部分空間 2. ハイパープレイン 3. 平面空間
多様体学習、多様体仮説
多様体仮説の説明として正しいものを選択肢 1 ~ 3 から選んでください. 1. 高次元のデータセットは、それよりも低次元の多様体に近いという仮説. 2. 高次元の多様体で各インスタンス間の距離が非常に大きい場合は次元削減できないという仮説. 3. 高次元多様体を次元削減すると多くの特徴量が確実に失われ、学習用のデータとして成立しなくなるとうい仮説.
多様体学習、多様体仮説
多様体仮説の説明として正しいものを選択肢 1 ~ 3 から選んでください. 1. 高次元の多様体で各インスタンス間の距離が非常に大きい場合は次元削減できないという仮説. 2. 高次元多様体を次元削減すると多くの特徴量が確実に失われ、学習用のデータとして成立しなくなるとうい仮説. 3. 高次元のデータセットは、それよりも低次元の多様体に近いという仮説.
PCA : 主成分分析
PCA の説明をしている以下の文の空欄に入る適切な単語を選択肢 1 ~ 3 から選んでください. PCA では、次元削減するにあたり訓練セットの ( Q1 ____ ) を最大限に維持できる軸を見つけ出す. [選択肢] 1. 平均 2. 期待値 3. 分散
多様体 – swiss roll
swiss roll データセットを選択肢 1 ~ 3 から選んでください. 1. swiss roll 2. 適当な図 3. 適当な図
次元の呪い、次元削減
次元削減の説明として正しいものを選択肢 1 ~ 3 から選んでください. 1. 次元削減を行うとパイプラインが単純となり、システムのメンテナンスがしやすくなる. 2. 低次元のデータを高次元に変換することで、データの可視性がよくなる. 3. 次元削減すると学習スピードが上がるが、いくらかはデータから情報が失われる. しかし、情報が失われたことでモデルの汎化性能が向上することある. 4. 機械学習モデルに与えるデータは、学習スピード上げるためにも必ず次元削減をすべきである.
次元の呪い、次元削減
次元削減の説明として正しいものを選択肢 1 ~ 3 から選んでください. 1. 次元削減を行うとパイプラインが単純となり、システムのメンテナンスがしやすくなる. 2. データの可視化に役立つ. 3. 次元削減すると学習スピードが上がるが、まれに情報が失われ学習に時間がかかることがある.