精度

正常なメールとスパムメールの例がデータとして用意されています. あなたはこのデータを用いて、機械学習モデルを訓練し、スパムメールフィルタを作ろうと考えています. このスパムフィルタの精度(性能指標)として適切なものを選択肢 1 ~ 3 から選んでください. ただし、このフィルタの機能は新しく届いたメールがスパムかどうかを判定するのみです. 1. スパムと分類されたメールのうち、分類結果が正しかった割合と、スパムではないと分類されたメールのうち分類結果が正しかった割合の和. 2. 分類した全てのメールのうち、正しく分類されたメールの割合. 3. スパムではないと分類されたメールのうち、分類結果に誤りがあった割合.

回帰・分類アルゴリズム – 特徴量、属性

回帰アルゴリズムの説明として正しいものを選択肢 1 ~ 3 から選んでください. 1. 特徴量から、新たな特徴量を生成するアルゴリズム. 2. 特徴量から、ターゲットの数値を予測するアルゴリズム. 3. 特徴量から、入力がスパムかどうか分類するアルゴリズム.

回帰・分類アルゴリズム – 特徴量、属性

回帰アルゴリズムの説明として正しいものを選択肢 1 ~ 3 から選んでください. 1. 特徴量から、インスタンスごとの類似性を探索するアルゴリズム. 2. 特徴量から、似た特徴をもつデータとそうでないデータの間の閾値を求めるアルゴリズム. 3. 特徴量から、ターゲットの数値を予測するアルゴリズム.

バッチ学習

バッチ学習の説明として正しいものを選択肢 1 ~ 3 から選んでください. 1. データセットが大規模な時に有効である. 2. バッチ学習では、訓練データに新しいデータが追加されてたとしても、学習を中断する必要はなく、1 から訓練をやり直す必要もない. 3. バッチ学習は、一般的にオフラインで行われることが多い.

バッチ学習

バッチ学習の説明として正しいものを選択肢 1 ~ 3 から選んでください. 1. 訓練データが少ないときに有効である. 2. バッチ学習では、訓練データに新しいデータが追加されてたとしても、学習を中断する必要はなく、1 から訓練をやり直す必要もない. 3. 大量の計算資源が必要となるが計算処理にかかる時間は少なくなる.

精度

正常なメールとスパムメールの例がデータとして用意されています. あなたはこのデータを用いて機械学習モデルを訓練し、スパムメールフィルタを作ろうと考えています. このスパムフィルタの精度(性能指標)として適切なものを選択肢 1 ~ 3 から選んでください. ただし、このフィルタの機能は新しく届いたメールがスパムかどうかを判定するのみです. 1. 分類した全てのメールのうち、正しく分類されたメールの割合 2. スパムかどうか分類されたメールのうち、それぞれの分類結果が正しかった割合 3. スパムと分類されたメールのうち、分類結果が正しかった割合.

信頼区間推定 3.

ある花の大きさを表すデータからなるデータセットがあります.この花のデータは正規分布に従うようです. このデータセットから、5 回データをランダムにサンプリングしたところ 76 ミリ、85 ミリ、82 ミリ、80 ミリ、77 ミリでした. この時、データセットの分散 $$sigma^2$$ の 95% 信頼度区間を求めてください. 答えは、カイ二乗分布表(https://www.saiensu.co.jp/book_support/978-4-88384-140-0/chi-square_distribution.pdf)を用いて、小数点第二位まで求めてください. (Q1