前回までに,
パーセプトロンはとてもシンプルでわかりやすいモデルでしたが,
今回は線形分離できないデータにも適用できる分類モデルとして,
予測の信頼度
分類器を使って,
一般的にスパムフィルタでは,
スパムフィルタを通り抜けてしまった迷惑メールを一つ一つ消す,
このように,
例えば予測に自信がない場合はスパムに分類しないことで,
そういう
パーセプトロンはこの判別式f(x)の値が正か負かでデータ点の分類を推定する2値分類器でした。
この判別式からはもちろん符号だけではなく値の大小も得られますから,
ところが残念なことに,
例えば正解が正のデータに対する予測値が正しければ,
つまり値の正負は学習しますが,
ちなみに,
判別関数を確率化
ここでは,
例えば
またこの確率の値pは,
では分類モデルをどのすれば確率化できるか考えるために,
この式の値は明らかに確率にはなりようがありません。確率の値は0から1の間であるのに,
そこで実数全体を確率の範囲である0から1に押し込めてしまう関数σを用意します。ちなみにこのσは
シグモイド関数σはこのようになだらかに0から1まで変化する関数です。
このσにf(x)を放り込んで,
「えっ,
本当にp(x)を確率としてしまっていいのか,
大丈夫,