pythonではじめる機械学習の勉強 2.3.3.5クラス分類、線形モデルについて
線形モデルの分類はy=w[0]*x[0]+...+w[p]*x[p]+b>0。これは線形回帰と違いyが0より大きいか判断する。
線形クラス分類はロジスティクス回帰と線形サポートベクタマシーンがある。ロジスティクス回帰は回帰とあるが分類である。
これらのモデルにはパラメーターCがあり、Cが大きくなると正則化(L2)が弱くなる。つまりCが大きくなると訓練データに対して適合し、小さくなると重みwを0に近づける。
LinearSVCの場合は
mglearn.plots.plot_inear_svc_regularization()
で確認できる。実際にCが大きくなるとクラス0の外れ値を分類しようと決定境界の傾きが大きくなる(過剰適合)。