• 1norm-SVM だと、結局のところ条件付き確率は推定できないので、L2-loss で推定することにしました。2norm-SVMでもいいのですが、2norm-SVMが R は kernlab and e1071 にはなく、プログラムしやすい L2-loss で実装しました。
    • Li and Lin らによる C の実装 (libsvm) はとても速く、とても R では敵いません。プログラムのスキルがあまりないので、プログラミング競争とは違う方向に、議論を進めています。
    • いくつか工夫をした結果、R でもそこそこ速くなりました。Noisy data に対する精度は他の方法を上回っています。
    • 条件付き確率の推定について、Platt's method は、漸近的に正しい推定値を与えないことは明らかですが、その簡便さのため多くのライブラリで実装されています。それに対し、2norm-SVMなら条件付き確率を漸近的に正しく推定できるのにも関わらず、あまり実装されていません。計算コストの差と解のスパース性が背景にあると思うが、そのような状況は統計学的には健全ではないように思う。