cov-shift 研究

importance estimation と two-sample test パラメトリックモデルで対立仮説を考えなければ、おそらく簡単。対立仮説を考慮してパワーを上げようとすると、難しいかもしれない。凸多面体なら混合カイ2乗だけど、内積を定義する正定値行列と分散(の逆)が異な…

test について:考えていた程には簡単ではなさそう、ということを認識しつつあります。少なくとも学部生の演習問題ではなさそうなので、考えてみたいと思います。

Great Sugi-san!

bio 系。何も貢献していないのに論文に名前を載せていただいて、恐縮です。 スギさんズッキーさんの頑張りで、理論面での進展もありそうです。

投稿しました。

電話で相談。共著者のパワーは本当にすごく、頭が上がりません。

すぎさん・たけさんのペースが速い。 原稿を読んでいます。

投稿しました。

Short version を会議に投稿しました。

すぎポンが修正してくれた原稿をザッと読みました。ほとんど最終稿です。 要点がよくまとめられていて、分かりやすいです。論文の書き方など、(いまさらですが)とっても勉強になっています。

簡単な論文の校正をしました。

Proceedings を読んでいます。

校正

Conferenceに投稿するために、元原稿の short version を書いています。 tex compile が通るようになり、少し縮めて、共著者に送りました。

51ページ論文を読んで校正しました。 LogReg と QIN法は、どのパラメータを nuisance とみなすか、という違いなのでは、という気がしてきました。そういう意味では importance に対するモデルが違うだけ、という解釈も成り立ちそうです。(厳密には、損失の各…

最終チェックのため、論文(50ページ越え)を読み直しています。 LogReg だと、cov-shift が生じるかどうかが r.v. となる。QINらの empirical likelihood だと、そこは r.v とは看倣さない。その差はどの程度か? もちろん、r.v ではないとするのが今の設定で…

一通り完成しました。これから数日で論文のチェックです。

Semipara関連の文献をどのように引用すべきか考えています。医療統計方面で、同様の研究がさかんに行われているようです。

統計方面の論文でも density ratio estimation を扱っているものが、かなりあります。 Inferences for case-control and semiparametric two-sample density ratio models Semiparametric density estimation under a two-sampe density ratio model Merging…

50ページ論文を校正しています。Learning curve の導出に符号のミスなどがあるようで、修正しました。数値計算の精度を上げて計算し直し、path-following の図を差し替えました。 校正した論文を共著者に送りました。

50ページ越えの論文を読みなおしています。すぎポンの構成力のおかげで、読みやすいです。

昨日の証明に補足を加え、より読みやすくしました。 非負定値行列 の第1固有値を とするとき、 が成り立つことを論文でどこまで説明すべきかについて、共著者と若干のやりとりをしました。式変形について、一言あると論文が格段に読みやすくなるハズ、とい…

LSIF と uLSIF の差のバウンドに関する証明を論文に追加しました。簡潔な証明にするために若干考えました。論文を共著者に送りました。 以下の内容は直感的に明らかで、証明も簡単です。 The cone generated by includes the eigenvector of the largest eig…

LSIF と uLSIF の差を見積もるのに、間に qLSIF を入れていました。 が大きいと uLSIF と qLSIF の差はかなり小さいです。したがって qLSIF と LSIF の差を見積もればよいことになります。Hölder's ineq の上界はすでに導出してあったので、それらを使うと、…

が小さいときの path-following の数値精度を上げるにはどうすべきかについて少々考えました。うまい方法は思い付きません。きちんと計算するには有効数字 100 桁くらい必要で、そこをサボると、(R の quadprog では) QP がうまく解けない。ヘシアンに対角行…

LSIF-uLSIFの差に関する不等式評価を数値的に示す実験をして、論文に載せました。 どうやら誤差のほとんどは LSIF vs. qLSIF が持っているらしく、qLSIF vs. uLSIF の誤差は相対的に大きくはない。 結果的に、ある制約下での L1-regularization と L2-regula…

LSIF-uLSIF のバウンドを論文に加えています。

LSIF と uLSIF の差のノルムの上界を数値的に見ました。Hölder's inequality に関連している上界は、数値的にもなかなか良いです。LSIF を gLSIF と関連付けるところで近似を入れていますが、これがかなり tight であることを確認できました。 Hölder's ineq…

LSIF を path-following algorithm (Lemke法) で解くのではなく、いくつかの ごとに、単純に QP で解くプログラムを実装しました。R library の quadprog に行列などを代入するだけです。簡単な例を論文に図示するだけなら十分です。 バグがあり、しばらくう…

論文の証明を修正。LSIF の Learning curve に関する仮定を緩めることができる点をまとめました。Strong complementarity。 uLSIFにおいて strong complementarity に相当する条件を書き加えました。Any element of the solution is non-zero. LSIF を Quadr…