あるshimaoの備忘録的な何か

コードを書かない分析系の記事を書いていきます。コードを記述する場合はQiitaに書いています。

分析

各群における反応率と各群の総サンプル数しかわからない場合の検定

この記事に書いたこと 書くことになったきっかけ standard error of the difference of proportions(SEDP)について SEDPの導出 書いた動機 先日、上長と話していたとき『機械学習するときにどれだけサンプル数があれば良いか』って話になりました。そこでサ…

SVDによる次元圧縮の効果を見てみる

SVD入門 SVDについてはwikipediaやteramonagi大先生のRcppEigen & singular value decompositionを参照していただきたく思います。 今回やっていることを手順ごとに簡単に書くと、 1.行列XをX=UΣV^Tと分解 2.情報量の多い上位k個の特異値を用いk列の正規…