とある統計学者の技術 Tips

統計学の話はしないかもしれません

漸近相対効率のはなし

一発目の記事からやけに具体的だな,と.

テーマは特に脈絡なく,不定期に,その時その時に書く気になったものを書く予定.間違いがあればガンガン指摘してくれたら嬉しいです.今回は漸近相対効率(Asymptotic Relative Efficiency; ARE)のはなし.

要約
* 漸近相対効率は,複数の統計学的決定方式を比較するために用いられる
* 統計量の漸近正規性に基づいて,同じ検出力を維持できるサンプルサイズの比か,点推定であれば推定量の分散の比をとる.

文脈は?

データの分布に一癖あるような状況(分布の裾が正規分布よりも厚かったり,外れ値を含んでいたりする場合)において,ノンパラメトリック法やM推定(外れ値に対処するための推定法)などの手法を提案する場面で見かける概念. 念頭に置いた「一癖あるデータ」の分析において,提案する手法を典型的な手法(t検定,OLSなど)と比較して評価するために用いられる. 「どの程度の検出力を確保できるか」という話なので,統計量の開発でもしない限りは話に上ることはあまりないような気がするが,どうだろう.

具体的に何をどうする?

簡単のため,母分散既知の状況での母平均の比較の検定を考える.
手法T, Sに対応する異なる2つの統計量をT_{n}, S_{m}とする.ただし, m = cnである. このとき cは2つの手法で同じ検出力を出すために必要なサンプル数の比を意味する. したがって, c \lt 1であれば,手法Sは同じデータに対して手法Tよりも少ないデータで同じ検出力を発揮でき, c=1であれば2手法は同等, c>1であれば手法Sは手法Tに劣るということになる.

また,サンプルサイズは推定量の分散に比例するため,点推定の場合には,分散比を漸近相対効率とすることもできる.
 n \rightarrow \inftyのとき,手法Tによる推定量 \sqrt{n}(T_n - \mu) \sim N(\mu, \sigma^2_T),手法Sによる推定量 \sqrt{n}(S_n - \mu) \sim N(\mu, \sigma^2_S)とすると,SのTに対する漸近相対効率は \sigma^2_T / \sigma^2_Sである.

使用例は?

現代数理統計学(竹村; 1991)から引用した.
正規分布でもほとんど効率が落ちていない上,すこし裾の厚い分布になると \bar Xに基づく検定を行うよりも高効率な検定であることが読み取れる.

ウィルコクソン検定の \bar Xに対するARE
正規分布: 0.955
logistic分布: 1.097
t分布(5): 1.24
t分布(3): 1.90

参考文献

現代数理統計学 (創文社現代経済学選書)

現代数理統計学 (創文社現代経済学選書)

[上位 r 個の観測値に基づく確率点の推定(高橋,渋谷; 2004)]http://www.ism.ac.jp/editsec/toukei/pdf/52-1-093.pdf