仮説検定
(かせつけんてい)
数理統計学において、母集団に関する仮説を標本値をもとにして検定すること。たとえば、さいころを4回投げて4回とも6の目が出たとする。このさいころは正常といえるか? 正常なさいころであっても4回とも6の目が出ることはありうる。しかしこのようになる確率は(1/6)[▲4]≒0.00077であって非常に小さく、常識的にはこのさいころは正常でないといいたいところである。
このような問題に対して、確率的な考えを用い、さらにある実践上の規約を設けて対処するのが仮設検定の方法であって、その基本的な考えを簡単な型について説明する。
【仮説検定と帰無仮説】
初めに母集団の分布Fについて仮説Hを置く。次に小さな数α(危険率とよばれるもので普通は0.01または0.05にとる)を定めておく。次に分布Fをもつ確率変数Xに対して、実数の領域Rを、Xの値がRに属する確率がたかだかαに等しいようにあらかじめ定めておく。
こうしておいて、試行の結果得られたXの値xがRに属したとすると、もし仮説Hが正しければ、まれにしかおこらないこと(確率がαより小さい)がおこったことになるので、仮説Hは疑わしいとしてHを捨てることにする。これは確率的背理法とでもいえる論法である。また、もし試行の結果得られたXの値xがRに属さない場合にはHは捨てないことにする。捨てないといっても、これだけの理由では捨てることができないというだけで、積極的にHが正しいと主張するのではない。
以上が仮説検定の考えである。この考えを初めにあげたさいころの場合に適用すると、Hは「さいころは正常である。すなわちどの目の出る確率も1/6である」であり、確率変数Xの分布は二項分布B(4,1/6)である。またRとしてR[▼1]={x|x≧4}をとると
P(X∈R[▼1])=P(X=4)=(1/6)[▲4]<0.01
となり、危険率0.01に関してHは捨てられる。すなわち、このさいころは正常とはいえない(危険率0.01で)ということになる。
一般に、仮説を置くとき、初めから捨てられることが予想されている場合が多い。R・A・フィッシャーはこれを帰無仮説と名づけた。
【?(カイ二乗)検定法と適合度の検定】
次の式(*)の形のχ[▲2]を用いる検定法をχ[▲2]検定法という。χ[▲2]検定法は比率の検定、独立性の検定にも利用されるが、ここでは適合度の検定にχ[▲2]検定法を用いる。
全体でk通りの場合があり、n回の実験または観測において結果が各場合に属する回数がf[▼1],f[▼2],……,f[▼k]であったとする。一方、想定された分布において各場合のおこる確率がp[▼1],p[▼2],……,p[▼k]であるとする。このとき
【図】
は、想定された分布と実験による分布との適合の度合いをみるときに用いられる。すなわち適合していればχ[▼2]の値は小さく、適合していなければχ[▼2]の値は大きい。なおここで各場合についてnp[▼i]≧10となるようにしておく。そうでないときは、いくつかの場合をまとめることによってnp[▼i]≧10が成り立つようにしておく。
前記のf[▼1],f[▼2],……,f[▼k]はそれぞれ確率変数Z[▼1],Z[▼2],……,Z[▼k]の実現値と考えられる。Z[▼1],Z[▼2],……,Z[▼k]の確率分布は
【図】
で与えられる。したがって(*)のχ[▼2]は確率変数
【図】
の実現値である。
この確率変数Xの確率分布は、np[▼i]≧10が成り立つとき、自由度k-1のχ[▼2]分布に近い。
このことを利用して、「想定された分布が適合している」という仮説Hを検定することができる。すなわち、危険率を0.01にとるとすると、自由度k-1のχ[▼2]分布の表をみて
P(X>λ)=0.01
のようにλを定める。(*)のχ[▼2]がχ[▼2]>λであれば仮説Hは捨てられ、χ[▼2]≦λであればHは捨てることができない。この検定を適合度の検定という。 <古屋 茂>
