参考事例
10、9、10、8、9、10、6、10、10、9
・結果は0~10の整数値
・値の上限は10で10付近の値がよく出る
・試行回数10
・必要な値は1
上記の例から、「99%が1以上」という計算結果は導けますでしょうか?
質問を敢えて二つにした、と思うので、もうひとつの質問のことは考えずに書きます。
標本が片側の正規分布に従う、と仮定できるのであれば、標準正規分布表を使って求めます。
あちこちに落ちていると思いますが、ぐぐって最初に見つけたこれを例にとります。
http://www.koka.ac.jp/morigiwa/sjs/standard_normal_distribution.htm
質問の図にある領域が 99% になるということは、この表から 0.495 を探します。
.4949 ― 2.57
.4951 ― 2.58
なので、間を取って Z = 2.575 としましょう。
これは、標準正規分布での値なので、実際の値は μ±2.575×σ となります。
問題となるのが、標本が正規分布に従っているのかどうか、ということです。
標本数が少ないのは気になりますが、定石としては適合度検定です。
#ちょっと、端折ります
帰無仮説を、「標本値正規分布に従う」とし、有意水準αを1% とする。
まず、標本の基本的な統計値。
平均 | 9.1 |
分散 | 1.49 |
標準偏差 | 1.22066 |
次に、検定統計量を求めます。
5 | 6 | 7 | 8 | 9 | 10 | 標本値 |
0 | 1 | 0 | 1 | 3 | 5 | 度数 |
-3.358850874 | -2.539618954 | -1.720387033 | -0.901155113 | -0.081923192 | 0.737308728 | 正規化した値 |
0.4996 | 0.4945 | 0.4573 | 0.3159 | 0.0319 | 0.2704 | 確率(正規分布表から) |
0.0004 | 0.0051 | 0.0372 | 0.1414 | 0.284 | 0.3023 | ランクに入る確率 |
0.004 | 0.051 | 0.372 | 1.414 | 2.84 | 3.023 | 正規表現に従うとした場合の期待値 |
0.004 | 17.65884314 | 0.372 | 0.121213579 | 0.009014085 | 1.292930533 | 検定統計量 |
検定統計量の合計は 19.458 。
検定統計量は、自由度 5 のχ2分布 に従う。
有意水準αを 1% としたときの検定統計量は、χ2分布表 から 16.81。よって、対立仮説は有意水準 1% で棄却され、「標本データは、正規分布に従わないとは言えない」となります。
よって、対立仮説は有意水準 1% で採択され、「標本データは、正規分布に従わないと言える」となります。もってまわった言い方のように聞こえますが、統計検定というのはこういうものです。
適合度検定については、統計の本を読むか、概略でよければ以下のようなところをご覧ください。
あくまでも独立事象として考えてますから、それ以外の要因が値に及ぼす可能性(測定者の習熟度など)を考慮しないと、安全云々の話はできないです。
5 | 6 | 7 | 8 | 9 | 10 | 標本値 |
0 | 1 | 0 | 1 | 3 | 5 | 度数 |
-4.096159603 | -3.276927682 | -2.457695762 | -1.638463841 | -0.819231921 | 0 | 正規化した値 |
0.49998 | 0.4995 | 0.4931 | 0.4495 | 0.2939 | 0 | 確率(正規分布表から) |
1.5E-05 | 0.00048 | 0.0064 | 0.0436 | 0.1556 | 0.2939 | ランクに入る確率 |
0.00015 | 0.0048 | 0.064 | 0.436 | 1.556 | 2.939 | 正規表現に従うとした場合の期待値 |
0.00015 | 206.3381333 | 0.064 | 0.729577982 | 1.340061697 | 1.445294658 | 検定統計量 |
検定統計量の合計は 209.9172177 。
検定統計量は、自由度 5 のχ2分布 に従う。
有意水準αを 1% としたときの検定統計量は、χ2分布表 から 16.81。
よって、対立仮説は有意水準 1% で採択され、「標本データは、正規分布に従わないと言える」となります。
標本から求められた、平均 9.1、標準偏差 1.22 に対して、平均を 10.0 の分布だと仮定してますが、ほぼ μ+σなところです。
μ+σの位置は、正規分布では 84% : 16% の位置になります。
適合しなくて、当然です。
半分に折らない状態での標準正規分布の99.5%点を求めればよいわけで、
2.575829 となります。
つまり -2.575829から0の間に99%の確率分布があることになります。
ご質問の標本が標準正規分布にしたがっているとすると、7以上10以下が99%点になりますから、「99%が1以上」という結論にはなりません。
また、10回試行で6が出ていることは確率を逸脱していますから、その標本は標準正規分布にしたがっている可能性は低いです。
99.5%の範囲が1~19で、0と20が0.5%となる正規分布を考えたときに、
10回試行で6が出るのは確率を逸脱している、ということでしょうか?
質問を敢えて二つにした、と思うので、もうひとつの質問のことは考えずに書きます。
標本が片側の正規分布に従う、と仮定できるのであれば、標準正規分布表を使って求めます。
あちこちに落ちていると思いますが、ぐぐって最初に見つけたこれを例にとります。
http://www.koka.ac.jp/morigiwa/sjs/standard_normal_distribution.htm
質問の図にある領域が 99% になるということは、この表から 0.495 を探します。
.4949 ― 2.57
.4951 ― 2.58
なので、間を取って Z = 2.575 としましょう。
これは、標準正規分布での値なので、実際の値は μ±2.575×σ となります。
問題となるのが、標本が正規分布に従っているのかどうか、ということです。
標本数が少ないのは気になりますが、定石としては適合度検定です。
#ちょっと、端折ります
帰無仮説を、「標本値正規分布に従う」とし、有意水準αを1% とする。
まず、標本の基本的な統計値。
平均 | 9.1 |
分散 | 1.49 |
標準偏差 | 1.22066 |
次に、検定統計量を求めます。
5 | 6 | 7 | 8 | 9 | 10 | 標本値 |
0 | 1 | 0 | 1 | 3 | 5 | 度数 |
-3.358850874 | -2.539618954 | -1.720387033 | -0.901155113 | -0.081923192 | 0.737308728 | 正規化した値 |
0.4996 | 0.4945 | 0.4573 | 0.3159 | 0.0319 | 0.2704 | 確率(正規分布表から) |
0.0004 | 0.0051 | 0.0372 | 0.1414 | 0.284 | 0.3023 | ランクに入る確率 |
0.004 | 0.051 | 0.372 | 1.414 | 2.84 | 3.023 | 正規表現に従うとした場合の期待値 |
0.004 | 17.65884314 | 0.372 | 0.121213579 | 0.009014085 | 1.292930533 | 検定統計量 |
検定統計量の合計は 19.458 。
検定統計量は、自由度 5 のχ2分布 に従う。
有意水準αを 1% としたときの検定統計量は、χ2分布表 から 16.81。よって、対立仮説は有意水準 1% で棄却され、「標本データは、正規分布に従わないとは言えない」となります。
よって、対立仮説は有意水準 1% で採択され、「標本データは、正規分布に従わないと言える」となります。もってまわった言い方のように聞こえますが、統計検定というのはこういうものです。
適合度検定については、統計の本を読むか、概略でよければ以下のようなところをご覧ください。
あくまでも独立事象として考えてますから、それ以外の要因が値に及ぼす可能性(測定者の習熟度など)を考慮しないと、安全云々の話はできないです。
5 | 6 | 7 | 8 | 9 | 10 | 標本値 |
0 | 1 | 0 | 1 | 3 | 5 | 度数 |
-4.096159603 | -3.276927682 | -2.457695762 | -1.638463841 | -0.819231921 | 0 | 正規化した値 |
0.49998 | 0.4995 | 0.4931 | 0.4495 | 0.2939 | 0 | 確率(正規分布表から) |
1.5E-05 | 0.00048 | 0.0064 | 0.0436 | 0.1556 | 0.2939 | ランクに入る確率 |
0.00015 | 0.0048 | 0.064 | 0.436 | 1.556 | 2.939 | 正規表現に従うとした場合の期待値 |
0.00015 | 206.3381333 | 0.064 | 0.729577982 | 1.340061697 | 1.445294658 | 検定統計量 |
検定統計量の合計は 209.9172177 。
検定統計量は、自由度 5 のχ2分布 に従う。
有意水準αを 1% としたときの検定統計量は、χ2分布表 から 16.81。
よって、対立仮説は有意水準 1% で採択され、「標本データは、正規分布に従わないと言える」となります。
標本から求められた、平均 9.1、標準偏差 1.22 に対して、平均を 10.0 の分布だと仮定してますが、ほぼ μ+σなところです。
μ+σの位置は、正規分布では 84% : 16% の位置になります。
適合しなくて、当然です。
平均が10の正規分布との適合度検定した結果を、回答に追記しました。
ありがとうございました。
平均が10の正規分布との適合度検定した結果を、回答に追記しました。
2013/03/01 08:53:48ありがとうございました。
2013/03/04 00:35:27