27 CIO補佐官講座 第 5回KPIの例:申請手続処理時間、オンライン利用率、過誤処理件数、 利用者満足度、システム稼働率など 金額換算可能な効果を算出・集計
体験統計学mybook-pub-site.sakura.ne.jp/.../chap12.pdf2 小テスト11.1 解答...
Transcript of 体験統計学mybook-pub-site.sakura.ne.jp/.../chap12.pdf2 小テスト11.1 解答...
1
古橋 武
体験統計学~第12回~
本稿のWebページ
2
小テスト11.1 解答(2回の実験の有効率の差)
薬A, Bの真の有効率をそれぞれ p0A= 0.6, p0B= 0.6とする.この薬AをマウスnA=10匹, nB=10匹,に対して投与する実験を行う.この実験を3000回繰り返したら,有効率の差 pA - pBはどのような分布となるか?
有効率の差の頻度を求め,横軸を-1から1まで0.1刻み
として頻度グラフを描け.
この結果に正規分布の確率の棒グラフを並べて示せ.ただし,正規分布の平均 μ には有効率の差の理論値 p0A – p0Bを用いよ.また,標準偏差 σ には有効率の差の標準偏差の理論値
を用いよ.
B
BB
A
AA
nPP
nPP )1()1( 0000 −
+−
=σ
3
B
BB
A
AA
nPP
nPP )1()1( 0000 −
+−
=σ
pBpA
pA - pB
小テスト11.1 解答(2回の実験の有効率の差)
4
=COUNTIF($B$19:$HVU$19,B23)/3000
3
小テスト11.1 解答(2回の実験の有効率の差)
5
=NORMDIST(B23+0.05,$C$3-$F$3,$I$4,1)-NORMDIST(B23-0.05,$C$3-$F$3,$I$4,1)
小テスト11.1 解答(2回の実験の有効率の差)
6
=NORMDIST(B23+0.05,$C$3-$F$3,$I$4,1)-NORMDIST(B23-0.05,$C$3-$F$3,$I$4,1)
有効率の差の平均値p0A – p0B
小テスト11.1 解答(2回の実験の有効率の差)
7
=NORMDIST(B23+0.05,$C$3-$F$3,$I$4,1)-NORMDIST(B23-0.05,$C$3-$F$3,$I$4,1)
有効率の差の標準偏差σ
有効率の差の平均値p0A – p0B
小テスト11.1 解答(2回の実験の有効率の差)
8
0
0.02
0.04
0.06
0.08
0.1
0.12
0.14
0.16
0.18
0.2
-1 -0.9 -0.8 -0.7 -0.6 -0.5 -0.4 -0.3 -0.2 -0.1 0 0.1 0.2 0.3 0.4 0.5 0.6 0.7 0.8 0.9 1
系列1
系列2
pA - pB
5000組の中でpA - pBが0となる
= 0.181これが理論値(0.181×3000 = 5433000組中543組でpA - pBが0となる)
3000組の中でpA - pBが0となっ
た
この例では頻度 = 0.175(0.175×3000 = 5253000組中525組でpA - pBが0となった)
小テスト11.1 解答(2回の実験の有効率の差)
9
0
0.02
0.04
0.06
0.08
0.1
0.12
0.14
0.16
0.18
0.2
-1 -0.9 -0.8 -0.7 -0.6 -0.5 -0.4 -0.3 -0.2 -0.1 0 0.1 0.2 0.3 0.4 0.5 0.6 0.7 0.8 0.9 1
系列1
系列2
pA - pB
5000組の中でpA - pBが0となる
= 0.181これが理論値(0.181×3000 = 5433000組中543組でpA - pBが0となる)
3000組の中でpA - pBが0となっ
た頻度この例では頻度 = 0.175(0.175×3000 = 5253000組中525組でpA - pBが0となった)
小テスト11.1 解答(2回の実験の有効率の差)
10
0
0.02
0.04
0.06
0.08
0.1
0.12
0.14
0.16
0.18
0.2
-1 -0.9 -0.8 -0.7 -0.6 -0.5 -0.4 -0.3 -0.2 -0.1 0 0.1 0.2 0.3 0.4 0.5 0.6 0.7 0.8 0.9 1
系列1
系列2
pA - pB
5000組の中でpA - pBが0となる
確率 = 0.181これが理論値(0.181×3000 = 5433000組中543組でpA - pBが0となる)
3000組の中でpA - pBが0となっ
た頻度この例では頻度 = 0.175(0.175×3000 = 5253000組中525組でpA - pBが0となった)
小テスト11.1 解答(2回の実験の有効率の差)
11
薬A, Bがある.それぞれ100匹のマウスに投与したところ,薬Aは55匹に効き,薬Bは65匹に効いた.薬A, Bの有効率には差があったと言えるか?
小テスト11.2 解答(薬の有効率の差の検定)
の値が
であれば,有効率に差があったと言える.
( ) ( )
( ) ( )1
11
196.1
11
1196.1
−−
+−−
≥−
−−
+−−
−≤−
B
BB
A
AABA
B
BB
A
AABA
npp
npppp
npp
npppp
もしくは
BA pp −
12
( ) ( )1
11
196.1−−
+−−
B
BB
A
AA
npp
npp
( ) ( )1
11
196.1−−
+−−
−B
BB
A
AA
npp
npp
13576.0 1.0 ≥−
13576.0 1.0 −≤−
小テスト11.2 解答(薬の有効率の差の検定)
13
( ) ( )1
11
196.1−−
+−−
B
BB
A
AA
npp
npp
( ) ( )1
11
196.1−−
+−−
−B
BB
A
AA
npp
npp
13576.0 1.0 ≥−
13576.0 1.0 −≤−
小テスト11.2 解答(薬の有効率の差の検定)
14
( ) ( )1
11
196.1−−
+−−
B
BB
A
AA
npp
npp
( ) ( )1
11
196.1−−
+−−
−B
BB
A
AA
npp
npp
有効率に差があったとは言えない.13576.0 1.0 ≥−
13576.0 1.0 −≤−
小テスト11.2 解答(薬の有効率の差の検定)
15
薬の有効率の差の検定
この問に答えるには,まず がどのような分布となるかを調べる必要がある.
薬A, Bがある.それぞれnA匹,nB匹のマウスに投与したところ,薬AはqA匹に効き,薬BはqB匹に効いた.薬A, Bの有効率 に差があったと言えるか?薬A, Bの真の有効率を とする.
BBBAAA nqpnqp == , BA pp 00 ,
BA pp −
16
B
BB
A
AA
BA
BA
nPP
nPP
PPpp
)1()1( 0000
00
−+
−=
−=
−
σ
µ
標準偏差
平均
は
薬の有効率の差の検定
-0.05
0.05
0.15
0.25
-1 0 1
有効率
正規分布の確率
薬A, Bがある.それぞれnA匹,nB匹のマウスに投与したところ,薬AはqA匹に効き,薬BはqB匹に効いた.薬A, Bの有効率 に差があったと言えるか?薬A, Bの真の有効率を とする.
BBBAAA nqpnqp == , BA pp 00 ,
17
薬の有効率の差の検定
-0.05
0.05
0.15
0.25
-1 0 1
有効率
正規分布の確率
の正規分布となる.
B
BB
A
AA
BA
BA
nPP
nPP
PPpp
)1()1( 0000
00
−+
−=
−=
−
σ
µ
標準偏差
平均
は
薬A, Bがある.それぞれnA匹,nB匹のマウスに投与したところ,薬AはqA匹に効き,薬BはqB匹に効いた.薬A, Bの有効率 に差があったと言えるか?薬A, Bの真の有効率を とする.
BBBAAA nqpnqp == , BA pp 00 ,
18
BA pp −
有効率の差の確率分布
0
0.5
1
1.5
2
2.5
3
0.0 0.1 0.2 0.3 0.4 0.5 0.6 0.7 0.8 0.9 1.0
−−−= 2
2
2 2)(exp
21
σµ
πσBA pp
の正規分布となる.
標準偏差
平均
は
B
BB
A
AA
BA
BA
nPP
nPP
PPpp
)1()1( 0000
00
−+
−=
−=
−
σ
µ
19
確率密度関数と呼ぶ
有効率の差の確率分布
0
0.5
1
1.5
2
2.5
3
0.0 0.1 0.2 0.3 0.4 0.5 0.6 0.7 0.8 0.9 1.0
−−−= 2
2
2 2)(exp
21
σµ
πσBA pp
の正規分布となる.
標準偏差
平均
は
B
BB
A
AA
BA
BA
nPP
nPP
PPpp
)1()1( 0000
00
−+
−=
−=
−
σ
µ
BA pp −
0
0.5
1
1.5
2
2.5
3
0.0 0.1 0.2 0.3 0.4 0.5 0.6 0.7 0.8 0.9 1.0
20
の正規分布となる.
標準偏差
平均
は
B
BB
A
AA
BA
BA
nPP
nPP
PPpp
)1()1( 0000
00
−+
−=
−=
−
σ
µ
BA pp −
有効率の差の確率分布
0
0.5
1
1.5
2
2.5
3
0.0 0.1 0.2 0.3 0.4 0.5 0.6 0.7 0.8 0.9 1.0
21
BA PP 00 − σ96.100 +− BA PP
有効率の差の確率分布
の正規分布となる.
標準偏差
平均
は
B
BB
A
AA
BA
BA
nPP
nPP
PPpp
)1()1( 0000
00
−+
−=
−=
−
σ
µ
BA pp −
σ96.100 −− BA PP
0
0.5
1
1.5
2
2.5
3
0.0 0.1 0.2 0.3 0.4 0.5 0.6 0.7 0.8 0.9 1.0
22
がこの範囲の値をとる確率は95%
BA pp −
の正規分布となる.
標準偏差
平均
は
B
BB
A
AA
BA
BA
nPP
nPP
PPpp
)1()1( 0000
00
−+
−=
−=
−
σ
µ
BA pp −
BA PP 00 − σ96.100 +− BA PPσ96.100 −− BA PP
有効率の差の確率分布
23
もしくは
有効率の差 は
にある確率は,5%未満である.
BA pp −
σσ 96.196.1 0000 +−≤−≤−− BABABA PPppPP
95%の確率でこの範囲内にある.
ということは
24
BABA
BABA
ppPP
PPpp
−<+−
−−<−
σ
σ
96.1
96.1
00
00
もしくは
有効率の差 は
にある確率は,5%未満である.
95%の確率でこの範囲内にある.
ということは
BA pp −
σσ 96.196.1 0000 +−≤−≤−− BABABA PPppPP
25
対立仮説:
帰無仮説:
いと仮定する.の真の有効率に差がなまず,薬
合には,かどうかを検定する場の効き具合に差がある薬
BA,BA,
有効率の差の検定の考え方
26
対立仮説:
帰無仮説:
いと仮定する.の真の有効率に差がなまず,薬
合には,かどうかを検定する場の効き具合に差がある薬
BA,BA,
有効率の差の検定の考え方
これを帰無仮説と呼ぶ.
27
対立仮説:
帰無仮説:
いと仮定する.の真の有効率に差がなまず,薬
合には,かどうかを検定する場の効き具合に差がある薬
BA,BA,
有効率の差の検定の考え方
これを帰無仮説と呼ぶ.
0
0
00
00
≠−
=−
BA
BA
PP
PP
28
有効率の差の検定の考え方
がとすると,有効率の差 BA pp −
にある確率は,5%未満である.帰無仮説より
BABABABA ppPPPPpp −<+−−−<− σσ 96.1 96.1 0000 もしくは
にある確率は,5%未満である.
29
有効率の差の検定の考え方
がとすると,有効率の差 BA pp −
にある確率は,5%未満である.帰無仮説より
BABABABA ppPPPPpp −<+−−−<− σσ 96.1 96.1 0000 もしくは
にある確率は,5%未満である.
000 =− BA PP
30
有効率の差の検定の考え方
がとすると,有効率の差 BA pp −
にある確率は,5%未満である.帰無仮説より
BABABABA ppPPPPpp −<+−−−<− σσ 96.1 96.1 0000 もしくは
にある確率は,5%未満である.
000 =− BA PP代入
31
有効率の差の検定の考え方
がとすると,有効率の差 000 BABA ppPP −=−
にある確率は,5%未満である.帰無仮説より
BABABABA ppPPPPpp −<+−−−<− σσ 96.1 96.1 0000 もしくは
にある確率は,5%未満である.
BABA pppp −<−<− σσ 96.1 96.1 もしくは
32
有効率の差の検定の考え方
が5%未満の範囲内にあれば,
が5%未満の範囲内に無ければ,帰無仮説を棄却できない.
BA pp −
薬Aと薬Bには差があったとは言えない.正確な表現は「
」
薬Aと薬Bには差があったと言える.正確な表現は「
」
BA pp −
33
有効率の差の検定の考え方
が5%未満の範囲内にあれば,帰無仮説を棄却し,対立仮説を採用する.
が5%未満の範囲内に無ければ,帰無仮説を棄却できない.
薬Aと薬Bには差があったとは言えない.正確な表現は「 」
薬Aと薬Bには差があったと言える.正確な表現は「 」
BA pp −
BA pp −
34
有効率の差の検定の考え方
が5%未満の範囲内にあれば,帰無仮説を棄却し,対立仮説を採用する.
が5%未満の範囲内に無ければ,帰無仮説を棄却できない.
薬Aと薬Bには差があったとは言えない.正確な表現は「 」
薬Aと薬Bには差があったと言える.
正確な表現は「統計的に有意な差が
あった.」
BA pp −
BA pp −
35
有効率の差の検定の考え方
が5%未満の範囲内にあれば,帰無仮説を棄却し,対立仮説を採用する.
が5%未満の範囲内に無ければ,帰無仮説を棄却できない.
BA xx −
薬Aと薬Bには差があったとは言えない.
正確な表現は「統計的に有意な差は
なかった.」
薬Aと薬Bには差があったと言える.正確な表現は「統計的に有意な差があった.」
BA pp −
36
有効率の差の検定の考え方
薬A, Bの真の有効率に差がない仮定した.
なのに実際に得られた有効率の差 が出現する確率は5%未満であった.
帰無仮説を捨てよう.
BA pp −
薬Aと薬Bには差があった言える.
が5%未満の範囲内にあれば,帰無仮説を棄却する
000 =− BA PP
BA pp −
37
有効率の差の検定の考え方
薬A, Bの真の有効率に差がない仮定した.
なのに実際に得られた有効率の差 が出現する確率は5%未満であった.
帰無仮説を捨てよう.
BA pp −
薬Aと薬Bには差があった言える.
が5%未満の範囲内にあれば,帰無仮説を棄却す
る理由は以下の通り.
000 =− BA PP
BA pp −
38
有効率の差の検定の考え方
薬A, Bの真の有効率に差がない仮定した.
なのに実際に得られた有効率の差 が出現する確率
は5%未満であった.こんなにめったに起こらないことが目の前に起こっている.何かがおかしい.
帰無仮説を捨てよう.
薬Aと薬Bには差があった言える.
BA pp −
000 =− BA PP
BA pp −
が5%未満の範囲内にあれば,帰無仮説を棄却する理由は以下の通り.
39
有効率の差の検定の考え方
薬A, Bの真の有効率に差がない仮定した.
なのに実際に得られた有効率の差 が出現する確率は5%未満であった.
こんなにめったに起こらないことが目の前に起こっている.何かがおかしい.
これは仮説が間違っていた.
帰無仮説は捨てよう.
薬Aと薬Bには差があった言える.
BA pp −
000 =− BA PP
BA pp −
が5%未満の範囲内にあれば,帰無仮説を棄却する理由は以下の通り.
40
BABA pppp −<−<− σσ 96.1 96.1 もしくは
有効率の差の検定の考え方
B
BB
A
AA
nPP
nPP )1()1( 0000 −
+−
=σ
P0A , P0Bは未知であるので,このままではσを求められない.そこで
41
有効率の差の検定の考え方
1)1(
1)1(ˆ
−−
+−−
=B
BB
A
AA
nPP
nPPσ
P0A , P0Bは未知であるので,このままではσを求められない.そこでσの近似値 を
用いる.
B
BB
A
AA
nPP
nPP )1()1( 0000 −
+−
=σ
σ̂
BABA pppp −<−<− σσ 96.1 96.1 もしくは
42
BA
BA
pp
pp
−<
−<−
もしくは
96.1
96.1
有効率の差の検定の考え方
43
BAB
BB
A
AA
B
BB
A
AABA
ppn
ppn
pp
npp
npppp
−<−−
+−−
−−
+−−
−<−
もしくは
1)1(
1)1(96.1
1)1(
1)1(96.1
有効率の差の検定の考え方
44
とめられる.と,一つの不等式にま
をとるとの
1)1(
1)1(96.1
−−
+−−
>−
−
B
BB
A
AABA
BA
npp
npppp
pp
有効率の差の検定の考え方
45
有効率の差の検定の考え方
絶対値
とめられる.と,一つの不等式にま
をとるとの
1)1(
1)1(96.1
−−
+−−
>−
−
B
BB
A
AABA
BA
npp
npppp
pp
46
小テスト12.1薬A, Bの真の有効率を,それぞれ として,20匹のマウスに投与する実験を1000組繰り返したとき,薬A, Bの有効率の差の絶対値 が1.96 σを超える組数が50組程度となることを確認せよ.ただし,
である.
7.0 ,7.0 00 == BA PP
BA pp −
B
BB
A
AA
nPP
nPP )1()1( 0000 −
+−
=σ
ヒント(1) aの絶対値はABS(a)とすれば求められる.(2) が1.96σを超えたときに1を出力し,そうでないとき0を出力する関数
=IF( > 1.96σ, 1, 0)
BA pp −
BA pp −
47
小テスト12.2
薬A, Bの真の有効率を,それぞれ として,20匹のマウスに投与する実験を行ったとき,薬A, Bの有効率の差の標準偏差の近似値 は
により与えられる.20匹のマウスへの投与実験を5000回繰り返したときの の平均値が
の値に近い値となることを確認せよ.
7.0 ,7.0 00 == BA PP
σ̂
B
BB
A
AA
nPP
nPP )1()1( 0000 −
+−
=σ
1)1(
1)1(ˆ
−−
+−−
=B
BB
A
AA
npp
nppσ
σ̂
48
2013年3月