計数値の分散分析(ロジット変換法) · 17.4...
TRANSCRIPT
-267-
第17章 計数値の分散分析(ロジット変換法)
本章では,二項分布に従う特性値による実験計画法について述べる.二項分布は,計数値
に対する分析法であり,実験計画法で述べた諸手法は計量値を扱っており本章の分散分析
では特性値を連続量として変換が必要になる.二項分布に従う特性について,一般的に利用
される製品の不良に関する特性として二元配置法の実験について述べる.
17.1 二項分布に従う特性
母不良率 P である母集団からサンプルn個抽出し,その中 x個の不良品が存在する確率分布は二項分布に従う.その確率分布は,
確率分布: xnr
xn PPCxPr
1 ただし, n,,,,,x 3210
!xn!x
!nCxn
ただし
10
1231
!
nn!n
期待値: nPxE
分 散: PnPxVar 1
と定義される.また,母集団からサンプルn個の製品を抽出し,その中に x個の不良品が存在するとき,統計量である試料不良率 p を考えると,
試料不良率:n
xp
期待値: Pn
xEpE
分 散:
n
PP
n
xVarpVar
1
となる.例えば,
(1)従来製造工程を用いて製品の添加剤 Aの変更による不良品の発生は従来と異なるか
どうか?または,設備変更による不良品の発生は従来と異なるかどうか?
(2)製品を2ラインで製造しているが,この2ラインでの不良品の発生は異なると言える
かどうか?
(3)従来製造工程を用いて複数の添加剤購入先 4321 A,A,A,A 変更による不良品の発生は
従来と異なるかどうか?または,複数ラインの製造による不良品の発生はラインによ
って異なるかどうか?
など,計数値を扱う利用の場は多数存在する.上記(1)の場合,仮説 00 PP:H ( 0P 従
来値)として母不良率に関する検定,(2)の場合,仮説 ラインライン 210 PP:H として母不良
率の差に関する検定,(3)の場合,仮説43210 AAAA PPPP:H または製造ラインについ
て分割表を用いる検定等で分析可能である.
また,その分析では,直接確率計算による方法,あるいは連続修正を利用した正規分布近
似法が知られている.
17.2 二項分布の正規分布近似法
二項分布に従う変数が近似条件を満たせば,連続分布と考え正規分布近似法を用いて解
析を行うことができるので実験計画法でも応用が可能となる.母集団から得られた計数値
データを用いて,
1
50
n
.x*p
( 17.1 )
( 17.2 )
( 17.3 )
( 17.4 )
( 17.6 )
( 17.7 )
( 17.5 )
( 17.8 )
-268-
の分布修正を行い解析に用いる.式(17.8)を連続修正と呼び,その代表的な近似法を表 17.1
に示す.
表 17.1 二項分布の代表的な正規分布近似法
近似法 統計量 統計量の期待値 分 散
直接
正規分布近似法 *p P
n
PP 1
逆正弦変換による
正規分布近似法 *psin 1
( rad 単位) Psin 1
n4
1
ロジット変換による
正規分布近似法
*p
*pln*pL
1 PL
PnP 1
1
17.3 ロジット変換法による正規分布近似法とは
ロジット変換(Logit変換)とは,不良率の比較など直接正規分布近似法より精度よく求
めるための近似法と呼ばれ,少々計算が面倒ではあるがよく利用される近似法である.すな
わち試料不良率に連続修正式(17.8)の値を利用して,表 17.1 に示す不良率のロジット変換
値 *pL の期待値と分散が,
試料不良率のロジット変換値: 50
50
1 .xn
.xln
*p
*pln*pL
期待値: PL*pLE
分 散: PnP
*pLVar
1
1
正規分布近似:
PnP,PLN*pL
1
1~
となり正規分布に近似できることを利用した近似法である.この変換法はロジット変換法
と呼ばれている.
例えば,ある製品をランダムに 200n 個のサンプルを抽出し, 6x 個の不良品が見つ
かったとする.この製品の不良率は 0500 .P より小さいと考えられるかを検討しよう.上
記第 17.1節(1)より検定の帰無仮説 00 PP:H ( 0500 .P )の下で構成すればよいから,
連続修正値 0323401200
506
1
50.
.
n
.x*p
ロジット変換値: 398630323401
032340
1.
.
.ln
*p
*pln*pL
仮説 0H の下における期待値と分散は,
期待値: 944420501
0500 .
.
.lnPL*pLE
分 散:
105300501050200
1
1
1
00
...PnP
*pLVar
となりロジット変換値 *pL は正規分布 10530 94442 .,.N に近似できることになる.よ
って *pL より小さくなる有意確率は,正規分布の基準化より
08080401
10530
94442398630 ..
.
..uuPr
となる.またこの工程における不良率の信頼率 1100 %信頼限界は式(17.10)より,
( 17.10 )
( 17.11 )
( 17.9 )
( 17.12 )
-269-
*p*npu*pL
PL
PL
L
U
1
1
として計算し,
UU
UU
PLe x pPLe x p
PLe x pP
1
1
1
LL
LL
PLe x pPLe x p
PLe x pP
1
1
1
と求める.式(17.14)(17.15)はロジット変換の逆変換と呼ばれている.上記の例で信頼率
95%信頼限界を求めると,
18204
615223132039863
0323401032340200
960139863
1
1050
.
...
..
..
*p*np.u*pL
PL
PL
L
U
よりロジット変換値を逆変換して,
068170
615221
1
1
1.
.expPLexpP
U
U
015040
182041
1
1
1.
.expPLexpP
L
L
と求めることができる.このロジット変換を利用し特性を計数値とした二元配置法におけ
る実験に応用する.
17.4 ロジット変換法による分散分析
一元配置型の解析については第 17.1 節(1)(2)(3)について検討すればよく,本節では二つ
の因子を取り上げ特性が計数値による二元配置法によるロジット変換法を利用した実験の
解析法を述べる.
17.4.1 実験データ表とデータの構造式
一般に,不良個数についての計数値データを得るものとし,因子 Aを l水準,因子Bをm
水準指定し,水準の組合せ lm回の実験を実施し,ランダムに製品サンプル ijn 個抽出し,不
良個数データ ijx が得られたときデータ表は表 17.2となる.
得られた不良個数のデータから式(17.8)の連続修正を行い,
1
50
ij
ij
ijn
.x*p m,,,j,l,,,i 21 21
ロジット変換法を利用して,
50
50
1 .xn
.xln
*p
*pln*pLL
ijij
ij
ij
ij
ijij
を計算する.変換を実施した値を表 17.3 の上段に,また,下段に後述する誤差分散を求め
るために次式,
*p*pnˆ
ijijijij
1
12
( 17.14 )
( 17.15 )
( 17.13 )
( 17.16 )
( 17.17 )
( 17.18 )
-270-
の計算値を求めておくと便利である.
表 17.2 サンプル ijn 個と不良個数データ ijx の実験データ表
因子 1A 2A lA
1B 11n
21n 1ln
11x 21x 1lx
2B 12n
22n 2ln
12x 22x 2lx
ijn
ijx
mB mn1 mn2 lmn
mx1 mx2 lmx
表 17.3 実験データのロジット変換値表
上段: *pLL ijij 下段: *p*pn
ˆijijij
ij
1
12
因子 1A 2A lA 合計 平均値
1B 11L
21L 1lL 1L
1L
211
212 2
1l 21
2B 12L
22L 2lL 2L
2L
212
222
22l
22
ijL
2ij
mB mL1 mL2 lmL mL
mL
21m
22m
2lm
2m
ˆ
合計 1L 2L lL
L
21
22
2l
2
平均値 1L 2L lL L
よって表 17.3のロジット変換表は,繰返しがない場合の二元配置法のデータ表となるが,
解析法としては交互作用効果 BA も検討ができる特徴があり,誤差に関しては等分散性が
仮定できないことである.
表 17.3のロジット変換を利用した実験のデータの構造式は,
ijjiij baL li ,,2,1 mj ,,2,1
ただし, 01
l
i
ia 01
m
j
jb 011
m
j
ij
l
i
ij abab
20 ijij ,N ~ ,ただし ijijij
ijPPn
1
12
となる.
( 17.19 )
( 17.20 )
-271-
17.4.2 平方和と自由度
繰返しのない二元配置法による実験データの解析法を利用して,平方和と自由度は,実験
データの総平均値を,
総平均値
LN
LN
Ll
i
m
j
ij
11
1 1
ただし, lmN
で求められる.また,平方和の計算には,
修正項 21 L
NCT
AB間平方和( AB間変動) CTLSl
i
m
j
ijAB 1 1
2
A間平方和( A間変動) CTm
LS
l
i
iA
1
2
1 lA
B間平方和( B間変動) CTl
LS
m
j
j
B
1
2
1mB
BA 交互作用 BAABBA SSSS
11 mlBABA
誤差分散(誤差変動)については,式(17.20)より等分散性の仮定がなく組合せ ji BA で
分散は異なる.よって,各組合せ ji BA での分散の推定値の平均で考えることになる.例え
ば,組合せ ji BA での分散の推定値は,連続修正値を利用して式(17.18)となり,
誤差分散(誤差変動)
l
i
m
j
ij
l
i
m
j ijijij
Eˆ
lm*p*pnlmV
1 1
2
1 1
1
1
11
ただし, E
と求める.
17.4.3 分散分析表と検定
計数値による実験で特性のロジット変換後の分散分析表を表 17.4に示す.
表 17.4 分散分析表
要因 平方和 自由度 平均平方 0F smE ..
A AS 1 lA AAA SV EA VV 22AE m
B BS 1 mB BBB SV EB VV 22BE l
BA BAS 11 mlBA BBABA SV EBA VV 22BAE
E - E EV 2E
要因 Aおよび B の効果および交互作用 BA についての検定は,二元配置法の実験と同
様である.ただし,誤差の自由度 E であることに注意して検定すればよい.
例えば,因子 Aについては,
仮説: 0 0 2
1
2
0 AA :H:H (有意水準を %5 )
検定統計量:E
A
V
VF 0
棄却域: 0500 .;,FVVF AEA
による判断を行えばよい.
( 17.22 )
( 17.21 )
( 17.23 )
( 17.24 )
( 17.25 )
( 17.26 )
( 17.27 )
( 17.28 )
( 17.29 )
( 17.30 )
-272-
17.5 最適条件の決定と母不良率の推定
最適条件の決定および母不良率の推定についての考え方は,交互作用 BA の有意性に関
わらずプーリングはしない.よって,推定では交互作用 BA が無視できる場合と無視でな
い場合に分けて母不良率の推定を実施すればよい.
17.5.1 交互作用を無視する場合
推定に用いるデータの構造式を
データの構造式: ijjiij baL
と考えると,
(1)最適条件の決定
データの構造式 jiBA における母不良率の点推定値は式(17.31)より
LLLˆbabaBAL jijijiji
となる.すなわち,母不良率の最適水準は,各因子のロジット変換値の平均値が最小と
なる水準を指定し qpBA 水準とすればよい.
(2)最適条件における母不良率の推定
最適条件を qpBA 水準としたとき,母不良率の推定を行う.
a)最適条件における点推定
式(17.32)より,ロジット変換での点推定値は,
LLLBAL qpqp
となる.よって式(17.33)の母不良率の点推定値は,ロジット変換の逆変換を用いて,
qpqp
qp
qpBALexpBALexp
BALexpBAP
1
1
1
となる.
b)最適条件における信頼限界
不良率の区間推定は,信頼率を %1100 とすれば,最適条件 qpBA における母不
良率の信頼上限および信頼下限を UqpBAP ,
LqpBAP は次式で与えられる.
まず,ロジット変換値での信頼限界を求める.
qpqp
Lqp
Uqp
BALarVuBALBAL
BAL
ただし,分散の推定値は,
2
1
2
1
2
1 1
2 22211
pq
m
j
pj
l
i
iq
l
i
m
j
ijqpˆˆ
m
lˆ
l
mˆ
lmlmBALarV
として計算し,信頼限界を式(17.35)で求めロジット変換の逆変換を施して信頼限界を
求める.
UqpUqp
Uqp
UqpBALexpBALexp
BALexpBAP
1
1
1
LqpLqp
Lqp
LqpBALexpBALexp
BALexpBAP
1
1
1
( 17.31 )
( 17.32 )
( 17.33 )
( 17.34 )
( 17.37 )
( 17.38 )
( 17.35 )
( 17.36 )
-273-
17.5.2 交互作用を無視しない場合
推定に用いるデータの構造式を
データの構造式: ijijjiij abbaL
と考えると,
(1)最適条件の決定
データの構造式 jiBA における母不良率の点推定値は式(17.39)より
ijijjiji LabbaBAL
となる.すなわち,母不良率の最適水準は,因子の組合せのロジット変換値が最小とな
る水準を指定し qpBA 水準とすればよい.
(2)最適条件における母不良率の推定
最適条件を qpBA 水準としたとき,母不良率の推定を行う.
a)最適条件における点推定
式(17.40)より,ロジット変換での点推定値は,
pqqp LBAL
となる.よって式(17.41)の母不良率の点推定値は,ロジット変換の逆変換を用いて,
qpqp
qp
qpBALexpBALexp
BALexpBAP
1
1
1
となる.
b)最適条件における信頼限界
不良率の区間推定は,信頼率を %1100 とすれば,最適条件 qpBA における母不
良率の信頼上限および信頼下限を UqpBAP ,
LqpBAP は次式で与えられる.
まず,ロジット変換値での信頼限界を求める.
qpqp
Lqp
Uqp
BALarVuBALBAL
BAL
ただし,分散の推定値は,
2
pqqpˆBALarV
である.
として計算し,逆変換して信頼限界を求める.
UqpUqp
Uqp
UqpBALexpBALexp
BALexpBAP
1
1
1
LqpLqp
Lqp
LqpBALexpBALexp
BALexpBAP
1
1
1
17.6 例題
ある樹脂工業(株)では,飲料用のペットボトルの改良を行っている.現在,飲料用ボトル
は冷時充填法であるが,一部熱時充填法に耐えうるペットボトルを検討中である.
そこで検討の取り組みとしてペットボトルの成形材料 Aを 4 水準,熱処理条件B を 3 水
準取上げて計 12回のランダム実験で各 200本ずつボトルを成形し,熱時充填後のボトル口
部の変形による不良を全数検査して表 17.5のデータを得た.
( 17.39 )
( 17.40 )
( 17.41 )
( 17.42 )
( 17.37 )
( 17.38 )
( 17.43 )
( 17.44 )
-274-
次の設問に答えよ.
(1)分散分析を行い有意水準 5%で成形材料 Aと熱処理条件B について効果を検定
せよ.
(2)不良率を最小とする最適条件を定め,その条件における母不良率の点推定値と
信頼率 95%信頼限界を求めよ.
表 17.5 サンプル ijn 個と不良個数データ ijx の実験データ表
因子 1A 2A 3A
4A
1B ijn 200 200 200 200
ijx 20 16 10 29
2B ijn 200 200 200 200
ijx 10 12 5 11
3B ijn 200 200 200 200
ijx 18 10 7 21
表 17.6 実験データのロジット変換値表
上段: *pLL ijij 下段: *p*pn
ˆijijij
ij
1
12
因子 1A 2A 3A
4A 合計 jL
2j
ˆ
平均値 jL
1B -2.1753 -2.4143 -2.8983 -1.7602 -9.2481 -2.31203
0.05459 0.06636 0.10099 0.03993 0.26187
2B -2.8983 -2.7134 -3.5708 -2.8020 -11.9845 -2.99613
0.10099 0.08573 0.18787 0.09269 0.46728
3B -2.2890 -2.8983 -3.2504 -2.1221 -10.5598 -2.63995
0.05983 0.10099 0.13919 0.05234 0.35235
合計 iL
2i
-7.3626 -8.0260 -9.7195 -6.6843 -31.7924
0.21541 0.25308 0.42805 0.18496 1.08150
平均値 iL -2.45420 -
2.67533
-
3.23983
-
2.22810 -2.64937
(1)分散分析による要因の検定
手順 1.データの構造
ijjiij baL 4321 ,,,i 321 ,,j 1234 lmN
ただし, 04
1
i
ia 03
1
j
jb 03
1
4
1
j
ij
i
ij abab
20 ijij ,N ~ ,ただし ijijij
ijPPn
1
12
手順2.平方和と自由度の計算
総平均値 64937279243112
11
1 1
..LN
Ll
i
m
j
ij
平方和の計算には,
修正項 229728479243112
11 22 ..LN
CT
-275-
AB間平方和( AB間変動) CTLSl
i
m
j
ijAB 1 1
2
9021222972841317987
2297284122128983217532222
...
....
A間平方和( A間変動) CTm
LS
l
i
iA
1
2
2297284
68436
719590260836267
3
12
222
..
...
6946122972849243785 ... 31 lA
B間平方和( B間変動) CTl
LS
m
j
j
B
1
2
2297284559810984511248194
1 222....
9365022972841662485 ... 21mB
BA 交互作用 BAABBA SSSS
27100936506946190212 ....
62311 mlBABA
誤差分散(誤差変動)は式(17.27)より表 17.6を用いて,
l
i
m
j
ij
l
i
m
j ijijij
Eˆ
lm*p*pnlmV
1 1
2
1 1
1
1
11
09013008150134
1..
E
となる.
手順3.分散分析表の作成
それぞれ計算した要因の平方和と自由度から分散分析表を作成し,平均平方および
検定のための統計量 0F を求める.
表 17.7 分散分析表
要因 平方和 自由度 平均平方 0F smE ..
A 1.6946 3 0.5649 6.27** 22 3 AE
B 0.9365 2 0.4683 5.20** 22 4 BE
BA 0.2710 6 0.0452 0.50 22
BAE
E - ∞ 0.0901 2E
6020503 ..;,F 0030502 ..;,F 1020506 ..;,F
7830103 ..;,F 6140102 ..;,F 8020106 ..;,F
各要因の判定の結果,主効果 Aおよび Bは有意となり,成形材料と熱処理条件につ
いては効果が認められた.交互作用 BA は無視できることがわかった.
(2)最適条件の決定と母不良率の推定
手順4.最適条件の決定
検定の結果から,交互作用 BA は無視できることがわかったので,母不良率の推定
に用いるデータの構造式を
-276-
データの構造式: ijjiij baL
と考えて,最適水準を求めると,それぞれ因子 Aおよび Bのロジット変換値の最小水
準は表 17.6より 3A および2B 水準となる.
手順5.最適条件における母不良率の点推定
母不良率の最適水準 23BA における点推定値は式(17.32)から,
586593
649372996132239833 23
232323
.
...LLL
ˆbabaBAL
となる.よって,式(17.34)よりロジット変換の逆変換を用いて母不良率の点推定値は,
026950
5865931
1
1
1
1 2323
2323
..exp
BALexpBALexp
BALexpBAP
となる.
手順6.最適条件における母不良率の信頼率 95%区間推定
不良率の信頼率を %95 区間推定は,最適条件 23BA における母不良率の信頼上限お
よび信頼下限を U
BAP 23,
LBAP 23
とすれば,式(17.36)より分散の推定値は表 17.6
を利用して,
2
32
3
1
2
3
4
1
2
2
4
1
3
1
2
23 23
24
4
23
34
1
34
1 ˆˆˆBALarV
j
j
i
i
i j
ij
072340
18787024280503
2467280
4
1081501
12
1
12
1
.
....
となり,式’17.35)よりロジット変換値での信頼限界は,
2323
23
23050 BALarV.uBAL
BAL
BAL
L
U
113754
059433
5271605865930723409601586593
.
.
.....
として計算し,逆変換して信頼限界を求める.
UU
U
UBALexpBALexp
BALexpBAP
2323
23
231
1
1
044800594331
1.
.exp
LL
LL
BALexpBALexp
BALexpBAP
2323
2323
1
1
1
016101137541
1.
.exp
となる.
-277-
【蛇足】本例題において交互作用 BA を無視しないときの推定
(1)点推定
5708332322323 .LabbaBAL
となる.よって,ロジット変換の逆変換を用いて母不良率の点推定値は,
027360570831
1
1
1
23
23 ..expBALexp
BAP
(2)母不良率の信頼率 95%区間推定
2
32232323
23
23050050 .uBALBALarV.uBAL
BAL
BAL
L
U
8495057083187870960157083 .....
42034
72132
.
.
逆変換して信頼限界を求めると,
061730721321
123 .
.expBAP
U
011890420341
123 .
.expBAP
L
となる.
【参考1】式(17.8)より式(17.9)への導出について
1
50
n
.x*p を代入して
50
50
1
5011
50
1
501
1
50
1 .xn
.xln
n
.xnn
.x
ln
n
.xn
.x
ln*p
*pln*pL
【参考2】式(17.36)の導出について
データの構造式から
ijjiij baL l,,,i 21 m,,,j 21
20 ijij ,N ~ ただし ijijij
ijPPn
1
12
と定義する.因子 A ( l水準),B ( m 水準)とし最適条件を qpBA 水準としたとき,ロジット変
換値の点推定値は qpBAL である.点推定値の分散は,誤差の仮定から等分散性が仮定され
ないので組合せ jiBA での分散 2ij を推定し用いる.
表 17.8
1A pA 3A 4A 計
1B 211
21p 2
31 241
21
2B 212
22p 2
32 242
22
qB 21q
2pq
23q
24q 2
3
計 21
22
23
24
2
今 A (4水準), B (3水準)のとき表 17.8として点推定値の分散を求めると,
-278-
l
i
m
j
ij
l
i
iq
m
j
pj
qpqpqp
lmlmVar
VarLLLVarBALVar
1 1
2
1
2
1
2
222
111
となる.ただし各水準は l,m 水準としてある.
24
23
221
242
232
22
212
241
231
21
211
24
23
22
21
23
22
21
1
11
qqpqq
p
p
qqqqppp
qp
lm
lm
VarBALVar
2
24
23
21
242
232
22
212
241
231
21
211
111
1111
11
11111
11111
pq
qqq
p
p
lmlm
lmllmllml
lmlmlmmlm
lmlmlmmlm
Var
2
2
24
2
23
2
21
2
242
2
232
2
22
2
212
2
241
2
231
2
21
2
211
2
111
1111
11
11111
11111
pq
qqq
p
p
lmlm
lmllmllml
lmlmlmmlm
lmlmlmmlm
上式の係数は
222222
2222112111
ml
ll
mlml
ll
lm
l
lmm
222222
2222112111
ml
mm
mlml
mm
lm
m
lml
2
2211222111122222222
2222
ml
mm
ml
ll
mlml
mllmml
lm
ml
lmlm
となり,
2
24
23
21
242
232
22
212
241
231
21
211
2221
2121
21
11211
11211
1
pq
qqq
p
p
lm
mm
lm
ll
lm
lm
mm
lmlm
mm
lmlm
mm
lm
lmlmlm
ll
lmlm
lmlmlm
ll
lmlm
lm
-279-
2
24
23
221
222
21
24
23
221
242
232
22
212
241
231
21
211
2
2222
222
1111
1111
1111
1
pq
qqpqq
pqpp
qqpqq
p
p
l
m
l
m
l
m
l
m
m
l
m
l
m
l
lmlmlmlm
lmlmlmlm
lmlmlmlm
lm
よって,一般形として
2
1
2
1
2
1 1
22 22211
pq
m
j
pj
l
i
iq
l
i
m
j
ijqpm
l
l
m
lmlmBAVar
が成り立つ.最適条件の分散の推定値は,上式右辺に 2ij 値を代入し求めればよい.
-280-
第17章 Excel 演習問題
【問題 17-1】
某プラスティック化成(株)では,プラスティック製の植木鉢を射出成型機で製造している
が,従来,使用している原料樹脂に加えてコスト低減を目標に新原料樹脂に変更し最適な成
形条件を検討している.
そこで,成形条件である樹脂温度 Aを 3 水準,射出圧力Bを 3 水準取上げてランダムに
各組合せ条件下で 200 個ずつ成形し,専門員による外観検査によって不良個数を選別して
表 17.1-1に示すデータを得た.
表 17.1-1 サンプル ijn 個と不良個数データ ijx の実験データ表
因子 1A 2A 3A
1B ijn 200 200 200
ijx 18 13 28
2B ijn 200 200 200
ijx 14 10 21
3B ijn 200 200 200
ijx 22 21 26
次の設問に答えよ.
(1)分散分析を行い有意水準 5%で樹脂温度 Aと射出圧力Bについて効果を検定し,
考察せよ.
(2)不良率を最小とする最適条件を定め,その条件における母不良率の点推定値と
信頼率 95%信頼限界を求めよ.
-281-
第18章 単回帰分析(繰返しなし)
一般に,原因(要因)系に対して結果(特性)系への関係について把握し改善に役立てる
場合,結果系のみの関係から要因探索に寄与させる場合がある.本章では,変数 xと y との
関数関係式(回帰式)を推測し検討する方法について述べる.また,実験する変数 xが 1個
で特性との対のデータから関数関係を推測する方法を単回帰分析と呼んでいる.
18.1 回帰分析とは
回帰分析とは,図 18.1の特性要因図に示す原因と結果および図 18.2の結果と結果の関係
を定量的に,xに対する y の関数を用いて分析する統計的手法である.取り上げた xと y を
図 18.1 原因 xと結果 y の関係 図 18.2 結果 xと結果 y の関係
変数と呼び,それぞれが 1 個の場合を単回帰分析,変数 xを 2 個以上取り上げて関係を把
握する手法を重回帰分析と呼んでいる(重回帰分析については「Excelで学ぶ多変量データ
処理入門」を参照).原因系とする変数 xを説明変数( independent variable )または独立変
数,結果とする変数 y を目的変数( response variable )または従属変数と言い,目的変数に
対して説明変数が px,,x,x 21 であるとき,想定されるモデルを,
px,,x,xfy 21 ただし, f : px,,x,x 21 の関数関係,:誤差
として関数関係 f を把握する統計的手法を回帰分析と呼んでいる.
18.2 単回帰モデル
関数関係式(18.1)の f が 1次式で表されるとき,
ppxxxyE 22110
のモデルを重回帰モデルといい,このモデル式(18.2)で説明変数が 1個( 1p )の場合,
110 xyE
のモデルを単回帰モデルという.表 18.1 は繰返しがない場合の単回帰分析におけるデータ
表である.xと y の対のデータ y,x をn個収集したデータで 2x ,2y および xy欄は後述す
る統計量を求めるのに必要となり補助表として示している.2つの変数間の関係を知る一つ
表 18.1 繰返しのない単回帰分析よるデータ表
サンプル x y 2x 2y xy
1 1x 1y 2
1x 2
1y 11yx
2 2x 2y 2
2x 2
2y 22 yx
3 3x 3y 2
3x 2
3y 33 yx
i ix iy 2
ix 2
iy ii yx
n nx ny 2
nx 2
ny nn yx
合計
n
i
ix1
n
i
iy1
n
i
ix1
2
n
i
iy1
2
n
i
ii yx1
要因
特性 特性 と特性
( 18.1 )
( 18.2 )
( 18.3 )
-282-
に QC 七つ道具に散布図があり,変数間の関係の強さを把握する方法として相関分析があ
る.相関分析は,2変数が2次元の正規分布に従っていることが仮定されるのに対し,単回
帰分析では,説明変数 xを指定したとき目的変数 y の推定を図るのが目的であり,単回帰モ
デルである式(18.3)は,相関分析を含むことになる.
単回帰モデルにおけるデータの構造式は, n,,,ixi 21 に対する iy の母平均を i とす
ると,
iiiii xy 10
となる.説明変数 ix ,目的変数 iy は観測値であり, i は誤差である.また 0 , 1 は未知
の定数であり 0 を切片, 1 を回帰係数( regression coefficient )と呼び,併せて 0 , 1 を
回帰母数( regression parameter )とも呼ばれる.式(18.4)の誤差 i に関する条件として次の
四つの仮定がおかれる.
(1) 不偏性 0iE
(2) 等分散性 2 iVar
(3) 正規性 i は正規分布に従う
(4) 独立性 0ji ,C o v , ji
これらの条件の下で式(18.4)の期待値は,
xyE i 10
となり直線となる.式(18.6)を xに対する y の回帰直線( regression line of y to x )という.
すなわち,単回帰分析では,観測値 x,y より未知の定数である回帰母数を推定し回帰線を
確立することである.単回帰モデルを図示すると図 18.3となる.
図 18.3 単回帰モデル
18.3 回帰母数の推定
データより回帰母数 0 , 1 の推定には最小二乗法( method of least squares )を用いる.
通常,回帰直線の予測値 i は実測値 iy とは一致せず,回帰母数の推定値 0 , 1 を用いて
回帰直線を,
ii xˆˆˆ10
と表せば,実測値と回帰直線の差,すなわち,これを残差( residual )といい ie とすると,
iiiii xˆˆyˆye 10
( 18.4 )
( 18.5 )
( 18.6 )
( 18.7 )
( 18.8 )
iy
ix
x10
x
y
ii x10
iy
i
-283-
となる.最小二乗法とは,この残差の二乗和が最小になるように回帰母数の推定値 0 , 1
を決定する方法である.よって,残差の二乗和を残差平方和( sum of squares residuals )と
いい eS で表すと,
n
i
ii
n
i
ie xˆˆyeS1
2
10
1
2
となる.残差平方和が最小となる推定値 0 , 1 を求めるには,偏微分して 00 Se ,
01 Se となる連立方程式の解となる.故に,
02
02
1
10
1
1
10
0
n
i
iiie
n
i
iie
xˆˆyxˆS
xˆˆyˆS
から,
②
①
n
i
ii
n
i
i
n
i
i
n
i
i
n
i
i
yxxˆxˆ
yxˆˆn
11
2
1
1
0
11
10
となる.この連立方程式を正規方程式( normal equation )という.式(18.10)①より,
xˆyn
xˆ
n
yˆ
n
i
i
n
i
i
11
11
0
式(18.10)を式(18.10)②に代入して,
n
i
ii
n
i
i
n
i
i yxxˆxxˆy11
2
1
1
1 より,
n
i
i
n
i
ii
n
i
i
n
i
i xyyxxxxˆ
1111
2
1
xx
xy
n
i
in
i
i
n
i
i
n
i
in
i
ii
S
S
n
x
x
n
yx
yxˆ
2
1
1
2
11
11
と求められる.したがって,式(18.11)を回帰直線式(18.7)に代入すると,
xxˆ'ˆxxˆyˆiii 101 ただし, y'ˆ 0
とも変形できる.したがって,式(18.4)における単回帰モデルのデータの構造式は,
モデル単回帰第
モデル単回帰第
2
1
10
10
iii
iii
xx'y
xy
と記述することもできる.単回帰第 1 モデルでは,切片 0 が 0ix のときの iy 値であり取
り上げる変数 xが温度,圧力,寸法など原点における統計量の検討には実用性に乏しい場合
がある.このような場合には,単回帰第 2モデルとして表記しておくと便利である.単回帰
第 2モデルの表記は,回帰直線が変数 xと yの平均値 y,x を通ることも一目瞭然である.
( 18.8 )
( 18.9 )
( 18.10 )
( 18.11 )
( 18.12 )
( 18.13 )
( 18.14 )
-284-
18.4 単回帰分析における平方和の分解
単回帰分析における平方和は,図 18.4 に示すデータ yの全変動を回帰からの残差(残差
変動)と回帰による変動に分解できる.すなわち,総平方和 TS は
n
i
i
n
i
ii
n
i
i
n
i
ii
n
i
iT
yxˆˆxˆˆy
yˆˆyyyS
1
2
10
1
2
10
1
2
1
2
1
2
総平方和 = 残差平方和(回帰からの残差) + 回帰による平方和(回帰による変動)
図 18.4 平方和の分解
となる.回帰による平方和を RS とすると,式(18.15)の右辺第 2項に式(18.11)(18.12)を代入
して,
xx
xxxx
n
i
i
n
i
i
n
i
i
n
i
iR
S
SSˆxxˆ
xxˆyxˆxˆyyxˆˆS
22
1
1
221
1
2
1
1
2
11
1
2
10
となる.また,残差平方和を eS とすると,式(18.15)の右辺第 1項に同様に式(18.11)(18.12)
を代入して,
RT
xx
xxTxxT
n
i
i
n
i
i
n
i
ii
n
i
ii
n
i
iie
SSS
SSSˆSxxˆyy
xxˆyyxˆxˆyyxˆˆyS
22
1
1
221
1
2
1
2
1
1
2
11
1
2
10
となる.平方和を自由度とまとめると,
1
2
1
1
2
2
1
2
10
2
1
2
10
nSyyS
nSSS
SSxˆˆyS
S
SyxˆˆS
Tyy
n
i
iT
eRT
xx
xxT
n
i
iie
R
xx
xxn
i
iR
総平方和:
回帰からの平方和:
回帰による平方和:
となる.
y
y
x ix
iy
yyi
xˆˆˆ10
x
iiˆy
yˆi 回帰による変動
回帰からの残差 全変動
( 18.15 )
( 18.16 )
( 18.17 )
( 18.18 )
-285-
18.5 単回帰分析における分散分析法
単回帰分析では,説明変数 xを指定したとき目的変数 y の推定を図るのが目的であった.
そこで,第 18.3 節で推定された回帰直線の妥当性を分散分析により,統計的に判断するに
は,前節の平方和を利用して,
データの構造式
第 1モデル iii xy 10 20 ,Ni~
第 2モデル iii xx'y 10 20 ,Ni~
平方和と自由度の計算
総平方和(総変動) n
y
yyySS
n
i
in
i
i
n
i
iyyT
2
1
1
2
1
2
1 nT
回帰による平方和(直線回帰)xx
xy
RS
SS
2
1R
ただし, n
yx
yxyyxxS
n
i
i
n
i
in
i
ii
n
i
iixy
11
11
n
x
xxxS
n
i
in
i
i
n
i
ixx
2
1
1
2
1
2
回帰からの平方和(残差変動) RTe SSS 2 nRTe
を求めて分散分析表を作成すると表 18.2になる.
表 18.2 分散分析表
要因 平方和 自由度 平均平方 Fo E.m.s
直線回帰 R xxxyR SSS 2 1R RRR SV eR VV
221
2 xxi
残差 e Ryye SSS 2 ne eee SV 2
合計 T yyT SS 1 nT
よって, xに対する y の回帰直線の判断は,有意水準 5%とすると,
仮 説: 0210 :H , 02
11 :H に対し,
棄却域: 0500 .;,FVVF eReR
として回帰係数による検定を行えばよい.また平方和における比 TR SS は,総変動のうち
回帰直線によって説明される変動の割合を表し寄与率と呼ばれている.すなわち寄与率は,
寄与率:2
222
xy
yyxx
xy
yyxx
xy
yy
xxxy
T
R rSS
S
SS
S
S
SS
S
S
となり, xと y の相関係数の 2乗である.
18.6 回帰母数の検定と推定
得られた回帰直線の回帰母数の推定値における検定および推定については,それぞれの
回帰母数の推定値 1 , 0 は,
( 18.26 )
( 18.27 )
( 18.19 )
( 18.20 )
( 18.21 )
( 18.22 )
( 18.23 )
( 18.24 )
( 18.25 )
-286-
回帰係数:
2
11
1
xxS,Nˆ~ ,切片:
2
2
00
1
xxS
x
n,Nˆ ~
の正規分布に従うことを利用して検討する.
18.6.1 回帰母数に関する検定
回帰直線の傾き,すなわち 01 であるかどうかは,相関分析による無相関の検定に一
致し直線関係が認められるかの統計的な判断である.また,従来の回帰直線が存在しその回
帰係数が 101 ( 10 は検定のための設定値)であるかどうかを統計的に判断する方法で
ある.
(1)仮説ゼロの検定
帰無仮説 010 :H
対立仮説 011 :H (有意水準 050. )
検定統計量は,回帰係数 1 が式(18.28)より正規分布に従っていることを利用して標準化
式 xxSˆu 2
11 の2 が未知であることから推定量 eVˆ 2 で置き換えると t分
布に従うことになる.したがって, xxe SVˆt 11 は自由度 2 ne の t分布に従
う.よって,帰無仮説の下における検定統計量は,
推定値 xx
xy
S
Sˆ 1
検定統計量 xxe SV
ˆt 10
棄却域 05020 .,nt,tt e
となる.
(2)回帰係数 1 の一般的な検定
帰無仮説 1010 :H ( 10 :設定値)
対立仮説 1011 :H (有意水準 050. )
に対しては同様に式(18.30)(18.31)から,帰無仮説の下における検定統計量は,
推定値 xx
xy
S
Sˆ 1
検定統計量 xxe SV
ˆt 1010
棄却域 05020 .,nt,tt e
となる.
(3) 0ix における切片 0 の検定
推定した回帰直線が 0ix のとき切片 000 ( 00 は検定のための設定値)であるかど
うか,または xxi のとき 000 '' ( 00 ' は検定のための設定値)であるかどうかを統計
( 18.28 )
( 18.29 )
( 18.30 )
( 18.31 )
( 18.33 )
( 18.34 )
( 18.32 )
-287-
的に判断する方法である.
帰無仮説 0000 :H ( 00 :設定値)
対立仮説 1001 :H (有意水準 050. )
検定統計量は,回帰係数 0 が式(18.28)より正規分布に従っていることを利用して標準化
式 xxSxnˆu 22
000 1 の2 が未知であることから推定量 eVˆ 2 で置き換
えると t分布に従うことになる.したがって, xxe SxnVˆt 2
000 1 は自由度
2 ne の t分布に従う.よって,帰無仮説の下における検定統計量は,
推定値 xˆyˆ10
検定統計量
e
xx
VS
x
n
ˆt
2
0000
1
棄却域 05020 .,nt,tt e
となる.
(4) xxi における 0 ' の検定
帰無仮説 0000 '':H ( 00 ' :設定値)
対立仮説 0001 '':H (有意水準 050. )
統計量 0 ' は,式(18.13)より y'ˆ 0 であり 0 ' は期待値 x'ˆE 100 および分散
n'ˆVar 2
0 の正規分布に従うことから標準化式 n''u 2
000 の分散の推
定量 eVˆ 2 で置き換えると t分布に従うことになる.したがって, nV''t e000
は自由度 2 ne の t分布に従う.よって,帰無仮説の下における検定統計量は,
推定値 y'ˆ 0
検定統計量
eVn
'yt
1
000
棄却域 05020 .,nt,tt e
となる.
18.6.2 回帰母数に関する区間推定
(1)回帰係数 1 の区間推定
回帰係数の推定値 1 は, xxS,N 2
1 の正規分布に従うことから推定量 eVˆ 2 で置き
換えると xxe SVˆt 11 が自由度 2 ne の t分布に従う.よって,回帰係数 1 の
信頼率 1100 %信頼限界は 050. とすると.
xx
e
xx
ee
S
V.,ntˆ
S
V,tˆ 050211
となる.
( 18.35 )
( 18.36 )
( 18.37 )
( 18.38 )
( 18.39 )
( 18.40 )
( 18.41 )
-288-
(2)切片 0 の区間推定
切片の推定値 0 は, 22
0 1 xxSxn,N の正規分布に従うことから推定量 eVˆ 2 で
置き換えると xxe SxnVˆt 2
00 1 は自由度 2 ne の t分布に従う.よって,
回帰係数 0 の信頼率 1100 %信頼限界は 050. とすると,
e
xx
e
xx
e VS
x
n.,ntˆV
S
x
n,tˆ
2
0
2
0
10502
1
となる.
(3) xxi における 0 ' の区間推定
xxi における推定値 0 ' は, n,'N 2
0 の正規分布に従うことから推定量 eVˆ 2
で置き換えると nV''ˆt e00 は自由度 2 ne の t分布に従う.よって, xxi
における推定値 0 ' の信頼率 1100 %信頼限界は 050. とすると,
eee Vn
.,nt'ˆVn
,t'ˆ1
0502 1
00
となる.
18.7 母回帰直線の区間推定
推定された直線回帰式(18.7)および(18.13)に対し,指定した 0x に対する母回帰式は,
第 1回帰モデル 010 x
第 2回帰モデル xx' 010
であり,その推定値は,
第 1回帰モデル 0100 xˆˆˆ
第 2回帰モデル xxˆ'ˆˆ 0100
で与えられる.式(18.45)はともに正規分布,
2
2
000
1
xxS
xx
n,Nˆ ~
に従う.回帰母数 0 , 1 は式(18.28)よりそれぞれ正規分布に従うことから,式(18.45)の
期待値は,
第 1回帰モデル 00100100100 xxˆEˆExˆˆEˆE
第 2回帰モデル xxˆxˆˆExxˆ'ˆEˆE 01100100
0010010010 xxˆEˆExˆˆE
分散は,
第 1回帰モデル 0100100100 2 xˆ,ˆCovxˆVarˆVarxˆˆVarˆVar
2
2
0202202
2
1001200
12
1
2
xxxxxxxx S
xx
nS
xx
S
x
S
x
n
ˆ,ˆCovxˆVarxˆVar
( 18.42 )
( 18.44 )
( 18.45 )
( 18.46 )
( 18.47 )
( 18.48 )
( 18.43 )
-289-
第 2回帰モデル xxˆ'ˆVarˆVar 0100
0 11
2
1
2
2
02
2
02
101
2
0
0101
ˆ,yCovS
xx
nS
xx
n
ˆ,yCovxxˆVarxxyVar
xxˆ,yCovxxˆVaryVar
xxxx
をもつ正規分布に従うことから,標準化式 22
000 1 xxSxxnˆu の分散
の推定量 eVˆ 2 で置き換えると標準化式 exx VSxxnˆt2
000 1 は自由度
1 ne の t分布に従うことになる.
よって,回帰直線 0 における信頼率 1100 %信頼限界は 050. とすると.
第 1回帰モデル
e
xx
e VS
xx
n,tˆ
2
00
1
e
xx
VS
xx
n.,ntxˆˆ
2
0010
10501
第 2回帰モデル
e
xx
e VS
xx
n,tˆ
2
00
1
e
xx
VS
xx
n.,ntxxˆ'ˆ
2
0010
10501
となる.
信頼限界の幅は, xx 0 のとき最小となり, 0x 値が xから離れることにより大きくなる
ことがわかる.
18.8 個々のデータの予測限界
推定式として得られた回帰直線式(18.45)を利用して,表 18.1に示す個々のデータ y がど
のような値として予測されるかを考えることができる.
0xx のとき推測された回帰直線から予測される目的変数 0y の値は,第 1回帰モデルを
利用すると,
01000 xy 20 ,N~
として予測値は,
xˆˆeˆy 10000
となる.よって,
期待値: ExˆEˆExˆˆEyE 0100100
1 0010 x
分 散: 0100 xˆˆVaryVar
2 2 2 010010
010
,xˆCov,ˆCovxˆ,ˆCov
VarxˆVarˆVar
1001
2
00 2 ˆ,ˆCovxVarˆVarxˆVar
( 18.49 )
( 18.50 )
( 18.51 )
-290-
2
2
0
22
2
02222
0
2
0
2
2
0
222
022
11
12
11
21
xx
xxxx
xxxxxx
S
xx
n
S
xx
nxxxx
Sn
S
xx
S
x
S
x
n
となる.したがって,上記,期待値および分散をもつ正規分布に従うことから,予測値 0y
は標準化式 22
000 11 xxSxxnyyu の分散の推定量 eVˆ 2 で置き換え
ると標準化式 exx VSxxnyyt2
000 11 は自由度 1 ne の t分布に従う
ことになる.
よって, 0xx のとき推定された回帰直線による信頼率 1100 %個々のデータの予測
値 0y の予測限界は 050. とすると.
e
xx
e
xx
e VS
xx
n.,ntxˆˆV
S
xx
n,tˆ
2
0010
2
00
110501
11
となる.
18.9 例題
某社では,電磁弁の構成部品の寸法 xと作動特性 y の関係を調査してきた.その関係は直
線関係にあることは分かっている.そこで,この電磁弁の一部回路の設計を変更したので,
再度,電磁弁をランダムにサンプル 30 個抽出し, xと y を測定して対のデータ表 18.3 を
得た.単位は省略し数値は変換してある.
次の設問に答えよ.
(1)構成部品の寸法 xに対する作動特性 y は直線関係にあるかを検討し,一部回路の設計
変更に対する新しい回帰直線を推定せよ.
(2)従来の直線関係は x..y 54807211 であった.新しい回帰直線と異なるかを有意水
準 5%で検定せよ.また,それぞれの回帰母数の信頼率 95%信頼限界を求めよ.
(3)新しい回帰直線を用いて x 12.5,13.5,14.5,15.5,16.5,17.5,18.5における y
の信頼率 95%信頼限界を求めよ.
(4)データ x,y の散布図を描き,推定された新しい回帰直線,従来の回帰直線および信
頼限界を図示せよ.
本例題は,電磁弁の設計変更により構成部品の寸法 xと作動特性 y の新しい関数関係を
求め,従来の回帰直線と統計的に比較検討することを目的としている.
(1)分散分析と回帰直線の推定
a)平方和と自由度の計算
題意によるデータの構造を式(18.19)または式(18.20)より,
iii xy 10 20 ,Ni~
または, iii xx'y 10 20 ,Ni~
と考える.
( 18.53 )
( 18.52 )
-291-
表 18.3 繰返しのない単回帰分析よるデータ例
サンプル x y 2x 2y xy
1 15.6 7.6 243.36 57.76 118.56
2 13.2 6.0 174.24 36.00 79.20
3 15.8 7.0 249.64 49.00 110.60
4 14.9 6.2 222.01 38.44 92.38
5 16.0 8.1 256.00 65.61 129.60
6 15.8 6.5 249.64 42.25 102.70
7 14.4 6.2 207.36 38.44 89.28
8 13.6 5.1 184.96 26.01 69.36
9 15.2 6.1 231.04 37.21 92.72
10 15.1 8.1 228.01 65.61 122.31
11 11.6 5.2 134.56 27.04 60.32
12 16.9 9.2 285.61 84.64 155.48
13 14.5 6.9 210.25 47.61 100.05
14 14.7 5.6 216.09 31.36 82.32
15 16.2 7.5 262.44 56.25 121.50
16 14.7 6.7 216.09 44.89 98.49
17 18.1 9.1 327.61 82.81 164.71
18 16.0 6.7 256.00 44.89 107.20
19 12.5 4.7 156.25 22.09 58.75
20 15.5 7.0 240.25 49.00 108.50
21 14.2 5.3 201.64 28.09 75.26
22 16.0 8.8 256.00 77.44 140.80
23 15.9 7.2 252.81 51.84 114.48
24 14.3 6.8 204.49 46.24 97.24
25 14.7 6.3 216.09 39.69 92.61
26 15.2 6.4 231.04 40.96 97.28
27 17.1 8.3 292.41 68.89 141.93
28 13.9 6.2 193.21 38.44 86.18
29 13.9 4.6 193.21 21.16 63.94
30 15.1 6.8 228.01 46.24 102.68
合計 450.6 202.2 6820.32 1405.90 3076.43
総平方和(総変動)n
y
ySS
n
i
in
i
iyyT
2
1
1
2
0724330
2202901405
2
..
. 29130 yyT
回帰による平方和(直線回帰) 6562930852
38639 22
..
.
S
SS
xx
xy
R 1R
ただし,n
yx
yxS
n
i
i
n
i
in
i
iixy
11
1
3863930
22026450433076 .
...
3085230
6450326820
2
2
1
1
2 ..
.n
x
xS
n
i
in
i
ixx
-292-
回帰からの平方和(残差変動) 416136562907243 ...SSS RTe
28129 RTe
b)分散分析
統計量の計算から分散分析表を作成すると表 18.4となる.
表 18.4 分散分析表
要因 平方和 自由度 平均平方 Fo E.m.s
直線回帰 R 29.656 1 29.656 61.9* 22
12 xxi
残差 e 13.416 28 0.4791 2
合計 T 43.072 29
有意水準 5%とすると, xに対する y の回帰直線の判断は,
仮 説: 0210 :H , 02
11 :H に対し,
棄却域: 2040502819610 ..;,F.VVF eR
となり有意である.よって回帰直線は認められる.
また寄与率は, 688500724365629 ...SS TR となり 68.85%であることがわかる.
c)回帰直線の推定
回帰直線の推定には式(18.11)および式(18.12)で求められる.
回帰係数 753030852
38639
1
1
2
11
11 .
.
.
S
S
n
x
x
n
yx
yxˆ
xx
xy
n
i
in
i
i
n
i
i
n
i
in
i
ii
切片 57040215753074611
11
0 ....xˆyn
xˆ
n
yˆ
n
i
i
n
i
i
ただし, 74630
22021 ..
n
y
y
n
i
i
, 0215
30
64501 ..
n
x
x
n
i
i
よって,推定される回帰直線はモデル式(18.14)より,
単回帰第 1モデル iii x..xˆˆˆ 7530570410
または,単回帰第 2モデル 02157530746 10 .x..xxˆ'ˆˆiii
と推定される.
(2)回帰母数の検定
推定された回帰直線が,従来の回帰直線と異なるかを統計的に検定してみると,従来
の回帰直線は, x..y 54807211 より,
x..xy 548072111000
021554805106 1000 .x..xx'y
となる.
a)回帰係数の検定と区間推定
-293-
回帰係数 1 における検定は,式(18.32)(18.33)(18.34)より,
帰無仮説 1010 :H ( 548010 . )
対立仮説 1011 :H (有意水準 050. )
帰無仮説の下における検定統計量は,
推定値 753030852
386391 .
.
.
S
Sˆ
xx
xy
検定統計量 14223085247910
548075301010 .
..
..
SV
ˆt
xxe
棄却域 05020 .,nt,tt e より,
判定 04820502814220 ..,t.t
となる.ゆえに,回帰係数は有意水準 5%で有意である.すなわち,一部回路の設計
変更した回帰直線の回帰係数は,従来の回帰式の回帰係数と異なるといえる.
推定した回帰直線の回帰係数 1 の信頼率 1100 %信頼限界は式(18.41)より,
5570
9490196075300957004827530
30852
479100502875301
.
......
.
..,t.
S
V,tˆ
xx
ee
となる.
b)切片( 0ix における) 0 の検定と区間推定
切片 0 における検定は,式(18.35)(18.36)(18.37)より,
帰無仮説 0000 :H ( 721100 . )
対立仮説 1001 :H (有意水準 050. )
帰無仮説の下における検定統計量は,
推定値 57040215753074610 ....xˆyˆ
検定統計量
4791030852
0215
30
1
72115704
122
0000
..
.
..
VS
x
n
ˆt
e
xx
9741443011
8492.
.
.
棄却域 05020 .,nt,tt e より,
判定 04820502897410 ..,t.t
となる.ゆえに, 0ix における切片は有意水準 5%で有意ではない.すなわち,一
部回路の設計変更に伴う 0ix における回帰直線の切片は,従来の回帰式の切片と
異なるとはいえない.
推定した回帰直線の 0ix における切片 0 の信頼率 1100 %信頼限界は,
式(18.42)より,
4791030852
0215
30
1050285704
1 22
0 ..
..,t.V
S
x
n,tˆ
e
xx
e
-294-
5257
61519552570444301104825704
.
......
となる.
c) xxi における 0 ' の検定と区間推定
xxi における 0 ' の検定は,式(18.38)(18.39)(18.40)より,
帰無仮説 0000 '':H ( 5106 00 .' )
対立仮説 0001 '':H (有意水準 050. )
帰無仮説の下における検定統計量は,
推定値 746 0 .y'ˆ
検定統計量 8201126370
230
4791030
1
5106746
1
000 .
.
.
.
..
Vn
'yt
e
棄却域 05020 .,nt,tt e
判定 04820502882010 ..,t.t
となる.ゆえに, xxi における切片は有意水準 5%で有意ではない.すなわち,一
部回路の設計変更に伴う xxi における回帰直線の切片は,従来の回帰式の切片と
異なるとはいえない.
推定した回帰直線の xxi における切片 0 の信頼率 1100 %信頼限界は,
式(18.43)より,
4816
999625907461263700482746
4791030
105028746
1 0
.
......
..,t.Vn
,t'ˆ ee
となる.
(3)母回帰直線の区間推定
推定する母回帰直線は推定値を式(18.45)で表すと,推定された回帰直線は式(18.46)の正
規分布に従い,その信頼限界は式(18.49)で表せる.
指定する ix に対する母回帰直線の信頼率 1100 %信頼限界は 050. とすれば,
4 7 9 103 0 852
0215
30
105028
12
0
2
0 ..
.x.,tˆV
S
xx
n,tˆ i
e
xx
ie
となる.よって,各 ix に対する計算値は表 18.5となる.
(4)散布図の作成
一部回路設計変更後の表 18.3 に示すデータの散布図,データから推定された回帰直線お
よび回路設計変更前の従来の回帰直線を図 18.5に示す.
併せて,推定された回帰直線の信頼率 95%信頼限界値である表 18.5 の結果も図 18.5 に
示した.なお,将来実現するであろう ix に対する個々の特性値 iy の信頼率 95%予測限界も
計算し図示した.
-295-
表 18.5 母回帰直線の信頼限界計算補助表
57040 .ˆ , 75301 .ˆ , 30n , 0215.x , 30852.Sxx , 47910.Ve , 048205028 ..,t
ix 点推定値
ii xˆˆˆ 10
e
xx
i VS
xx
nA
21
区間の幅
A,tB e
信頼上限
Bˆ i
信頼下限
Bˆ i
12.5 4.8425 0.074135 0.5576 5.4001 4.2849
13.5 5.5955 0.037131 0.3946 5.9901 5.2009
14.5 6.3485 0.018447 0.2782 6.6267 6.0703
15.5 7.1015 0.018080 0.2754 7.3769 6.8261
16.5 7.8545 0.036032 0.3888 8.2433 7.4657
17.5 8.6075 0.072303 0.5507 9.1582 8.0568
18.5 9.3605 0.126892 0.7295 10.0900 8.6310
図 18.5 電磁弁の構成部品の寸法 xと作動特性 y の関係の散布図
【蛇足 1】
本例題を作成した Original Soft「CROManalysis302.zip」を解凍し,インストール後「相
関分析と回帰分析 Ver3.02」を利用した解析結果の画面を図 18.6~図 18.8に示す.
746 0 .y'ˆ 516 00 .'
0215.x
02157350746
10
.x..
xxˆ'ˆˆ
02155480516
1000
.x..
xx'y
個々のデータ y の 95%予測区間
母回帰直線 の 95%信頼限界
y
x
-297-
図 18.8 相関分析と回帰分析 Ver3.02解析結果
【参考1】式(18.8)の平方和の分解について
Re
n
i
i
n
i
ii
n
i
iiiiii
n
i
iii
n
i
iyyT
SS
yˆˆyyˆˆyyˆˆy
yˆˆyyySS
2 1
2
1
2
1
22
1
2
1
2
xx
xy
R
xx
xy
xx
xx
xyn
i
i
n
i
i
n
i
i
n
i
iR
S
SS
S
SS
S
Sxxˆ
yxˆxˆyyxˆˆyˆS
22
2
2
1
221
1
2
11
1
2
10
1
2
n
i
ii
n
i
i
n
i
i
n
i
ii
n
i
ii
n
i
iie
xxyyˆxxˆyy
xxˆyyxˆxˆyyxˆˆyS
1
1
1
221
1
2
1
2
1
1
2
11
1
2
10
2
xx
xy
xy
n
i
iiS
SSˆxxyyˆ
2
1
1
1 222
RTeRT
xx
xxT
xx
xxxx
xx
xy
T SSSSSS
SS
S
SS
S
SS
2222
-298-
【参考2】平方和の期待値と分散分析表における E.m.sについて
回帰直線: ii x10
210 0 ,Nxy iiii ~
n,Nxy
2
10 0
~ 2
1
21
nEn
i
i
n
i
iiii
n
i
ii
n
i
ii
n
i
iyyT
xxxxExxE
xxEyyESESE
1
21
221
1
21
1
21010
1
2
2
02
22
21211
1
1
1
1
nxnxx
xxExxEn
i
ii
n
i
ii
221
1
2
1
221 1
nSExxE xx
n
i
i
n
i
i
n
i
ii
n
i
i
n
i
i
n
i
iR
xxxxExxE
xxEyESE
1
221
221
1
21
1
21010
1
2
2
02
22
21211
1
1
1
1
nxnxx
xxExxEn
i
i
n
i
i
jiE,ESSS
VE
SEn
SnExx
ExxE
jiixx
R
R
R
RR
xx
n
i
ixx
n
i
i
n
i
n
i
i
0
1
22221
221
1
221
2
1
221
1
2
1
221
2221
221 21 nSnSSESESSESE xxxxRTRTe
2
e
ee
SVE
【参考3】式(18.21)回帰係数 1 の分布について
推定値: xx
xy
S
Sˆ 1
211
1
xxS,Nˆ~
xx
n
i
ixx
n
i
ii
n
i
iii
n
i
iixy
SEESxxE
xxxxEyyxxESE
1
1
1
1
21
1
1010
1
-299-
1111 1
ˆESE
SS
SEˆE xy
xxxx
xy
21
22
221
1
111
xxxx
xx
xx
xy
xxxx
xy
SˆE
SS
SSVar
SS
SVarˆVar
2
11
2
111
1
0
xx
n
i
ii
n
i
i
n
i
i
n
i
ii
n
i
iii
n
i
iixy
S
xxyyVarxx
xxyyxxVaryxxyxxVar
yyxxVarSVar
【参考4】式(18.21)回帰係数 0 の分布について
推定値: xˆyˆ10
2
2
00
1
xxS
x
n,Nˆ ~
0110110110 xxxxˆˆExˆEyExˆyEˆE
00 ˆE
112
1110 2 2 ˆ,yCovxˆVarxyVarxˆ,yCovxˆVaryVarxˆyVarˆVar
01
1
1
0 1
1
11
1
1
22
1
1111
11111
1111
1
n
i
i
xx
n
i
i
xx
n
i
i
n
i
i
xx
n
i
ii
n
i
i
xx
n
i
i
n
i
i
n
i
i
n
i
ii
n
i
i
xx
n
i
ii
n
i
i
xx
xy
n
i
i
xx
xy
xx
n
i
i
xxS
nxxnS
yVarxxnS
yxx,yCovnS
xxyyxxyxxyxx,yCovnS
yyxx,yCovnS
S,yCovnS
SS
,yn
Covˆ,yCov
22
22
21
2 11
xxxx S
x
nS
x
nˆVarxyVar
22
0
1
xxS
x
nˆVar
【参考5】式(18.46)母回帰直線の分布について
0x を指定し第 1 回帰モデル 0100 x を考え,その推定値を 0100 xˆˆˆ とする
と, 0 の分布は,
期待値: 00100100100 xxˆEˆExˆˆEˆE
分 散: 0100100100 2 xˆ,ˆCovxˆVarˆVarxˆˆVarˆVar
1001200 2 ˆ,ˆCovxˆVarxˆVar
-300-
2
111
111
1111110
0
xxS
x
ˆVarxˆ,ˆCovx
ˆ,yCovˆ,xˆCov
ˆ,xˆCovˆ,yCovˆ,xˆyCovˆ,ˆCov
22
0
22
02220
20
2
20
2202
2
1001200
1
12
11
21
2
xx
xxxx
xxxxxx
S
xx
n
S
xx
nxxxx
Sn
S
xx
S
x
S
x
n
ˆ,ˆCovxˆVarxˆVar
となる.また, 0x を指定し第 2 回帰モデル 0100 xx' を考え,その推定値を
0100 xxˆ'ˆˆ とすると, 0 の分布は yxˆˆ'ˆ 100 より,
期待値: xxˆxˆˆExxˆ'ˆEˆE 01100100
0010010010 xxˆEˆExˆˆE
分 散: xxˆ'ˆVarˆVar 0100
101
20
0101
2
ˆ,yCovxxˆVarxxyVar
xxˆ,yCovxxˆVaryVar
01 ,yCov
2
202
202
12
0
11
xxxx S
xx
nS
xx
n
ˆVarxxyVar
【参考6】式(18.52)個々のデータに対する予測の分布について
0xx のとき推測された回帰直線から予測される目的変数 0y の値は,
01000 xy 20 ,N~
として予測値は,
xˆˆeˆy 10000
となる.よって,
期待値: ExˆEˆExˆˆEyE 0100100
0010 x
分 散: 0100 xˆˆVaryVar
2 2 2 010010
010
,xˆCov,ˆCovxˆ,ˆCov
VarxˆVarˆVar
1001200 2 ˆ,ˆCovxVarˆVarxˆVar
xxSxˆVarx
ˆ,yCovˆ,ˆCovxˆ,xˆCov
ˆ,xˆCovˆ,yCovˆ,xˆyCovˆ,ˆCov
21
11111
1111110
0
-301-
22
0
222
022220
20
2
20
22202
2
11
12
11
21
xx
xxxx
xxxxxx
S
xx
n
S
xx
nxxxx
Sn
S
xx
S
x
S
x
n
となる.よって, 0xx のとき推定された回帰直線による信頼率 1100 %個々のデータの
予測値 0y の予測限界は 050. とすると.
e
xx
e
xx
e VS
xx
n.,ntxˆˆV
S
xx
n,tˆ
20
010
20
0
10501
1
【参考7】相関分析との関係について
相関分析は,2変量間の関連性の強さの程度を解析する手法であり,変数 xと yの試料相
関係数 yyxxxy SSSr を用いて検討する.
単回帰分析での仮説 010 :H , 011 :H の検定統計量は,
xx
xy
yy
xx
xxxy
Ryy
xx
xxxy
e
xx
e
xx S
SS
nS
SS
SSnS
SS
n
S
S
ˆ
VS
ˆt
2
110
2
12
1
2
11
,rSSSSS
Sr
S
SSS
nS
SSyyxxxy
yyxx
xy
xx
xyyyxx
xx
xxxyとおいてよりただし, 22
2
2
1
2
2222
1
2
1
2
1
222
r
nr
r
n
SS
S
rSS
nS
rSSSS
nS
SSS
nS
yyxx
xy
yyxx
xy
yyxxyyxx
xy
xyyyxx
xy
となり,相関分析では, 0t が自由度 2n の t分布に従うことを利用し 00 :H , 01 :H
の仮説検定が行われる.この検定を無相関の検定と呼んでいる.
相関分析は,変数 xと yの周辺分布が共に正規分布に従い,母集団分布は 2次元正規分布
に従っている下で解析される.変数 xと yの 2次元正規分布の確率密度関数は,それぞれの
周辺分布を 2xx ,N , 2
yy ,N として,
母相関係数をyx
xy
2
と定義し,
確率密度関数
2
2
2
2
22
12
1
212
1 y
y
yx
yx
x
xyyxx
yx
ey,xf
で表される.したがって,変数 xを指定したとき変数 yの条件付分布は,
xx
y
y
y
xy
y
exf
y,xfxyf
2212
1
212
1
となり,期待値と分散は,
-302-
x
x
y
y xxyE
221 yxyVar
となる.すなわち, xを指定したとき yの条件付分布の期待値の推定値は回帰直線となる.
回帰直線と表し, yˆy , xˆ
x ,yx
xy
ˆˆ
ˆˆ
2
とおくと,
xxˆyxxˆ
ˆyxx
ˆ
ˆ
ˆˆ
ˆyˆx
ˆ
ˆˆˆxyEˆ
x
xy
x
y
yx
xy
x
x
y
y 12
22
xx
xy
x
xy
S
S
ˆ
ˆˆ
2
2
1
また分散を 2 と表し,その推定値は,
Ryy
x
xy
yy
yx
xy
yyyy SSˆ
ˆˆˆ
ˆˆ
ˆˆˆˆˆˆˆxyarVˆ
2
22
22
22
2222222 1
Tyyy SSˆ 2 , xyxy Sˆ 2 , xxx Sˆ 2 , R
xx
xyS
S
S
2
→ Ryye SSS
となる.よって,繰返しのない単回帰分析の解析は,相関分析の解析も包含していることに
なる.
-303-
第18章 Excel演習問題
【問題 18-1】
ある化学工業(株)では塗料成分の開発を行っている.この塗料剤は,現場で一定量の添加
剤が加えられ撹拌し,常温下での塗布後の乾燥性能の向上を目指している.また,従来は塗
料成分の割合 xと乾燥性能である特性 y の関係は,回帰直線として x..y 0210558 の関係
にあった.
そこで,塗料成分比を新たに変更して現場での乾燥性能を調査するために,数カ所の現場
で使用された塗料剤を 30サンプル収集し,塗料成分の割合 xと乾燥性能である特性 y につ
いて常温下で測定し表 18-1.1 のデータを得た.ただし,データは数値変換してあり単位は
省略してある.
表 18-1.1 塗料剤の乾燥性能データ表(単位省略)
サンプル x y サンプル x y サンプル x y
1 8.4 66.8 11 14.2 78.9 21 9.3 69.3
2 10.5 71.2 12 11.7 74.3 22 4.7 60.6
3 9.7 64.4 13 13.0 72.1 23 8.2 64.5
4 10.3 73.7 14 12.9 74.3 24 7.6 69.8
5 11.0 71.1 15 11.7 70.0 25 12.3 70.9
6 10.2 65.5 16 7.7 65.4 26 7.2 60.9
7 9.3 67.4 17 10.5 67.0 27 7.7 67.8
8 9.4 69.7 18 5.7 63.0 28 9.6 67.2
9 12.0 73.4 19 9.0 71.7 29 10.9 71.5
10 11.7 68.8 20 8.7 70.4 30 11.0 73.3
次の設問に答えよ.
(1)測定データより散布図および従来の回帰直線を描き考察せよ.
(2)乾燥性能特性 y は,成分割合 xと直線関係にあるかを有意水準 5%で検定し,新しい
回帰直線を推定せよ.
(3)従来の回帰直線は,新しい回帰直線とそれぞれの回帰母数が異なるかを有意水準5%
で検定せよ.また,それらの回帰母数の信頼率 95%信頼限界を求めよ.
(4)新しい回帰直線を用いて, 04.xi (キザミ 0.2) 615. における特性 i の推定値および
信頼率 95%信頼限界を求めよ.
-304-
第19章 単回帰分析(繰返しあり)
前章の繰返しがない場合の単回帰分析では,原因(要因)系 xに対して結果(特性)系 y
への直線関係について述べた.
本章では,xの要因(例えば,温度,圧力など)の指定値について,繰返し数回の実験がなされ特性 y を得て,原因(要因)系 xに対して結果(特性)系 y への直線関係を把握し改
善に役立てる方法について述べる.
19.1 実験の配置
特性要因図 19.1 に示すように,例えば要因 A(例えば,温度,圧力など) l水準を取り
上げ,各水準の指定値 lx,,x,x 21 が連続量であり,各水準の繰返し数を in (ただし,
l
i
inN1
)合計 lN 回のランダム実験で特性値 y が得られたとする.すなわち,第 3章で述
べた一元配置による実験に相当する.
図 19.1 原因 xと結果 y の関係
表 19.1 一元配置法実験のデータ表 表 19.2 単回帰分析実験のデータ表
因子 1A 2A lA 因子 1A 2A lA
指定値 1x 2x lx
繰
返
し
1 11y 21y 1ly
繰
返
し
1 11y 21y 1ly
2 12y 22y 2ly 2 12y 22y 2ly
ijy ijy
in 11ny
22ny llny r
11ny 22ny
llny
一元配置実験では,取り上げた因子の水準での最適な条件を求めて改善等に役立てたの対
して,表 19.2 の単回帰分析では,取り上げた水準内での指定値 xと特性値 y との関数関係
を求め改善等に役立てることになる.データの構造は,両法の比較において,
一元配置実験: ijiijy ただし, ii a
単回帰分析: ijiiijy ただし, ii x10
ただし, i は回帰 2次以上の変動部分
となる.
19.2 繰返しのある単回帰モデル
繰返しのある単回帰モデルにおけるデータの構造式は,各水準の値 l,,,ixi 21 に対す
る ijy の母平均を i とすると,
ijiiijiiij xy 10
となる.各水準の指定値を説明変数 ix ,特性を目的変数 ijy として, ij は誤差である.また
0 , 1 は未知の定数であり 0 を切片, 1 を回帰係数( regression coefficient )と呼び,併
せて 0 , 1 を回帰母数( regression parameter )と呼ぶのは繰返しのない単回帰分析と同様
( 19.1 )
要因
特性
( 19.2 )
-305-
である.式(19.2)の回帰 2次以上の変動部分 i ,誤差 ij に関する条件として次を仮定する.
20 ri ,N ~ , 20 ,Nij~
これらの条件の下で式(19.2)の期待値は,
xyE ij 10
となり直線となる.式(19.4)を xに対する y の回帰直線( regression line of y to x )といい,
すなわち,繰返しのある単回帰分析でも,観測値 x,y より未知の定数である回帰母数を推
定し回帰線を確立することにある.単回帰モデルを図示すると図 19.2となる.
図 19.2 繰返しある単回帰モデル
要因系としての説明変数 xに対して,目的変数 y に繰返しがある実験で回帰直線の推定
は,変動部分を図 19.2に示すとおり,個々のデータから目的変数の平均までの距離を
yˆˆyyyyy iiiiijij
に分解し,総変動 yyT SS が,
l
i
n
j
i
l
i
n
j
ii
l
i
n
j
iij
l
i
n
j
i
l
i
n
j
iij
l
i
n
j
ijyyT
iii
ii
i
yˆˆyyy
yyyy
yySS
1 1
2
1 1
2
1 1
2
1 1
2
1 1
2
1 1
2
に分解できることを利用して,回帰直線の検討を行う.式(19.6)は,
(総変動)=(級内変動)+(当てはまりの悪さ変動)+(回帰による変動)
となる.第 18章で述べた回帰からの残差が,繰返し実験が実施されると,級内変動(残差
変動)と当てはまりの悪さによる変動に分解できることになる.当てはまりの悪さ( lack of
fit )が残差変動に比較して大きい場合,回帰直線(1次回帰)のみでは不足で 2次以上を持
つ回帰曲線を考慮することを意味する.したがって,各変動の平方和と自由度を,
総平方和:
l
i
n
j
ijyyT
i
yySS1 1
2 11
1
Nnl
i
iT
級間平方和:
l
i
n
j
iA
i
yyS1 1
2 1 lA
なお,級間平方和は一元配置法の実験による因子 Aの平方和に等しい.
iij yy iy
ix
x10
x
y
ii xˆˆˆ10
ijy
i
( 19.3 )
( 19.4 )
y
ijy
x
iiˆy
yˆi
yyij 総変動
級内変動
当てはまりの悪さ
回帰による変動
( 19.6 )
( 19.5 )
( 19.7 )
( 19.8 )
( 19.9 )
-306-
回帰による平方和::
l
i
n
j
iR
i
yˆS1 1
2 1R
当てはまりの平方和(高次平方和):
l
i
n
j
iilof
i
ˆyS1 1
2 2 llof
残差平方和:
l
i
n
j
iije
i
yyS1 1
2 lNe
とおいて,式(19.6)より,
lofReAeyyT SSSSSSS
lofReAeyyT
が成り立つことになる.
繰返しのある単回帰分析の実験によるデータ表は表 19.2 であり,データおよび計算補助
表は表 19.3となる.
表 19.3 繰返しのある単回帰分析よるデータ表および計算補助表
因子 1A 2A lA
水準値 ix 1x 2x lx 合計
in 1n 2n ln
l
i
inN1
ix 11xn 22xn ll xn
l
i
ii xn1
2
ix 2
11xn 2
22xn 2
ll xn
l
i
iixn1
2
11y 21y 1ly
データ特性 12y 22y 2ly
l
i
n
j
ij
i
y1 1
ijy ijy
11ny
22ny llny
in
j
iji yT1
1T 2T lT
l
i
iTT1
in
j
ijy1
2
1
1
2
1
n
j
jy
2
1
2
2
n
j
jy
ln
j
ljy1
2
l
i
n
j
ij
i
y1 1
2
iiTx 11Tx 22Tx llTx
l
i
iiTx1
19.3 回帰母数の推定
繰返しのある単回帰分析でも回帰直線の推定では,第 18章を基礎としてデータより回帰
母数 0 , 1 の推定値は xˆyˆ10 , xxxy SSˆ 1 と求められる.表 19.3補助表より実
験データの総数をN として,
N
xn
xnN
xn
xnxxS
l
i
iil
i
ii
l
i
iil
i
ii
l
i
n
j
ixx
i
2
1
1
2
2
1
1
2
1 1
2
( 19.10 )
( 19.11 )
( 19.12 )
( 19.13 )
( 19.14 )
-307-
N
yxn
yxyyxxS
l
i
n
j
ij
l
i
iil
i
n
j
iji
l
i
n
j
ijixy
i
ii
1 11
1 11 1
N
Txn
Tx
l
i
iil
i
ii
1
1
ただし,
in
j
iji yT1
xx
xy
l
i
iil
i
ii
l
i
iil
i
ii
S
S
N
xn
xn
N
Txn
Txˆ
2
1
1
2
1
11
xˆyN
xnˆ
N
y
ˆ
l
i
ii
l
i
n
j
ij
i
11
1
1 1
0
を計算して回帰直線は,
xxˆ'ˆxxˆyˆiii 101 ただし, y'ˆ 0
と求められる.
単回帰モデルのデータの構造式は,
モ デ ル単 回 帰 第
モ デ ル単 回 帰 第
2
1
10
10
ijiiij
ijiiij
xx'y
xy
と記述することができる.
19.4 繰返しのある単回帰分析における分散分析法
単回帰分析では,説明変数 xを指定したとき目的変数 y の推定を図るのが目的であった.
繰返しのある単回帰分析で推定された回帰直線の妥当性を分散分析により,統計的に判断
するには,データの構造式を
第 1モデル ijiiij xy 10 20 ri ,N ~ , 20 ,Nij~
第 2モデル ijiiij xx'y 10 20 ri ,N ~ , 20 ,Nij~
として,それぞれの変動に対する平方和と自由度を計算する.繰返しのある単回帰分析によ
るデータ計算補助表 19.3の記号を利用して,
l
i
inN1
,
l
i
n
j
ij
i
yT1 1
,
in
j
iji yT1
とおくと,
総平方和(総変動) N
TyyySS
l
i
n
j
ij
l
i
n
j
ijyyT
ii 2
1 1
2
1 1
2
1 NT
A間平方和(級間変動) N
T
n
TyyS
l
i i
il
i
n
j
iA
i 2
1
2
1 1
2
1 lA
( 19.16 )
( 19.18 )
( 19.19 )
( 19.20 )
( 19.21 )
( 19.22 )
( 19.15 )
( 19.17 )
( 19.23 )
-308-
回帰による平方和(直線回帰)xx
xy
RS
SS
2
1R
ただし, N
Txn
TxyyxxS
l
i
iil
i
ii
l
i
n
j
ijixy
i
1
11 1
N
xn
xnxxS
l
i
iil
i
ii
l
i
n
j
ixx
i
2
1
1
2
1 1
2
当てはまりの悪さの平方和(高次回帰) RAlof SSS
2 lRAlof
級内平方和(残差変動) ATe SSS lNATe
と求められる.分散分析表を作成すると表 19.4になる.
表 19.4 分散分析表
要因 平方和 自由度 平均平方 Fo
直線回帰 R xxxyR SSS 2 1R RRR SV eR VV
高次回帰 lof RAlof SSS 2 llof lofloflof SV elof VV
級間 A AS 1 lA
AAA SV eA VV
級内 e Ayye SSS lNe eee SV
合計 T yyT SS 1 NT
分散分析による検定では,まず級間変動に対して有意水準 5%とすると,
仮 説: 02
0 A:H , 02
1 A:H に対し,
棄却域: 0500 .;,FVVF eAeA
次に, xに対する y の回帰直線の判断は,有意水準 5%とすると,
仮 説: 0210 :H , 02
11 :H に対し,
棄却域: 0500 .;,FVVF eReR
として回帰係数による検定を行えばよい.さらに,高次効果に対して,
仮 説: 02
0 r:H , 02
1 r:H に対し,
棄却域: 0500 .;,FVVF elofelof
として検定を行えばよい.繰返しありの単回帰分析では,回帰直線の推定を目的として,デ
ータの分解から当てはまりの悪さ(高次回帰)分離される.検定の結果,高次回帰が有意と
判定された場合,2次以上の回帰モデルが想定されることを意味する.2次以上の回帰モデ
ルについては水準指定値が等間隔であれば直交多項式による分析,また一般的では重回帰
分析による方法が利用される場合がある.
また,当てはまりの悪さ(高次回帰)が検定の結果,有意で場合には高次回帰は級内にプ
ーリングして誤差と考えればよい.プーリング後の分散分析表を表 19.5に示す.
表 19.5 プーリング後の分散分析表
要因 平方和 自由度 平均平方 Fo
直線回帰 R xxxyR SSS 2 1R RRR SV 'eR VV
残差 'e lofe'e SSS lofe'e 'e'e'e SV
合計 T yyT SS 1 NT
0500 .;,FVVF eReR
回帰直線による寄与率は,
( 19.30 )
( 19.24 )
( 19.25 )
( 19.26 )
( 19.27 )
( 19.28 )
( 19.29 )
( 19.31 )
-309-
寄与率:yyxx
xy
yy
xxxy
T
R
SS
S
S
SS
S
S22
となる.
19.5 回帰母数の検定と推定
得られた回帰直線の回帰母数の推定値における検定および推定については,それぞれの
回帰母数の推定値 1 , 0 は,
回帰係数:
2
11
1
xxS,Nˆ~ ,切片:
2
2
00
1
xxS
x
N,Nˆ ~
の正規分布に従うことを利用して検討する.
19.5.1 回帰母数に関する検定
回帰直線の傾きが 01 および従来の回帰直線が存在しその回帰係数が 101 ( 10 は
検定のための設定値)であるかどうかの統計的な判断は第 18章に準じて行う.
(1)仮説ゼロの検定
帰無仮説 010 :H
対立仮説 011 :H (有意水準 050. )
表 19.5 プーリングした分散分析表を用いると,検定統計量は,推定量 'eVˆ 2 で置き換
えると xx'e SVˆt 11 は自由度 'e の t分布に従うことから.帰無仮説の下における
検定統計量は,
推定値 xx
xy
S
Sˆ 1
検定統計量
xxe SV
ˆt 10
棄却域 0500 .,t,tt 'ee
となる.
(2)回帰係数 1 の一般的な検定
帰無仮説 1010 :H ( 10 :設定値)
対立仮説 1011 :H (有意水準 050. )
に対する帰無仮説の下における検定統計量は,
推定値 xx
xy
S
Sˆ 1
検定統計量 xx'e SV
ˆt 1010
棄却域 0500 .,t,tt 'e'e
となる.
(3) 0ix における切片 0 の検定
( 19.32 )
( 19.33 )
( 19.34 )
( 19.35 )
( 19.36 )
( 19.38 )
( 19.39 )
( 19.37 )
-310-
推定した回帰直線が 0ix のとき切片 000 ( 00 は検定のための設定値)であるかど
うか,または xxi のとき 000 '' ( 00 ' は検定のための設定値)であるかどうかの統計
的な判断は同様に第 18章に準じて行う.
帰無仮説 0000 :H ( 00 :設定値)
対立仮説 1001 :H (有意水準 050. )
検定統計量は,推定量 'eVˆ 2 で置き換えると xx'e SxNVˆt 2
000 1 は自
由度 'e の t分布に従うことから,帰無仮説の下における検定統計量は,
推定値 xˆyˆ10
検定統計量
'e
xx
VS
x
N
ˆt
2
0000
1
棄却域 0500 .,t,tt 'e'e
となる.
(4) xxi における 0 ' の検定
帰無仮説 0000 '':H ( 00 ' :設定値)
対立仮説 0001 '':H (有意水準 050. )
統計量 0 ' は,式(19.17)より y'ˆ 0 であり第 18 章に準じて,分散の推定量 'eVˆ 2 で
置き換えると NV''t 'e000 は自由度 'e の t分布に従うことから,帰無仮説の下
における検定統計量は,
推定値 y'ˆ 0
検定統計量
'eVN
'yt
1
000
棄却域 0500 .,t,tt 'e'e
となる.
19.5.2 回帰母数に関する区間推定
(1)回帰係数 1 の区間推定
回帰係数の推定値 1 は,分散の推定量 'eVˆ 2 で置き換えると xx'e SVˆt 11 が
自由度 'e の t分布に従うことから,回帰係数 1 の信頼率 1100 %信頼限界は 050.
とすると.
xx
'e'e
xx
'ee
S
V.,tˆ
S
V,tˆ 05011
となる.
(2)切片 0 の区間推定
切片の推定値 0 は,推定量 'eVˆ 2 で置き換えると xx'e SxNVˆt 2
00 1
( 19.40 )
( 19.41 )
( 19.42 )
( 19.43 )
( 19.44 )
( 19.45 )
( 19.46 )
-311-
は自由度 'e の t 分布に従うことから,回帰係数 0 の信頼率 1100 %信頼限界は
050. とすると,
'e
xx
'e'e
xx
'e VS
x
N.,tˆV
S
x
N,tˆ
2
0
2
0
1050
1
となる.
(3) xxi における 0 ' の区間推定
xxi における推定値 0 ' は,推定量 'eVˆ 2 で置き換えると nV''ˆt 'e00 は
自由度 'e の t分布に従うことから, xxi における推定値 0 ' の信頼率 1100 %信頼限
界は 050. とすると,
'e'e'e'e VN
.,t'ˆVN
,t'ˆ1
050 1
00
となる.
19.6 母回帰直線の区間推定
推定された直線回帰式(19.18)に対し,指定した 0x に対する母回帰式は,
第 1回帰モデル 010 x
第 2回帰モデル xx' 010
であり,その推定値は,
第 1回帰モデル 0100 xˆˆˆ
第 2回帰モデル xxˆ'ˆˆ 0100
で与えられる.回帰母数 0 , 1 は正規分布に従うことから,式(19.50)の期待値と分散は,
00 ˆE
2
2
00
1
xxS
xx
NˆVar
をもつ.表 19.5 の分散分析表を用いて分散の推定量 'eVˆ 2 で置き換えて標準化式を考え
ると 'exx VSxxNˆt2
000 1 は自由度 'e の t分布に従うことになる.よっ
て,回帰直線 0 における信頼率 1100 %信頼限界は 050. とすると.
'e
xx
'e VS
xx
N,tˆ
2
00
1
'e
xx
'e VS
xx
N.,txˆˆ
2
0010
1050
となる.
信頼限界の幅は, xx 0 のとき最小となり, 0x 値が xから離れることにより大きくなる
ことがわかる.
( 19.47 )
( 19.49 )
( 19.50 )
( 19.51 )
( 19.52 )
( 19.53 )
( 19.48 )
-312-
19.7 個々のデータの予測限界
推定式として得られた回帰直線式(19.50)を利用して,表 19.3に示す個々のデータ y がど
のような値として予測されるかを考えることができる.
表 19.5の分散分析表を用いて 0xx のとき推測された回帰直線から予測される目的変数
0y の値は,第 1回帰モデルを利用すると,
01000 xy 20 ,N~
として予測値は,
xˆˆeˆy 10000
となる.よって,予測値 0y は,第 18章と同様に分散の推定量を 'eVˆ 2 で置き換え標準化
式 'exx VSxxNyyt2
000 11 が自由度 'e の t分布に従うことから, 0xx
のとき推定された回帰直線による信頼率 1100 %個々のデータの予測値 0y の予測限界
は 050. とすると.
'e
xx
'e VS
xx
N,tˆ
2
00
11
'e
xx
'e VS
xx
N.,txˆˆ
2
0010
11050
となる.
19.8 例題1
某染料(株)では,染色ムラ減少に取り組んでおり,代表特性による染色試験による評価で
は結果が判明するまでに時間がかかり問題となっている.そこで,某社では,従来よりその
特性は,染料 Aの y 特性と成分Cの配合比 xとの間には x..y 1651092672 の関係が
あることがわかり配合比 xで y 特性を調整していた.
このたび,会社方針として染料 Aの原料購入先の変更を考えており,従来の回帰式が使
用できるかどうか実験を実施し検討することになった.実験は,成分Cの配合比 4 水準で
調整した新原料による染料を準備し,各水準で繰返し 4 回合計 4×4=16 回の実験をランダ
ムに実施し表 19.6に示す特性のデータを得た.データは単位を省略し数値は変換してある.
表 19.6 繰返しのある単回帰分析よるデータ表
因子 1A 2A 3A
4A
水準値 ix 4 6 8 10
2.1 1.6 1.6 1.1
データ特性 2.3 2.1 1.3 1.2
ijy 2.2 1.9 1.4 1.0
2.5 2.0 1.7 0.8
次の設問に答えよ.
(1)成分の配合比 xに対する染料の y 特性は直線関係にあるかを検討し,染料の原料購入
先の変更に対する新しい回帰直線を推定せよ.
(2)従来の直線関係は,新しい回帰直線と異なるかを有意水準 5%で検定せよ.
また,それぞれの回帰母数の信頼率 95%信頼限界を求めよ.
(3)新しい回帰直線を用いて x 4,5,6,7,8,9,10における y の信頼率 95%信頼限
界を求めよ.
( 19.54 )
( 19.55 )
( 19.56 )
-313-
表 19.7 繰返しのある単回帰分析よる計算補助表
因子 1A 2A 3A
4A
水準値 ix 4 6 8 10 合計
in 4 4 4 4
l
i
inN1
16
ii xn 16 24 32 40
l
i
iixn1
112
2
iixn 64 144 256 400
l
i
ii xn1
2864
2.1 1.6 1.6 1.1
データ特性 2.3 2.1 1.3 1.2
l
i
n
j
ij
i
y1 1
26.8 ijy 2.2 1.9 1.4 1.0
2.5 2.0 1.7 0.8
in
j
iji yT1
9.1 7.6 6.0 4.1
l
i
iTT1
26.8
in
j
ijy1
2 20.79 14.58 9.10 4.29
l
i
n
j
ij
i
y1 1
248.76
iiTx 36.4 45.6 48.0 41.0
l
i
iiTx1
171.0
(4)データ x, y の散布図を描き,推定された新しい回帰直線,従来の回帰直線および信
頼限界を図示せよ.
本例題は,xと特性 y について関数関係を把握する目的で,一元配置法による実験を実施
して単回帰分析の方法例である.また分析では高次回帰を検討できる特徴がある.水準が連
続量で実験されている第 3 章で述べた一元配置法での実験データを利用して,さらに拡張
的に併せて活用される場合もある.
(1)分散分析と回帰直線の推定
a)平方和と自由度の計算
題意によるデータの構造を式(19.2)より,
ijiiij xy 10 20 ri ,N ~ , 20 ,Nij~
または, ijiiij xx'y 10 20 ri ,N ~ , 20 ,Nij~
と考え,表 19.6データ表より表 19.7の計算補助表を作成する.
総平方和(総変動) N
TyyySS
l
i
n
j
ij
l
i
n
j
ijyyT
ii 2
1 1
2
1 1
2
870316
8267648
2
..
. 15116 yyT
A間平方和(級間変動) N
T
n
TyyS
l
i i
il
i
n
j
iA
i 2
1
2
1 1
2
-314-
16
82614066719
4
1 22222 .
....
4553894434548 ... 314 A
回帰による平方和(直線回帰)
4453080
61622
..
.
S
SS
xx
xy
R
1R
ただし,N
Txn
TxS
l
i
iil
i
iixy
1
1
61616
8261120171 .
..
N
xn
xnS
l
i
iil
i
iixx
2
1
1
2
08016
112864
2
.
当てはまりの悪さの平方和(高次回帰) 010044534553 ...SSS RAlof
213 RAlof
級内平方和(残差変動) 415045538703 ...SSS ATe
12315 ATe
b)分散分析
統計量の計算から分散分析表を作成すると表 19.8となる.
表 19.8 分散分析表
要因 平方和 自由度 平均平方 Fo
直線回帰 R 3.445 1 3.445 98.4
高次回帰 lof 0.010 2 0.005 0.143
級間 A 3.455 3 1.152 32.9
級内 e 0.415 12 0.035
合計 T 3.870 15
分散分析による検定では,まず級間変動に対して有意水準 5%とすると,
仮 説: 02
0 A:H , 02
1 A:H に対し,
棄却域: 4930501239320 ..;,F.VVF eA
となり,水準間は有意である.次に,xに対する y の回帰直線の判断は,有意水準 5%
とすると,
仮 説: 0210 :H , 02
11 :H に対し,
棄却域: 7540501214980 ..;,F.VVF eR
となり有意である.よって回帰直線は認められる.さらに,高次効果に対して,
仮 説: 02
0 r:H , 02
1 r:H に対し,
棄却域: 8930501220 ..;,FVVF elof
となり有意でない.よって高次効果を級内変動にプーリングし分散分析表を再作成
する.プーリング後の分散分析表を表 19.9に示す.
xに対する y の回帰直線の判断は,有意水準 5%とすると,
仮 説: 0210 :H , 02
11 :H に対し,
棄却域: 60405014181140 ..;,F.VVF 'eR
となり有意である.よって回帰直線は認められる.
-315-
表 19.9 分散分析表
要因 平方和 自由度 平均平方 Fo
直線回帰 R 3.445 1 3.445 114.8
残差 'e 0.425 14 0.030
合計 T 3.870 15
c)回帰直線の推定
回帰直線の推定には式(19.15)および式(19.16)で求められる.
回帰係数 20750080
6161 .
.
.
S
Sˆ
xx
xy
切片 127530720750675110 ....xˆyˆ
ただし, 675116
826.
.
N
Ty , 07
16
1121 .N
xn
x
l
i
ii
よって,推定される回帰直線はモデル式(19.17)より,
単回帰第 1モデル iii x..xˆˆˆ 207501275310
または,単回帰第 2モデル 07207506751 10 .x..xxˆ'ˆˆiii
と推定される.
(2)回帰母数の検定
推定された回帰直線が,従来の回帰直線と異なるかを統計的に検定してみると,従来
の回帰直線は, x..y 1651092672 より,
x..xy 16510926721000
07165107711 1000 .x..xx'y
となる.
a)回帰係数の検定と区間推定
回帰係数 1 における検定は,式(19.36)(19.37)(19.38)より,
帰無仮説 1010 :H ( 1651010 . )
対立仮説 1011 :H (有意水準 050. )
帰無仮説の下における検定統計量は,
推定値 20750080
6161 .
.
.
S
Sˆ
xx
xy
検定統計量
18920800300
16510207501010 .
..
..
SV
ˆt
xx'e
棄却域 0500 .,t,tt 'e'e より,
判定 14520501418920 ..,t.t
となる.ゆえに,回帰係数は有意水準 5%で有意である.すなわち,染料 Aの原料購入先変更の実施より回帰直線の回帰係数は,従来の回帰式の回帰係数と異なるとい
える.
推定した回帰直線の回帰係数 1 の信頼率 95%信頼限界は式(19.45)より,
-316-
080
030005014207501
.
..,t.
S
V,tˆ
xx
'e'e
24900
1660004150207500193650145220750
.
......
となる.
b)切片( 0ix における) 0 の検定と区間推定
切片 0 における検定は,式(19.40)(19.41)(19.42)より,
帰無仮説 0000 :H ( 9267200 . )
対立仮説 1001 :H (有意水準 050. )
帰無仮説の下における検定統計量は,
推定値 127530720750675110 ....xˆyˆ
検定統計量
0300080
07
16
1
9267212753
122
0000
..
.
..
VS
x
N
ˆt
'e
xx
411114230
20080.
.
.
棄却域 0500 .,t,tt 'e'e より,
判定 14520501441110 ..,t.t
となる.ゆえに, 0ix における切片は有意水準 5%で有意ではない. 0ix におけ
る回帰直線の切片は,従来の回帰式の切片と異なるとはいえない.
推定した回帰直線の 0ix における切片 0 の信頼率 95%信頼限界は,式(19.47)
より,
0300080
07
16
10501412753
1 22
0 ..
..,t.V
S
x
N,tˆ
'e
xx
'e
82232
43273305201275314230145212753
.
......
となる.
c) xxi における 0 ' の検定と区間推定
xxi における 0 ' の検定は,式(19.43)(19.44)(19.45)より,
帰無仮説 0000 '':H ( 7711 00 .' )
対立仮説 0001 '':H (有意水準 050. )
帰無仮説の下における検定統計量は,
推定値 6751 0 .y'ˆ
検定統計量 2172043300
0960
030016
1
77116751
1
000 .
.
.
.
..
VN
'yt
'e
棄却域 0500 .,t,tt 'e'e
判定 14520501421720 ..,t.t
-317-
となる.ゆえに, xxi における切片は有意水準 5%で有意である.すなわち,染料
Aの原料購入先変更の実施より xxi における回帰直線の切片は,従来の回帰式の
切片と異なるといえる.
推定した回帰直線の xxi における切片 0 の信頼率 95%信頼限界は,式(19.48)
より,
58211
7679109290675104330014526751
030016
1050146751
1 0
.
......
..,t.VN
,t'ˆ 'e'e
となる.
(3)母回帰直線の区間推定
推定する母回帰直線は推定値を式(19.50)で表すと,その信頼限界は式(19.53)で表せる.
指定する ix に対する母回帰直線の信頼率 1100 %信頼限界は 050. とすれば,
0 3 00080
07
16
105014
12
0
2
0 ..
.x.,tˆV
S
xx
N,tˆ i
'e
xx
i'e
となる.よって,各 ix に対する計算値は表 19.10となる.
(4)散布図の作成
表 19.6 に示すデータの散布図,データから推定された回帰直線および従来の回帰直線を
図 19.3に示す.
併せて,推定された回帰直線の信頼率 95%信頼限界値である表 19.10の結果も図 19.3に
示した.なお,将来実現するであろう ix に対する個々の特性値 iy の信頼率 95%予測限界も
計算し図示した.
表 19.10 母回帰直線の信頼限界計算補助表
127530 .ˆ , 207501 .ˆ , 16n , 0215.x , 080.Sxx , 0300.V 'e , 145205014 ..,t
ix 点推定値
ii xˆˆˆ 10
'e
xx
i VS
xx
NA
21
区間の幅
A,tB 'e
信頼上限
Bˆ i
信頼下限
Bˆ i
4 2.2975 0.005250 0.1554 2.4529 2.1421
5 2.0900 0.003375 0.1246 2.2146 1.9654
6 1.8825 0.002250 0.1017 1.9842 1.7808
7 1.6750 0.001875 0.0929 1.7679 1.5821
8 1.4675 0.002250 0.1017 1.5692 1.3658
9 1.2600 0.003375 0.1246 1.3846 1.1354
10 1.0525 0.005250 0.1554 1.2079 0.8971
-318-
図 19.3 原料購入先変更後推測される xと特性 y の関係の散布図
【蛇足1】
本例題1を作成した Original Soft「CROManalysis302.zip」を解凍し,インストール後
「相関分析と回帰分析 Ver3.02」を利用した解析結果の画面を図 19.4~図 19.7に示す.
図 19.4 相関分析と回帰分析 Ver3.02解析結果
6751 0 .y'ˆ 7711 00 .'
07.x
07207506751
10
.x..
xxˆ'ˆˆ
07165107711
1000
.x..
xx'y
個々のデータ y の 95%予測区間
母回帰直線 の 95%信頼限界
y
x
-320-
図 19.7 相関分析と回帰分析 Ver3.02解析結果
19.9 例題2
本節の例題は,前節に対し高次回帰が必要と考えられる場合のデータ例である.因子 A
を取り上げ,因子の水準が連続量として 5水準( ix 1.0,1.5,2.0,2.5,3.0:水準間は等
間隔)設定し,繰返し 4 回合計 5×4=20 回の実験を実施し特性 ijy のデータを得たとする.
表 19.11にデータ表を示す.データから xに対する y の回帰関係を検討する.
表 19.11 繰返しのある単回帰分析よるデータ表
因子 1A 2A 3A
4A 5A
水準値 ix 1.0 1.5 2.0 2.5 3.0
75 68 86 85 74
データ特性 66 88 98 80 79
ijy 68 81 87 98 86
71 76 78 88 82
本例題に,本章述べた繰返しのある単回帰分析による解析法を適用してみる.
(1)分散分析
a)平方和と自由度の計算
題意によるデータの構造を式(19.2)より,
ijiiij xy 10 20 ri ,N ~ , 20 ,Nij~
-321-
または, ijiiij xx'y 10 20 ri ,N ~ , 20 ,Nij~
表 19.7 繰返しのある単回帰分析よる計算補助表
因子 1A 2A 3A
4A 5A
水準値 ix 1.0 1.5 2.0 2.5 3.0 合計
in 4 4 4 4 4
l
i
inN1
20
ii xn 4 6 8 10 12
l
i
iixn1
40
2
iixn 4 9 16 25 36
l
i
ii xn1
290
75 68 86 85 74
データ特性 66 88 98 80 79
l
i
n
j
ij
i
y1 1
1614 ijy 68 81 87 98 86
71 76 78 88 82
in
j
iji yT1
280 313 349 351 321
l
i
iTT1
1614
in
j
ijy1
2 19646 24705 30653 30973 25837
l
i
n
j
ij
i
y1 1
2131814
iiTx 280.0 469.5 698.0 877.5 963.0
l
i
iiTx1
3288.0
総平方和(総変動) N
TyyySS
l
i
n
j
ij
l
i
n
j
ijyyT
ii 2
1 1
2
1 1
2
2156420
1614131814
2
. 19120 yyT
A間平方和(級間変動) N
T
n
TyyS
l
i i
il
i
n
j
iA
i 2
1
2
1 1
2
20
1614321351349313280
4
1 222222
28538130249131103 .. 415 A
回帰による平方和(直線回帰) 36010
6022
xx
xy
RS
SS 1R
ただし,N
Txn
TxS
l
i
iil
i
iixy
1
1
6020
16144003288
.
N
xn
xnS
l
i
iil
i
iixx
2
1
1
2
1020
4090
2
当てはまりの悪さの平方和(高次回帰) 24933602853 ..SSS RAlof
-322-
314 RAlof
級内平方和(残差変動) 0711285321564 ...SSS ATe
12315 ATe
b)分散分析
統計量の計算から分散分析表を作成すると表 19.8となる.
表 19.8 分散分析表
要因 平方和 自由度 平均平方 Fo
直線回帰 R 360.0 1 360.0 7.59*
高次回帰 lof 493.2 3 164.4 3.47*
級間 A 853.2 4 213.3 4.50*
級内 e 711.0 15 47.4
合計 T 1564.2 19
分散分析による検定では,有意水準 5%とすると級間変動は,
仮 説: 02
0 A:H , 02
1 A:H に対し,
棄却域: 0630501545040 ..;,F.VVF eA
となり,水準間は有意である.次に, xに対する y の回帰直線の判断は,
仮 説: 0210 :H , 02
11 :H に対し,
棄却域: 5440501515970 ..;,F.VVF eR
となり有意である.また,高次効果は,
仮 説: 02
0 r:H , 02
1 r:H に対し,
棄却域: 2930501534730 ..;,F.VVF elof
となり有意となった.
すなわち,表 19.11のデータに対して回帰直線は有意であるが,回帰直線のみなら
ず当てはまりの悪さ(高次回帰 lof )有意であり,2次以上を持つ回帰曲線の推定が
必要であることを意味している.
(2)回帰直線の推定
回帰係数 0610
601 .
S
Sˆ
xx
xy
切片 768020678010 ....xˆyˆ
ただし, 78020
1614.
N
Ty , 02
20
401 .N
xn
x
l
i
ii
よって,推定される回帰直線は,
単回帰第 1モデル iii x..xˆˆˆ 0676810
または,単回帰第 2モデル 0206780 10 .x..xxˆ'ˆˆiii
と推定される.
【蛇足2】
本例題2を作成した Original Soft「CROManalysis302.zip」を解凍し,インストール後
「直交多項式 Ver3.02」を利用した解析結果の画面を図 19.8~図 19.12に示す.
-323-
図 19.8 直交多項式 Ver3.02解析結果
図 19.9 直交多項式 Ver3.02解析結果
直交多項式による解析では,因子 Aの水準は 5 水準あり xについては 4 次まで分解可能
であり,その分散分析の結果は図 19.9 である.3 次以上の高次回帰は有意と判定されない
のでプーリングすると図 19.10の結果を得る.
-325-
直交多項式の解析で推定される回帰曲線は図 19.11より直交回帰係数を用いると,
直交多項式モデル
22
2
21012
1c
axxbxxbbˆ
iii ただし,a:水準数,c:水準間隔
2
2
22
2
428611714451699928
530442861101206780
5012
15024286110206780
ii
iii
ii
x.x..
.x.x..x..
..x..x..
また,図 19.11より回帰係数を用いると,
曲線回帰モデル
2
210 iii xˆxˆˆˆ 2428611714351728 ii x.x..
となる.回帰曲線は図 19.12 となり,特性を最大とする条件は水準の指定値 262.x のと
き,点推定値 87.2018,信頼上限 91.8402,信頼下限 82.5634と推定される.
図 19.12 直交多項式 Ver3.02解析結果
-326-
【蛇足3】
本例題2を作成した Original Soft「CROManalysis302.zip」を解凍し,インストール後
「重回帰分析 Ver3.02」を利用した解析結果の画面を図 19.13~図 19.15に示す.
重回帰では,重回帰モデルを, 2
210 iii xx
と表し,分散分析の結果,図 19.13 より回帰による効果は有意となり,偏回帰係数は 0 ,
1 ,2 の推定値は図 19.14より,
2428611714351728 iii x.x..ˆ
と推定される.また, 000 :H の仮説検定では有意であり,それぞれ偏回帰係数1 ,
2
の 95%信頼限界は,
1 :信頼上限 81.9431,信頼下限 21.4854
2 :信頼上限 -3.9527,信頼下限 -18.9045
であることがわかる.
図 19.13 重回帰分析 Ver3.02解析結果
-328-
例題 2 の表 19.11 データ表の散布図を図 19.16 に示す.散布図を検討することにより回
帰直線の当てはめが妥当か?回帰曲線の当てはめが妥当か?グラフからの解釈も含めて判
断することが望ましい.
図 19.16 例題 2のデータの散布図
また,回帰直線および回帰曲線が技術的に理論式に合致するかなど回帰係数の検定,推定
も検討が可能である.QCツールの七つ道具にグラフ(総称)があるデータの見える化も不
可欠である.
-329-
第19章 Excel演習問題
【問題 19-1】
ある建設(株)では,コンクリートの圧縮強度を確保するために添加剤を使用している.こ
の添加剤 Aの添加量 xと圧縮強度 y との間には次の直線関係があることがわかっている.
x..y 2611230 (ただし, 3010 x )
先般,コスト低減に寄与する添加剤が開発された.この添加剤の効果を把握するため新添
加剤の添加量を従来の水準範囲 5 水準で変化させ繰返し 4 回計 5×4=20回の実験をランダ
ムに実施し圧縮強度のデータを得た.表 19-1-1 にデータ表を示す.データは数値変換して
あり単位は省略してある.
表 19-1.1 圧縮強度のデータ表(単位省略)
因子 1A 2A 3A
4A 5A
水準値 ix 10 15 20 25 30
238 248 261 266 271
データ特性 240 244 256 270 278
ijy 246 252 252 260 274
245 251 263 262 268
次の設問に答えよ.
(1)測定データより散布図および従来の回帰直線を描き考察せよ.
(2)圧縮強度 y は,添加剤の添加量 xと直線関係にあるかを有意水準 5%で検定し,新し
い回帰直線を推定せよ.
(3)従来の回帰直線は,新しい回帰直線とそれぞれの回帰母数が異なるかを有意水準5%
で検定せよ.また,それらの回帰母数の信頼率 95%信頼限界を求めよ.
(4)新しい回帰直線を用いて, 10ix (キザミ 2)30における特性 i の推定値および信頼
率 95%信頼限界を求めよ.
参 考 文 献
1) 新編日科技連:数値表-第 2版-,日科技連出版社(2012)
2) 安藤貞一,朝尾正編:実験計画法演習,日科技連出版社(1985)
3) 安藤貞一,松村嘉高著:技術者のための統計的品質管理入門,共立出版株式会社
(1981)
4) 安藤貞一監修,朝尾正,二見良治,坂元保秀著:ザ・SQCメソッドによる統計的
方法の実践Ⅱ-実験計画法編-,共立出版株式会社(1996)
5) 安藤貞一,田坂誠男著:実験計画法入門,日科技連出版社(1986)
6) 二見良治,西敏明著:課題解決のための実験計画法Ⅰ,Ⅱ,日科技連出版社(2001)
7) 朝木善次郎著:実験計画法,共立出版株式会社(1983)
8) 朝尾正,安藤貞一,楠正,中村恒夫著:最新実験計画法,日科技連出版社(1973)
9) 石川馨,中里博明,松本洋,伊東静男著:改訂版初等実験計画法テキスト,日科
技連出版社(1979)
Excel プログラムシートの Sample DATA は,以上の参考文献の例題等のデータを
利用させていただきました.
10) 統計数値表編集員会編:簡約統計数値表,日本規格協会(1977)
11) 日科技連QCリサーチ・グループ編:統計理論,日科技連出版社(1969)
12) 近藤良夫,舟阪渡共編:技術者のための統計的方法,共立出版株式会社(1967)
13) 小西省三著:例解演習実験計画法,日刊工業新聞社(1969)
14) 田口玄一著:最新実験計画法-上・下-,丸善株式会社(1962)
15) 福田次郎著:例解演習応用統計入門,日刊工業新聞社(1968)
16) 石川馨,米山高範著:分散分析法入門,日科技連出版社(1979)
17) 永田靖著:入門統計解析法,日科技連出版社(1992)
18) 安部季夫著:直交表実験計画法,日科技連出版社(1993)
19) 楠正,辻谷将明,松本哲夫,和田武夫著:応用実験計画法,日科技連出版社(1995)
20) 中里博明,川崎浩二郎,平栗昇,大滝厚著:品質管理のための実験計画法テキス
ト,日科技連出版社(1996)
21) 永田靖著:統計的方法のしくみ,日科技連出版社(1996)
22) 安藤貞一監修,朝尾正,二見良治,坂元保秀著:ザ・SQCメソッドによる統計的
方法の実践Ⅰ-QC七つ道具編-,共立出版株式会社(1996)
23) 近藤良夫,安藤貞一編:統計的方法百問百答,日科技連出版社(1970)
24) 富士ゼロックス(株)QC研究会編:実験計画法問答集,日本規格協会(1989)
25) 松本哲夫監修:実験計画法 100問 100答,日科技連出版社(2013)