計数値の分散分析(ロジット変換法) · 17.4...

66
267第17章 計数値の分散分析(ロジット変換法) 本章では,二項分布に従う特性値による実験計画法について述べる.二項分布は,計数値 に対する分析法であり,実験計画法で述べた諸手法は計量値を扱っており本章の分散分析 では特性値を連続量として変換が必要になる.二項分布に従う特性について,一般的に利用 される製品の不良に関する特性として二元配置法の実験について述べる. 17.1 二項分布に従う特性 母不良率 P である母集団からサンプル n 個抽出し,その中 x 個の不良品が存在する確率 分布は二項分布に従う.その確率分布は, 確率分布: x n r x n P P C x Pr 1 ただし, n , , , , , x 3 2 1 0 ! x n ! x ! n C x n ただし 1 0 1 2 3 1 ! n n ! n 期待値: nP x E 分 散: P nP x Var 1 と定義される.また,母集団からサンプル n 個の製品を抽出し,その中に x 個の不良品が存 在するとき,統計量である試料不良率 p を考えると, 試料不良率: n x p 期待値: P n x E p E 分 散: n P P n x Var p Var 1 となる.例えば, (1)従来製造工程を用いて製品の添加剤 A の変更による不良品の発生は従来と異なるか どうか?または,設備変更による不良品の発生は従来と異なるかどうか? (2)製品を2ラインで製造しているが,この2ラインでの不良品の発生は異なると言える かどうか? (3)従来製造工程を用いて複数の添加剤購入先 4 3 2 1 A , A , A , A 変更による不良品の発生は 従来と異なるかどうか?または,複数ラインの製造による不良品の発生はラインによ って異なるかどうか? など,計数値を扱う利用の場は多数存在する.上記(1)の場合,仮説 0 0 P P : H ( 0 P 来値)として母不良率に関する検定,(2)の場合,仮説 ライン ライン 2 1 0 P P : H として母不良 率の差に関する検定,(3)の場合,仮説 4 3 2 1 0 A A A A P P P P : H または製造ラインについ て分割表を用いる検定等で分析可能である. また,その分析では,直接確率計算による方法,あるいは連続修正を利用した正規分布近 似法が知られている. 17.2 二項分布の正規分布近似法 二項分布に従う変数が近似条件を満たせば,連続分布と考え正規分布近似法を用いて解 析を行うことができるので実験計画法でも応用が可能となる.母集団から得られた計数値 データを用いて, 1 5 0 n . x * p ( 17.1 ) ( 17.2 ) ( 17.3 ) ( 17.4 ) ( 17.6 ) ( 17.7 ) ( 17.5 ) ( 17.8 )

Upload: others

Post on 13-Feb-2020

7 views

Category:

Documents


0 download

TRANSCRIPT

-267-

第17章 計数値の分散分析(ロジット変換法)

本章では,二項分布に従う特性値による実験計画法について述べる.二項分布は,計数値

に対する分析法であり,実験計画法で述べた諸手法は計量値を扱っており本章の分散分析

では特性値を連続量として変換が必要になる.二項分布に従う特性について,一般的に利用

される製品の不良に関する特性として二元配置法の実験について述べる.

17.1 二項分布に従う特性

母不良率 P である母集団からサンプルn個抽出し,その中 x個の不良品が存在する確率分布は二項分布に従う.その確率分布は,

確率分布: xnr

xn PPCxPr

1 ただし, n,,,,,x 3210

!xn!x

!nCxn

ただし

10

1231

!

nn!n

期待値: nPxE

分 散: PnPxVar 1

と定義される.また,母集団からサンプルn個の製品を抽出し,その中に x個の不良品が存在するとき,統計量である試料不良率 p を考えると,

試料不良率:n

xp

期待値: Pn

xEpE

分 散:

n

PP

n

xVarpVar

1

となる.例えば,

(1)従来製造工程を用いて製品の添加剤 Aの変更による不良品の発生は従来と異なるか

どうか?または,設備変更による不良品の発生は従来と異なるかどうか?

(2)製品を2ラインで製造しているが,この2ラインでの不良品の発生は異なると言える

かどうか?

(3)従来製造工程を用いて複数の添加剤購入先 4321 A,A,A,A 変更による不良品の発生は

従来と異なるかどうか?または,複数ラインの製造による不良品の発生はラインによ

って異なるかどうか?

など,計数値を扱う利用の場は多数存在する.上記(1)の場合,仮説 00 PP:H ( 0P 従

来値)として母不良率に関する検定,(2)の場合,仮説 ラインライン 210 PP:H として母不良

率の差に関する検定,(3)の場合,仮説43210 AAAA PPPP:H または製造ラインについ

て分割表を用いる検定等で分析可能である.

また,その分析では,直接確率計算による方法,あるいは連続修正を利用した正規分布近

似法が知られている.

17.2 二項分布の正規分布近似法

二項分布に従う変数が近似条件を満たせば,連続分布と考え正規分布近似法を用いて解

析を行うことができるので実験計画法でも応用が可能となる.母集団から得られた計数値

データを用いて,

1

50

n

.x*p

( 17.1 )

( 17.2 )

( 17.3 )

( 17.4 )

( 17.6 )

( 17.7 )

( 17.5 )

( 17.8 )

-268-

の分布修正を行い解析に用いる.式(17.8)を連続修正と呼び,その代表的な近似法を表 17.1

に示す.

表 17.1 二項分布の代表的な正規分布近似法

近似法 統計量 統計量の期待値 分 散

直接

正規分布近似法 *p P

n

PP 1

逆正弦変換による

正規分布近似法 *psin 1

( rad 単位) Psin 1

n4

1

ロジット変換による

正規分布近似法

*p

*pln*pL

1 PL

PnP 1

1

17.3 ロジット変換法による正規分布近似法とは

ロジット変換(Logit変換)とは,不良率の比較など直接正規分布近似法より精度よく求

めるための近似法と呼ばれ,少々計算が面倒ではあるがよく利用される近似法である.すな

わち試料不良率に連続修正式(17.8)の値を利用して,表 17.1 に示す不良率のロジット変換

値 *pL の期待値と分散が,

試料不良率のロジット変換値: 50

50

1 .xn

.xln

*p

*pln*pL

期待値: PL*pLE

分 散: PnP

*pLVar

1

1

正規分布近似:

PnP,PLN*pL

1

1~

となり正規分布に近似できることを利用した近似法である.この変換法はロジット変換法

と呼ばれている.

例えば,ある製品をランダムに 200n 個のサンプルを抽出し, 6x 個の不良品が見つ

かったとする.この製品の不良率は 0500 .P より小さいと考えられるかを検討しよう.上

記第 17.1節(1)より検定の帰無仮説 00 PP:H ( 0500 .P )の下で構成すればよいから,

連続修正値 0323401200

506

1

50.

.

n

.x*p

ロジット変換値: 398630323401

032340

1.

.

.ln

*p

*pln*pL

仮説 0H の下における期待値と分散は,

期待値: 944420501

0500 .

.

.lnPL*pLE

分 散:

105300501050200

1

1

1

00

...PnP

*pLVar

となりロジット変換値 *pL は正規分布 10530 94442 .,.N に近似できることになる.よ

って *pL より小さくなる有意確率は,正規分布の基準化より

08080401

10530

94442398630 ..

.

..uuPr

となる.またこの工程における不良率の信頼率 1100 %信頼限界は式(17.10)より,

( 17.10 )

( 17.11 )

( 17.9 )

( 17.12 )

-269-

*p*npu*pL

PL

PL

L

U

1

1

として計算し,

UU

UU

PLe x pPLe x p

PLe x pP

1

1

1

LL

LL

PLe x pPLe x p

PLe x pP

1

1

1

と求める.式(17.14)(17.15)はロジット変換の逆変換と呼ばれている.上記の例で信頼率

95%信頼限界を求めると,

18204

615223132039863

0323401032340200

960139863

1

1050

.

...

..

..

*p*np.u*pL

PL

PL

L

U

よりロジット変換値を逆変換して,

068170

615221

1

1

1.

.expPLexpP

U

U

015040

182041

1

1

1.

.expPLexpP

L

L

と求めることができる.このロジット変換を利用し特性を計数値とした二元配置法におけ

る実験に応用する.

17.4 ロジット変換法による分散分析

一元配置型の解析については第 17.1 節(1)(2)(3)について検討すればよく,本節では二つ

の因子を取り上げ特性が計数値による二元配置法によるロジット変換法を利用した実験の

解析法を述べる.

17.4.1 実験データ表とデータの構造式

一般に,不良個数についての計数値データを得るものとし,因子 Aを l水準,因子Bをm

水準指定し,水準の組合せ lm回の実験を実施し,ランダムに製品サンプル ijn 個抽出し,不

良個数データ ijx が得られたときデータ表は表 17.2となる.

得られた不良個数のデータから式(17.8)の連続修正を行い,

1

50

ij

ij

ijn

.x*p m,,,j,l,,,i 21 21

ロジット変換法を利用して,

50

50

1 .xn

.xln

*p

*pln*pLL

ijij

ij

ij

ij

ijij

を計算する.変換を実施した値を表 17.3 の上段に,また,下段に後述する誤差分散を求め

るために次式,

*p*pnˆ

ijijijij

1

12

( 17.14 )

( 17.15 )

( 17.13 )

( 17.16 )

( 17.17 )

( 17.18 )

-270-

の計算値を求めておくと便利である.

表 17.2 サンプル ijn 個と不良個数データ ijx の実験データ表

因子 1A 2A lA

1B 11n

21n 1ln

11x 21x 1lx

2B 12n

22n 2ln

12x 22x 2lx

ijn

ijx

mB mn1 mn2 lmn

mx1 mx2 lmx

表 17.3 実験データのロジット変換値表

上段: *pLL ijij 下段: *p*pn

ˆijijij

ij

1

12

因子 1A 2A lA 合計 平均値

1B 11L

21L 1lL 1L

1L

211

212 2

1l 21

2B 12L

22L 2lL 2L

2L

212

222

22l

22

ijL

2ij

mB mL1 mL2 lmL mL

mL

21m

22m

2lm

2m

ˆ

合計 1L 2L lL

L

21

22

2l

2

平均値 1L 2L lL L

よって表 17.3のロジット変換表は,繰返しがない場合の二元配置法のデータ表となるが,

解析法としては交互作用効果 BA も検討ができる特徴があり,誤差に関しては等分散性が

仮定できないことである.

表 17.3のロジット変換を利用した実験のデータの構造式は,

ijjiij baL li ,,2,1 mj ,,2,1

ただし, 01

l

i

ia 01

m

j

jb 011

m

j

ij

l

i

ij abab

20 ijij ,N ~ ,ただし ijijij

ijPPn

1

12

となる.

( 17.19 )

( 17.20 )

-271-

17.4.2 平方和と自由度

繰返しのない二元配置法による実験データの解析法を利用して,平方和と自由度は,実験

データの総平均値を,

総平均値

LN

LN

Ll

i

m

j

ij

11

1 1

ただし, lmN

で求められる.また,平方和の計算には,

修正項 21 L

NCT

AB間平方和( AB間変動) CTLSl

i

m

j

ijAB 1 1

2

A間平方和( A間変動) CTm

LS

l

i

iA

1

2

1 lA

B間平方和( B間変動) CTl

LS

m

j

j

B

1

2

1mB

BA 交互作用 BAABBA SSSS

11 mlBABA

誤差分散(誤差変動)については,式(17.20)より等分散性の仮定がなく組合せ ji BA で

分散は異なる.よって,各組合せ ji BA での分散の推定値の平均で考えることになる.例え

ば,組合せ ji BA での分散の推定値は,連続修正値を利用して式(17.18)となり,

誤差分散(誤差変動)

l

i

m

j

ij

l

i

m

j ijijij

lm*p*pnlmV

1 1

2

1 1

1

1

11

ただし, E

と求める.

17.4.3 分散分析表と検定

計数値による実験で特性のロジット変換後の分散分析表を表 17.4に示す.

表 17.4 分散分析表

要因 平方和 自由度 平均平方 0F smE ..

A AS 1 lA AAA SV EA VV 22AE m

B BS 1 mB BBB SV EB VV 22BE l

BA BAS 11 mlBA BBABA SV EBA VV 22BAE

E - E EV 2E

要因 Aおよび B の効果および交互作用 BA についての検定は,二元配置法の実験と同

様である.ただし,誤差の自由度 E であることに注意して検定すればよい.

例えば,因子 Aについては,

仮説: 0 0 2

1

2

0 AA :H:H (有意水準を %5 )

検定統計量:E

A

V

VF 0

棄却域: 0500 .;,FVVF AEA

による判断を行えばよい.

( 17.22 )

( 17.21 )

( 17.23 )

( 17.24 )

( 17.25 )

( 17.26 )

( 17.27 )

( 17.28 )

( 17.29 )

( 17.30 )

-272-

17.5 最適条件の決定と母不良率の推定

最適条件の決定および母不良率の推定についての考え方は,交互作用 BA の有意性に関

わらずプーリングはしない.よって,推定では交互作用 BA が無視できる場合と無視でな

い場合に分けて母不良率の推定を実施すればよい.

17.5.1 交互作用を無視する場合

推定に用いるデータの構造式を

データの構造式: ijjiij baL

と考えると,

(1)最適条件の決定

データの構造式 jiBA における母不良率の点推定値は式(17.31)より

LLLˆbabaBAL jijijiji

となる.すなわち,母不良率の最適水準は,各因子のロジット変換値の平均値が最小と

なる水準を指定し qpBA 水準とすればよい.

(2)最適条件における母不良率の推定

最適条件を qpBA 水準としたとき,母不良率の推定を行う.

a)最適条件における点推定

式(17.32)より,ロジット変換での点推定値は,

LLLBAL qpqp

となる.よって式(17.33)の母不良率の点推定値は,ロジット変換の逆変換を用いて,

qpqp

qp

qpBALexpBALexp

BALexpBAP

1

1

1

となる.

b)最適条件における信頼限界

不良率の区間推定は,信頼率を %1100 とすれば,最適条件 qpBA における母不

良率の信頼上限および信頼下限を UqpBAP ,

LqpBAP は次式で与えられる.

まず,ロジット変換値での信頼限界を求める.

qpqp

Lqp

Uqp

BALarVuBALBAL

BAL

ただし,分散の推定値は,

2

1

2

1

2

1 1

2 22211

pq

m

j

pj

l

i

iq

l

i

m

j

ijqpˆˆ

m

l

lmlmBALarV

として計算し,信頼限界を式(17.35)で求めロジット変換の逆変換を施して信頼限界を

求める.

UqpUqp

Uqp

UqpBALexpBALexp

BALexpBAP

1

1

1

LqpLqp

Lqp

LqpBALexpBALexp

BALexpBAP

1

1

1

( 17.31 )

( 17.32 )

( 17.33 )

( 17.34 )

( 17.37 )

( 17.38 )

( 17.35 )

( 17.36 )

-273-

17.5.2 交互作用を無視しない場合

推定に用いるデータの構造式を

データの構造式: ijijjiij abbaL

と考えると,

(1)最適条件の決定

データの構造式 jiBA における母不良率の点推定値は式(17.39)より

ijijjiji LabbaBAL

となる.すなわち,母不良率の最適水準は,因子の組合せのロジット変換値が最小とな

る水準を指定し qpBA 水準とすればよい.

(2)最適条件における母不良率の推定

最適条件を qpBA 水準としたとき,母不良率の推定を行う.

a)最適条件における点推定

式(17.40)より,ロジット変換での点推定値は,

pqqp LBAL

となる.よって式(17.41)の母不良率の点推定値は,ロジット変換の逆変換を用いて,

qpqp

qp

qpBALexpBALexp

BALexpBAP

1

1

1

となる.

b)最適条件における信頼限界

不良率の区間推定は,信頼率を %1100 とすれば,最適条件 qpBA における母不

良率の信頼上限および信頼下限を UqpBAP ,

LqpBAP は次式で与えられる.

まず,ロジット変換値での信頼限界を求める.

qpqp

Lqp

Uqp

BALarVuBALBAL

BAL

ただし,分散の推定値は,

2

pqqpˆBALarV

である.

として計算し,逆変換して信頼限界を求める.

UqpUqp

Uqp

UqpBALexpBALexp

BALexpBAP

1

1

1

LqpLqp

Lqp

LqpBALexpBALexp

BALexpBAP

1

1

1

17.6 例題

ある樹脂工業(株)では,飲料用のペットボトルの改良を行っている.現在,飲料用ボトル

は冷時充填法であるが,一部熱時充填法に耐えうるペットボトルを検討中である.

そこで検討の取り組みとしてペットボトルの成形材料 Aを 4 水準,熱処理条件B を 3 水

準取上げて計 12回のランダム実験で各 200本ずつボトルを成形し,熱時充填後のボトル口

部の変形による不良を全数検査して表 17.5のデータを得た.

( 17.39 )

( 17.40 )

( 17.41 )

( 17.42 )

( 17.37 )

( 17.38 )

( 17.43 )

( 17.44 )

-274-

次の設問に答えよ.

(1)分散分析を行い有意水準 5%で成形材料 Aと熱処理条件B について効果を検定

せよ.

(2)不良率を最小とする最適条件を定め,その条件における母不良率の点推定値と

信頼率 95%信頼限界を求めよ.

表 17.5 サンプル ijn 個と不良個数データ ijx の実験データ表

因子 1A 2A 3A

4A

1B ijn 200 200 200 200

ijx 20 16 10 29

2B ijn 200 200 200 200

ijx 10 12 5 11

3B ijn 200 200 200 200

ijx 18 10 7 21

表 17.6 実験データのロジット変換値表

上段: *pLL ijij 下段: *p*pn

ˆijijij

ij

1

12

因子 1A 2A 3A

4A 合計 jL

2j

ˆ

平均値 jL

1B -2.1753 -2.4143 -2.8983 -1.7602 -9.2481 -2.31203

0.05459 0.06636 0.10099 0.03993 0.26187

2B -2.8983 -2.7134 -3.5708 -2.8020 -11.9845 -2.99613

0.10099 0.08573 0.18787 0.09269 0.46728

3B -2.2890 -2.8983 -3.2504 -2.1221 -10.5598 -2.63995

0.05983 0.10099 0.13919 0.05234 0.35235

合計 iL

2i

-7.3626 -8.0260 -9.7195 -6.6843 -31.7924

0.21541 0.25308 0.42805 0.18496 1.08150

平均値 iL -2.45420 -

2.67533

-

3.23983

-

2.22810 -2.64937

(1)分散分析による要因の検定

手順 1.データの構造

ijjiij baL 4321 ,,,i 321 ,,j 1234 lmN

ただし, 04

1

i

ia 03

1

j

jb 03

1

4

1

j

ij

i

ij abab

20 ijij ,N ~ ,ただし ijijij

ijPPn

1

12

手順2.平方和と自由度の計算

総平均値 64937279243112

11

1 1

..LN

Ll

i

m

j

ij

平方和の計算には,

修正項 229728479243112

11 22 ..LN

CT

-275-

AB間平方和( AB間変動) CTLSl

i

m

j

ijAB 1 1

2

9021222972841317987

2297284122128983217532222

...

....

A間平方和( A間変動) CTm

LS

l

i

iA

1

2

2297284

68436

719590260836267

3

12

222

..

...

6946122972849243785 ... 31 lA

B間平方和( B間変動) CTl

LS

m

j

j

B

1

2

2297284559810984511248194

1 222....

9365022972841662485 ... 21mB

BA 交互作用 BAABBA SSSS

27100936506946190212 ....

62311 mlBABA

誤差分散(誤差変動)は式(17.27)より表 17.6を用いて,

l

i

m

j

ij

l

i

m

j ijijij

lm*p*pnlmV

1 1

2

1 1

1

1

11

09013008150134

1..

E

となる.

手順3.分散分析表の作成

それぞれ計算した要因の平方和と自由度から分散分析表を作成し,平均平方および

検定のための統計量 0F を求める.

表 17.7 分散分析表

要因 平方和 自由度 平均平方 0F smE ..

A 1.6946 3 0.5649 6.27** 22 3 AE

B 0.9365 2 0.4683 5.20** 22 4 BE

BA 0.2710 6 0.0452 0.50 22

BAE

E - ∞ 0.0901 2E

6020503 ..;,F 0030502 ..;,F 1020506 ..;,F

7830103 ..;,F 6140102 ..;,F 8020106 ..;,F

各要因の判定の結果,主効果 Aおよび Bは有意となり,成形材料と熱処理条件につ

いては効果が認められた.交互作用 BA は無視できることがわかった.

(2)最適条件の決定と母不良率の推定

手順4.最適条件の決定

検定の結果から,交互作用 BA は無視できることがわかったので,母不良率の推定

に用いるデータの構造式を

-276-

データの構造式: ijjiij baL

と考えて,最適水準を求めると,それぞれ因子 Aおよび Bのロジット変換値の最小水

準は表 17.6より 3A および2B 水準となる.

手順5.最適条件における母不良率の点推定

母不良率の最適水準 23BA における点推定値は式(17.32)から,

586593

649372996132239833 23

232323

.

...LLL

ˆbabaBAL

となる.よって,式(17.34)よりロジット変換の逆変換を用いて母不良率の点推定値は,

026950

5865931

1

1

1

1 2323

2323

..exp

BALexpBALexp

BALexpBAP

となる.

手順6.最適条件における母不良率の信頼率 95%区間推定

不良率の信頼率を %95 区間推定は,最適条件 23BA における母不良率の信頼上限お

よび信頼下限を U

BAP 23,

LBAP 23

とすれば,式(17.36)より分散の推定値は表 17.6

を利用して,

2

32

3

1

2

3

4

1

2

2

4

1

3

1

2

23 23

24

4

23

34

1

34

1 ˆˆˆBALarV

j

j

i

i

i j

ij

072340

18787024280503

2467280

4

1081501

12

1

12

1

.

....

となり,式’17.35)よりロジット変換値での信頼限界は,

2323

23

23050 BALarV.uBAL

BAL

BAL

L

U

113754

059433

5271605865930723409601586593

.

.

.....

として計算し,逆変換して信頼限界を求める.

UU

U

UBALexpBALexp

BALexpBAP

2323

23

231

1

1

044800594331

1.

.exp

LL

LL

BALexpBALexp

BALexpBAP

2323

2323

1

1

1

016101137541

1.

.exp

となる.

-277-

【蛇足】本例題において交互作用 BA を無視しないときの推定

(1)点推定

5708332322323 .LabbaBAL

となる.よって,ロジット変換の逆変換を用いて母不良率の点推定値は,

027360570831

1

1

1

23

23 ..expBALexp

BAP

(2)母不良率の信頼率 95%区間推定

2

32232323

23

23050050 .uBALBALarV.uBAL

BAL

BAL

L

U

8495057083187870960157083 .....

42034

72132

.

.

逆変換して信頼限界を求めると,

061730721321

123 .

.expBAP

U

011890420341

123 .

.expBAP

L

となる.

【参考1】式(17.8)より式(17.9)への導出について

1

50

n

.x*p を代入して

50

50

1

5011

50

1

501

1

50

1 .xn

.xln

n

.xnn

.x

ln

n

.xn

.x

ln*p

*pln*pL

【参考2】式(17.36)の導出について

データの構造式から

ijjiij baL l,,,i 21 m,,,j 21

20 ijij ,N ~ ただし ijijij

ijPPn

1

12

と定義する.因子 A ( l水準),B ( m 水準)とし最適条件を qpBA 水準としたとき,ロジット変

換値の点推定値は qpBAL である.点推定値の分散は,誤差の仮定から等分散性が仮定され

ないので組合せ jiBA での分散 2ij を推定し用いる.

表 17.8

1A pA 3A 4A 計

1B 211

21p 2

31 241

21

2B 212

22p 2

32 242

22

qB 21q

2pq

23q

24q 2

3

計 21

22

23

24

2

今 A (4水準), B (3水準)のとき表 17.8として点推定値の分散を求めると,

-278-

l

i

m

j

ij

l

i

iq

m

j

pj

qpqpqp

lmlmVar

VarLLLVarBALVar

1 1

2

1

2

1

2

222

111

となる.ただし各水準は l,m 水準としてある.

24

23

221

242

232

22

212

241

231

21

211

24

23

22

21

23

22

21

1

11

qqpqq

p

p

qqqqppp

qp

lm

lm

VarBALVar

2

24

23

21

242

232

22

212

241

231

21

211

111

1111

11

11111

11111

pq

qqq

p

p

lmlm

lmllmllml

lmlmlmmlm

lmlmlmmlm

Var

2

2

24

2

23

2

21

2

242

2

232

2

22

2

212

2

241

2

231

2

21

2

211

2

111

1111

11

11111

11111

pq

qqq

p

p

lmlm

lmllmllml

lmlmlmmlm

lmlmlmmlm

上式の係数は

222222

2222112111

ml

ll

mlml

ll

lm

l

lmm

222222

2222112111

ml

mm

mlml

mm

lm

m

lml

2

2211222111122222222

2222

ml

mm

ml

ll

mlml

mllmml

lm

ml

lmlm

となり,

2

24

23

21

242

232

22

212

241

231

21

211

2221

2121

21

11211

11211

1

pq

qqq

p

p

lm

mm

lm

ll

lm

lm

mm

lmlm

mm

lmlm

mm

lm

lmlmlm

ll

lmlm

lmlmlm

ll

lmlm

lm

-279-

2

24

23

221

222

21

24

23

221

242

232

22

212

241

231

21

211

2

2222

222

1111

1111

1111

1

pq

qqpqq

pqpp

qqpqq

p

p

l

m

l

m

l

m

l

m

m

l

m

l

m

l

lmlmlmlm

lmlmlmlm

lmlmlmlm

lm

よって,一般形として

2

1

2

1

2

1 1

22 22211

pq

m

j

pj

l

i

iq

l

i

m

j

ijqpm

l

l

m

lmlmBAVar

が成り立つ.最適条件の分散の推定値は,上式右辺に 2ij 値を代入し求めればよい.

-280-

第17章 Excel 演習問題

【問題 17-1】

某プラスティック化成(株)では,プラスティック製の植木鉢を射出成型機で製造している

が,従来,使用している原料樹脂に加えてコスト低減を目標に新原料樹脂に変更し最適な成

形条件を検討している.

そこで,成形条件である樹脂温度 Aを 3 水準,射出圧力Bを 3 水準取上げてランダムに

各組合せ条件下で 200 個ずつ成形し,専門員による外観検査によって不良個数を選別して

表 17.1-1に示すデータを得た.

表 17.1-1 サンプル ijn 個と不良個数データ ijx の実験データ表

因子 1A 2A 3A

1B ijn 200 200 200

ijx 18 13 28

2B ijn 200 200 200

ijx 14 10 21

3B ijn 200 200 200

ijx 22 21 26

次の設問に答えよ.

(1)分散分析を行い有意水準 5%で樹脂温度 Aと射出圧力Bについて効果を検定し,

考察せよ.

(2)不良率を最小とする最適条件を定め,その条件における母不良率の点推定値と

信頼率 95%信頼限界を求めよ.

-281-

第18章 単回帰分析(繰返しなし)

一般に,原因(要因)系に対して結果(特性)系への関係について把握し改善に役立てる

場合,結果系のみの関係から要因探索に寄与させる場合がある.本章では,変数 xと y との

関数関係式(回帰式)を推測し検討する方法について述べる.また,実験する変数 xが 1個

で特性との対のデータから関数関係を推測する方法を単回帰分析と呼んでいる.

18.1 回帰分析とは

回帰分析とは,図 18.1の特性要因図に示す原因と結果および図 18.2の結果と結果の関係

を定量的に,xに対する y の関数を用いて分析する統計的手法である.取り上げた xと y を

図 18.1 原因 xと結果 y の関係 図 18.2 結果 xと結果 y の関係

変数と呼び,それぞれが 1 個の場合を単回帰分析,変数 xを 2 個以上取り上げて関係を把

握する手法を重回帰分析と呼んでいる(重回帰分析については「Excelで学ぶ多変量データ

処理入門」を参照).原因系とする変数 xを説明変数( independent variable )または独立変

数,結果とする変数 y を目的変数( response variable )または従属変数と言い,目的変数に

対して説明変数が px,,x,x 21 であるとき,想定されるモデルを,

px,,x,xfy 21 ただし, f : px,,x,x 21 の関数関係,:誤差

として関数関係 f を把握する統計的手法を回帰分析と呼んでいる.

18.2 単回帰モデル

関数関係式(18.1)の f が 1次式で表されるとき,

ppxxxyE 22110

のモデルを重回帰モデルといい,このモデル式(18.2)で説明変数が 1個( 1p )の場合,

110 xyE

のモデルを単回帰モデルという.表 18.1 は繰返しがない場合の単回帰分析におけるデータ

表である.xと y の対のデータ y,x をn個収集したデータで 2x ,2y および xy欄は後述す

る統計量を求めるのに必要となり補助表として示している.2つの変数間の関係を知る一つ

表 18.1 繰返しのない単回帰分析よるデータ表

サンプル x y 2x 2y xy

1 1x 1y 2

1x 2

1y 11yx

2 2x 2y 2

2x 2

2y 22 yx

3 3x 3y 2

3x 2

3y 33 yx

i ix iy 2

ix 2

iy ii yx

n nx ny 2

nx 2

ny nn yx

合計

n

i

ix1

n

i

iy1

n

i

ix1

2

n

i

iy1

2

n

i

ii yx1

要因

特性 特性 と特性

( 18.1 )

( 18.2 )

( 18.3 )

-282-

に QC 七つ道具に散布図があり,変数間の関係の強さを把握する方法として相関分析があ

る.相関分析は,2変数が2次元の正規分布に従っていることが仮定されるのに対し,単回

帰分析では,説明変数 xを指定したとき目的変数 y の推定を図るのが目的であり,単回帰モ

デルである式(18.3)は,相関分析を含むことになる.

単回帰モデルにおけるデータの構造式は, n,,,ixi 21 に対する iy の母平均を i とす

ると,

iiiii xy 10

となる.説明変数 ix ,目的変数 iy は観測値であり, i は誤差である.また 0 , 1 は未知

の定数であり 0 を切片, 1 を回帰係数( regression coefficient )と呼び,併せて 0 , 1 を

回帰母数( regression parameter )とも呼ばれる.式(18.4)の誤差 i に関する条件として次の

四つの仮定がおかれる.

(1) 不偏性 0iE

(2) 等分散性 2 iVar

(3) 正規性 i は正規分布に従う

(4) 独立性 0ji ,C o v , ji

これらの条件の下で式(18.4)の期待値は,

xyE i 10

となり直線となる.式(18.6)を xに対する y の回帰直線( regression line of y to x )という.

すなわち,単回帰分析では,観測値 x,y より未知の定数である回帰母数を推定し回帰線を

確立することである.単回帰モデルを図示すると図 18.3となる.

図 18.3 単回帰モデル

18.3 回帰母数の推定

データより回帰母数 0 , 1 の推定には最小二乗法( method of least squares )を用いる.

通常,回帰直線の予測値 i は実測値 iy とは一致せず,回帰母数の推定値 0 , 1 を用いて

回帰直線を,

ii xˆˆˆ10

と表せば,実測値と回帰直線の差,すなわち,これを残差( residual )といい ie とすると,

iiiii xˆˆyˆye 10

( 18.4 )

( 18.5 )

( 18.6 )

( 18.7 )

( 18.8 )

iy

ix

x10

x

y

ii x10

iy

i

-283-

となる.最小二乗法とは,この残差の二乗和が最小になるように回帰母数の推定値 0 , 1

を決定する方法である.よって,残差の二乗和を残差平方和( sum of squares residuals )と

いい eS で表すと,

n

i

ii

n

i

ie xˆˆyeS1

2

10

1

2

となる.残差平方和が最小となる推定値 0 , 1 を求めるには,偏微分して 00 Se ,

01 Se となる連立方程式の解となる.故に,

02

02

1

10

1

1

10

0

n

i

iiie

n

i

iie

xˆˆyxˆS

xˆˆyˆS

から,

②  

①    

n

i

ii

n

i

i

n

i

i

n

i

i

n

i

i

yxxˆxˆ

yxˆˆn

11

2

1

1

0

11

10

となる.この連立方程式を正規方程式( normal equation )という.式(18.10)①より,

xˆyn

n

n

i

i

n

i

i

11

11

0

式(18.10)を式(18.10)②に代入して,

n

i

ii

n

i

i

n

i

i yxxˆxxˆy11

2

1

1

1 より,

n

i

i

n

i

ii

n

i

i

n

i

i xyyxxxxˆ

1111

2

1

xx

xy

n

i

in

i

i

n

i

i

n

i

in

i

ii

S

S

n

x

x

n

yx

yxˆ

2

1

1

2

11

11

と求められる.したがって,式(18.11)を回帰直線式(18.7)に代入すると,

xxˆ'ˆxxˆyˆiii 101 ただし, y'ˆ 0

とも変形できる.したがって,式(18.4)における単回帰モデルのデータの構造式は,

モデル単回帰第

モデル単回帰第

2

1

10

10

iii

iii

xx'y

xy

と記述することもできる.単回帰第 1 モデルでは,切片 0 が 0ix のときの iy 値であり取

り上げる変数 xが温度,圧力,寸法など原点における統計量の検討には実用性に乏しい場合

がある.このような場合には,単回帰第 2モデルとして表記しておくと便利である.単回帰

第 2モデルの表記は,回帰直線が変数 xと yの平均値 y,x を通ることも一目瞭然である.

( 18.8 )

( 18.9 )

( 18.10 )

( 18.11 )

( 18.12 )

( 18.13 )

( 18.14 )

-284-

18.4 単回帰分析における平方和の分解

単回帰分析における平方和は,図 18.4 に示すデータ yの全変動を回帰からの残差(残差

変動)と回帰による変動に分解できる.すなわち,総平方和 TS は

n

i

i

n

i

ii

n

i

i

n

i

ii

n

i

iT

yxˆˆxˆˆy

yˆˆyyyS

1

2

10

1

2

10

1

2

1

2

1

2

総平方和 = 残差平方和(回帰からの残差) + 回帰による平方和(回帰による変動)

図 18.4 平方和の分解

となる.回帰による平方和を RS とすると,式(18.15)の右辺第 2項に式(18.11)(18.12)を代入

して,

xx

xxxx

n

i

i

n

i

i

n

i

i

n

i

iR

S

SSˆxxˆ

xxˆyxˆxˆyyxˆˆS

22

1

1

221

1

2

1

1

2

11

1

2

10

となる.また,残差平方和を eS とすると,式(18.15)の右辺第 1項に同様に式(18.11)(18.12)

を代入して,

RT

xx

xxTxxT

n

i

i

n

i

i

n

i

ii

n

i

ii

n

i

iie

SSS

SSSˆSxxˆyy

xxˆyyxˆxˆyyxˆˆyS

22

1

1

221

1

2

1

2

1

1

2

11

1

2

10

となる.平方和を自由度とまとめると,

1

2

1

1

2

2

1

2

10

2

1

2

10

nSyyS

nSSS

SSxˆˆyS

S

SyxˆˆS

Tyy

n

i

iT

eRT

xx

xxT

n

i

iie

R

xx

xxn

i

iR

総平方和:

回帰からの平方和:

回帰による平方和:

となる.

y

y

x ix

iy

yyi

xˆˆˆ10

x

iiˆy

yˆi 回帰による変動

回帰からの残差 全変動

( 18.15 )

( 18.16 )

( 18.17 )

( 18.18 )

-285-

18.5 単回帰分析における分散分析法

単回帰分析では,説明変数 xを指定したとき目的変数 y の推定を図るのが目的であった.

そこで,第 18.3 節で推定された回帰直線の妥当性を分散分析により,統計的に判断するに

は,前節の平方和を利用して,

データの構造式

第 1モデル iii xy 10 20 ,Ni~

第 2モデル iii xx'y 10 20 ,Ni~

平方和と自由度の計算

総平方和(総変動) n

y

yyySS

n

i

in

i

i

n

i

iyyT

2

1

1

2

1

2

1 nT

回帰による平方和(直線回帰)xx

xy

RS

SS

2

1R

ただし, n

yx

yxyyxxS

n

i

i

n

i

in

i

ii

n

i

iixy

11

11

n

x

xxxS

n

i

in

i

i

n

i

ixx

2

1

1

2

1

2

回帰からの平方和(残差変動) RTe SSS 2 nRTe

を求めて分散分析表を作成すると表 18.2になる.

表 18.2 分散分析表

要因 平方和 自由度 平均平方 Fo E.m.s

直線回帰 R xxxyR SSS 2 1R RRR SV eR VV

221

2 xxi

残差 e Ryye SSS 2 ne eee SV 2

合計 T yyT SS 1 nT

よって, xに対する y の回帰直線の判断は,有意水準 5%とすると,

仮 説: 0210 :H , 02

11 :H に対し,

棄却域: 0500 .;,FVVF eReR

として回帰係数による検定を行えばよい.また平方和における比 TR SS は,総変動のうち

回帰直線によって説明される変動の割合を表し寄与率と呼ばれている.すなわち寄与率は,

寄与率:2

222

xy

yyxx

xy

yyxx

xy

yy

xxxy

T

R rSS

S

SS

S

S

SS

S

S

となり, xと y の相関係数の 2乗である.

18.6 回帰母数の検定と推定

得られた回帰直線の回帰母数の推定値における検定および推定については,それぞれの

回帰母数の推定値 1 , 0 は,

( 18.26 )

( 18.27 )

( 18.19 )

( 18.20 )

( 18.21 )

( 18.22 )

( 18.23 )

( 18.24 )

( 18.25 )

-286-

回帰係数:

2

11

1

xxS,Nˆ~ ,切片:

2

2

00

1

xxS

x

n,Nˆ ~

の正規分布に従うことを利用して検討する.

18.6.1 回帰母数に関する検定

回帰直線の傾き,すなわち 01 であるかどうかは,相関分析による無相関の検定に一

致し直線関係が認められるかの統計的な判断である.また,従来の回帰直線が存在しその回

帰係数が 101 ( 10 は検定のための設定値)であるかどうかを統計的に判断する方法で

ある.

(1)仮説ゼロの検定

帰無仮説 010 :H

対立仮説 011 :H (有意水準 050. )

検定統計量は,回帰係数 1 が式(18.28)より正規分布に従っていることを利用して標準化

式 xxSˆu 2

11 の2 が未知であることから推定量 eVˆ 2 で置き換えると t分

布に従うことになる.したがって, xxe SVˆt 11 は自由度 2 ne の t分布に従

う.よって,帰無仮説の下における検定統計量は,

推定値 xx

xy

S

Sˆ 1

検定統計量 xxe SV

ˆt 10

棄却域 05020 .,nt,tt e

となる.

(2)回帰係数 1 の一般的な検定

帰無仮説 1010 :H ( 10 :設定値)

対立仮説 1011 :H (有意水準 050. )

に対しては同様に式(18.30)(18.31)から,帰無仮説の下における検定統計量は,

推定値 xx

xy

S

Sˆ 1

検定統計量 xxe SV

ˆt 1010

棄却域 05020 .,nt,tt e

となる.

(3) 0ix における切片 0 の検定

推定した回帰直線が 0ix のとき切片 000 ( 00 は検定のための設定値)であるかど

うか,または xxi のとき 000 '' ( 00 ' は検定のための設定値)であるかどうかを統計

( 18.28 )

( 18.29 )

( 18.30 )

( 18.31 )

( 18.33 )

( 18.34 )

( 18.32 )

-287-

的に判断する方法である.

帰無仮説 0000 :H ( 00 :設定値)

対立仮説 1001 :H (有意水準 050. )

検定統計量は,回帰係数 0 が式(18.28)より正規分布に従っていることを利用して標準化

式 xxSxnˆu 22

000 1 の2 が未知であることから推定量 eVˆ 2 で置き換

えると t分布に従うことになる.したがって, xxe SxnVˆt 2

000 1 は自由度

2 ne の t分布に従う.よって,帰無仮説の下における検定統計量は,

推定値 xˆyˆ10

検定統計量

e

xx

VS

x

n

ˆt

2

0000

1

棄却域 05020 .,nt,tt e

となる.

(4) xxi における 0 ' の検定

帰無仮説 0000 '':H ( 00 ' :設定値)

対立仮説 0001 '':H (有意水準 050. )

統計量 0 ' は,式(18.13)より y'ˆ 0 であり 0 ' は期待値 x'ˆE 100 および分散

n'ˆVar 2

0 の正規分布に従うことから標準化式 n''u 2

000 の分散の推

定量 eVˆ 2 で置き換えると t分布に従うことになる.したがって, nV''t e000

は自由度 2 ne の t分布に従う.よって,帰無仮説の下における検定統計量は,

推定値 y'ˆ 0

検定統計量

eVn

'yt

1

000

棄却域 05020 .,nt,tt e

となる.

18.6.2 回帰母数に関する区間推定

(1)回帰係数 1 の区間推定

回帰係数の推定値 1 は, xxS,N 2

1 の正規分布に従うことから推定量 eVˆ 2 で置き

換えると xxe SVˆt 11 が自由度 2 ne の t分布に従う.よって,回帰係数 1 の

信頼率 1100 %信頼限界は 050. とすると.

xx

e

xx

ee

S

V.,ntˆ

S

V,tˆ 050211

となる.

( 18.35 )

( 18.36 )

( 18.37 )

( 18.38 )

( 18.39 )

( 18.40 )

( 18.41 )

-288-

(2)切片 0 の区間推定

切片の推定値 0 は, 22

0 1 xxSxn,N の正規分布に従うことから推定量 eVˆ 2 で

置き換えると xxe SxnVˆt 2

00 1 は自由度 2 ne の t分布に従う.よって,

回帰係数 0 の信頼率 1100 %信頼限界は 050. とすると,

e

xx

e

xx

e VS

x

n.,ntˆV

S

x

n,tˆ

2

0

2

0

10502

1

となる.

(3) xxi における 0 ' の区間推定

xxi における推定値 0 ' は, n,'N 2

0 の正規分布に従うことから推定量 eVˆ 2

で置き換えると nV''ˆt e00 は自由度 2 ne の t分布に従う.よって, xxi

における推定値 0 ' の信頼率 1100 %信頼限界は 050. とすると,

eee Vn

.,nt'ˆVn

,t'ˆ1

0502 1

00

となる.

18.7 母回帰直線の区間推定

推定された直線回帰式(18.7)および(18.13)に対し,指定した 0x に対する母回帰式は,

第 1回帰モデル 010 x

第 2回帰モデル xx' 010

であり,その推定値は,

第 1回帰モデル 0100 xˆˆˆ

第 2回帰モデル xxˆ'ˆˆ 0100

で与えられる.式(18.45)はともに正規分布,

2

2

000

1

xxS

xx

n,Nˆ ~

に従う.回帰母数 0 , 1 は式(18.28)よりそれぞれ正規分布に従うことから,式(18.45)の

期待値は,

第 1回帰モデル 00100100100 xxˆEˆExˆˆEˆE

第 2回帰モデル xxˆxˆˆExxˆ'ˆEˆE 01100100

0010010010 xxˆEˆExˆˆE

分散は,

第 1回帰モデル 0100100100 2 xˆ,ˆCovxˆVarˆVarxˆˆVarˆVar

2

2

0202202

2

1001200

12

1

2

xxxxxxxx S

xx

nS

xx

S

x

S

x

n

ˆ,ˆCovxˆVarxˆVar

( 18.42 )

( 18.44 )

( 18.45 )

( 18.46 )

( 18.47 )

( 18.48 )

( 18.43 )

-289-

第 2回帰モデル xxˆ'ˆVarˆVar 0100

0 11

2

1

2

2

02

2

02

101

2

0

0101

ˆ,yCovS

xx

nS

xx

n

ˆ,yCovxxˆVarxxyVar

xxˆ,yCovxxˆVaryVar

xxxx

をもつ正規分布に従うことから,標準化式 22

000 1 xxSxxnˆu の分散

の推定量 eVˆ 2 で置き換えると標準化式 exx VSxxnˆt2

000 1 は自由度

1 ne の t分布に従うことになる.

よって,回帰直線 0 における信頼率 1100 %信頼限界は 050. とすると.

第 1回帰モデル

e

xx

e VS

xx

n,tˆ

2

00

1

e

xx

VS

xx

n.,ntxˆˆ

2

0010

10501

第 2回帰モデル

e

xx

e VS

xx

n,tˆ

2

00

1

e

xx

VS

xx

n.,ntxxˆ'ˆ

2

0010

10501

となる.

信頼限界の幅は, xx 0 のとき最小となり, 0x 値が xから離れることにより大きくなる

ことがわかる.

18.8 個々のデータの予測限界

推定式として得られた回帰直線式(18.45)を利用して,表 18.1に示す個々のデータ y がど

のような値として予測されるかを考えることができる.

0xx のとき推測された回帰直線から予測される目的変数 0y の値は,第 1回帰モデルを

利用すると,

01000 xy 20 ,N~

として予測値は,

xˆˆeˆy 10000

となる.よって,

期待値: ExˆEˆExˆˆEyE 0100100

1 0010 x

分 散: 0100 xˆˆVaryVar

2 2 2 010010

010

,xˆCov,ˆCovxˆ,ˆCov

VarxˆVarˆVar

1001

2

00 2 ˆ,ˆCovxVarˆVarxˆVar

( 18.49 )

( 18.50 )

( 18.51 )

-290-

2

2

0

22

2

02222

0

2

0

2

2

0

222

022

11

12

11

21

xx

xxxx

xxxxxx

S

xx

n

S

xx

nxxxx

Sn

S

xx

S

x

S

x

n

となる.したがって,上記,期待値および分散をもつ正規分布に従うことから,予測値 0y

は標準化式 22

000 11 xxSxxnyyu の分散の推定量 eVˆ 2 で置き換え

ると標準化式 exx VSxxnyyt2

000 11 は自由度 1 ne の t分布に従う

ことになる.

よって, 0xx のとき推定された回帰直線による信頼率 1100 %個々のデータの予測

値 0y の予測限界は 050. とすると.

e

xx

e

xx

e VS

xx

n.,ntxˆˆV

S

xx

n,tˆ

2

0010

2

00

110501

11

となる.

18.9 例題

某社では,電磁弁の構成部品の寸法 xと作動特性 y の関係を調査してきた.その関係は直

線関係にあることは分かっている.そこで,この電磁弁の一部回路の設計を変更したので,

再度,電磁弁をランダムにサンプル 30 個抽出し, xと y を測定して対のデータ表 18.3 を

得た.単位は省略し数値は変換してある.

次の設問に答えよ.

(1)構成部品の寸法 xに対する作動特性 y は直線関係にあるかを検討し,一部回路の設計

変更に対する新しい回帰直線を推定せよ.

(2)従来の直線関係は x..y 54807211 であった.新しい回帰直線と異なるかを有意水

準 5%で検定せよ.また,それぞれの回帰母数の信頼率 95%信頼限界を求めよ.

(3)新しい回帰直線を用いて x 12.5,13.5,14.5,15.5,16.5,17.5,18.5における y

の信頼率 95%信頼限界を求めよ.

(4)データ x,y の散布図を描き,推定された新しい回帰直線,従来の回帰直線および信

頼限界を図示せよ.

本例題は,電磁弁の設計変更により構成部品の寸法 xと作動特性 y の新しい関数関係を

求め,従来の回帰直線と統計的に比較検討することを目的としている.

(1)分散分析と回帰直線の推定

a)平方和と自由度の計算

題意によるデータの構造を式(18.19)または式(18.20)より,

iii xy 10 20 ,Ni~

または, iii xx'y 10 20 ,Ni~

と考える.

( 18.53 )

( 18.52 )

-291-

表 18.3 繰返しのない単回帰分析よるデータ例

サンプル x y 2x 2y xy

1 15.6 7.6 243.36 57.76 118.56

2 13.2 6.0 174.24 36.00 79.20

3 15.8 7.0 249.64 49.00 110.60

4 14.9 6.2 222.01 38.44 92.38

5 16.0 8.1 256.00 65.61 129.60

6 15.8 6.5 249.64 42.25 102.70

7 14.4 6.2 207.36 38.44 89.28

8 13.6 5.1 184.96 26.01 69.36

9 15.2 6.1 231.04 37.21 92.72

10 15.1 8.1 228.01 65.61 122.31

11 11.6 5.2 134.56 27.04 60.32

12 16.9 9.2 285.61 84.64 155.48

13 14.5 6.9 210.25 47.61 100.05

14 14.7 5.6 216.09 31.36 82.32

15 16.2 7.5 262.44 56.25 121.50

16 14.7 6.7 216.09 44.89 98.49

17 18.1 9.1 327.61 82.81 164.71

18 16.0 6.7 256.00 44.89 107.20

19 12.5 4.7 156.25 22.09 58.75

20 15.5 7.0 240.25 49.00 108.50

21 14.2 5.3 201.64 28.09 75.26

22 16.0 8.8 256.00 77.44 140.80

23 15.9 7.2 252.81 51.84 114.48

24 14.3 6.8 204.49 46.24 97.24

25 14.7 6.3 216.09 39.69 92.61

26 15.2 6.4 231.04 40.96 97.28

27 17.1 8.3 292.41 68.89 141.93

28 13.9 6.2 193.21 38.44 86.18

29 13.9 4.6 193.21 21.16 63.94

30 15.1 6.8 228.01 46.24 102.68

合計 450.6 202.2 6820.32 1405.90 3076.43

総平方和(総変動)n

y

ySS

n

i

in

i

iyyT

2

1

1

2

0724330

2202901405

2

..

. 29130 yyT

回帰による平方和(直線回帰) 6562930852

38639 22

..

.

S

SS

xx

xy

R 1R

ただし,n

yx

yxS

n

i

i

n

i

in

i

iixy

11

1

3863930

22026450433076 .

...

3085230

6450326820

2

2

1

1

2 ..

.n

x

xS

n

i

in

i

ixx

-292-

回帰からの平方和(残差変動) 416136562907243 ...SSS RTe

28129 RTe

b)分散分析

統計量の計算から分散分析表を作成すると表 18.4となる.

表 18.4 分散分析表

要因 平方和 自由度 平均平方 Fo E.m.s

直線回帰 R 29.656 1 29.656 61.9* 22

12 xxi

残差 e 13.416 28 0.4791 2

合計 T 43.072 29

有意水準 5%とすると, xに対する y の回帰直線の判断は,

仮 説: 0210 :H , 02

11 :H に対し,

棄却域: 2040502819610 ..;,F.VVF eR

となり有意である.よって回帰直線は認められる.

また寄与率は, 688500724365629 ...SS TR となり 68.85%であることがわかる.

c)回帰直線の推定

回帰直線の推定には式(18.11)および式(18.12)で求められる.

回帰係数 753030852

38639

1

1

2

11

11 .

.

.

S

S

n

x

x

n

yx

yxˆ

xx

xy

n

i

in

i

i

n

i

i

n

i

in

i

ii

切片 57040215753074611

11

0 ....xˆyn

n

n

i

i

n

i

i

ただし, 74630

22021 ..

n

y

y

n

i

i

, 0215

30

64501 ..

n

x

x

n

i

i

よって,推定される回帰直線はモデル式(18.14)より,

単回帰第 1モデル iii x..xˆˆˆ 7530570410

または,単回帰第 2モデル 02157530746 10 .x..xxˆ'ˆˆiii

と推定される.

(2)回帰母数の検定

推定された回帰直線が,従来の回帰直線と異なるかを統計的に検定してみると,従来

の回帰直線は, x..y 54807211 より,

x..xy 548072111000

021554805106 1000 .x..xx'y

となる.

a)回帰係数の検定と区間推定

-293-

回帰係数 1 における検定は,式(18.32)(18.33)(18.34)より,

帰無仮説 1010 :H ( 548010 . )

対立仮説 1011 :H (有意水準 050. )

帰無仮説の下における検定統計量は,

推定値 753030852

386391 .

.

.

S

xx

xy

検定統計量 14223085247910

548075301010 .

..

..

SV

ˆt

xxe

棄却域 05020 .,nt,tt e より,

判定 04820502814220 ..,t.t

となる.ゆえに,回帰係数は有意水準 5%で有意である.すなわち,一部回路の設計

変更した回帰直線の回帰係数は,従来の回帰式の回帰係数と異なるといえる.

推定した回帰直線の回帰係数 1 の信頼率 1100 %信頼限界は式(18.41)より,

5570

9490196075300957004827530

30852

479100502875301

.

......

.

..,t.

S

V,tˆ

xx

ee

となる.

b)切片( 0ix における) 0 の検定と区間推定

切片 0 における検定は,式(18.35)(18.36)(18.37)より,

帰無仮説 0000 :H ( 721100 . )

対立仮説 1001 :H (有意水準 050. )

帰無仮説の下における検定統計量は,

推定値 57040215753074610 ....xˆyˆ

検定統計量

4791030852

0215

30

1

72115704

122

0000

..

.

..

VS

x

n

ˆt

e

xx

9741443011

8492.

.

.

棄却域 05020 .,nt,tt e より,

判定 04820502897410 ..,t.t

となる.ゆえに, 0ix における切片は有意水準 5%で有意ではない.すなわち,一

部回路の設計変更に伴う 0ix における回帰直線の切片は,従来の回帰式の切片と

異なるとはいえない.

推定した回帰直線の 0ix における切片 0 の信頼率 1100 %信頼限界は,

式(18.42)より,

4791030852

0215

30

1050285704

1 22

0 ..

..,t.V

S

x

n,tˆ

e

xx

e

-294-

5257

61519552570444301104825704

.

......

となる.

c) xxi における 0 ' の検定と区間推定

xxi における 0 ' の検定は,式(18.38)(18.39)(18.40)より,

帰無仮説 0000 '':H ( 5106 00 .' )

対立仮説 0001 '':H (有意水準 050. )

帰無仮説の下における検定統計量は,

推定値 746 0 .y'ˆ

検定統計量 8201126370

230

4791030

1

5106746

1

000 .

.

.

.

..

Vn

'yt

e

棄却域 05020 .,nt,tt e

判定 04820502882010 ..,t.t

となる.ゆえに, xxi における切片は有意水準 5%で有意ではない.すなわち,一

部回路の設計変更に伴う xxi における回帰直線の切片は,従来の回帰式の切片と

異なるとはいえない.

推定した回帰直線の xxi における切片 0 の信頼率 1100 %信頼限界は,

式(18.43)より,

4816

999625907461263700482746

4791030

105028746

1 0

.

......

..,t.Vn

,t'ˆ ee

となる.

(3)母回帰直線の区間推定

推定する母回帰直線は推定値を式(18.45)で表すと,推定された回帰直線は式(18.46)の正

規分布に従い,その信頼限界は式(18.49)で表せる.

指定する ix に対する母回帰直線の信頼率 1100 %信頼限界は 050. とすれば,

4 7 9 103 0 852

0215

30

105028

12

0

2

0 ..

.x.,tˆV

S

xx

n,tˆ i

e

xx

ie

となる.よって,各 ix に対する計算値は表 18.5となる.

(4)散布図の作成

一部回路設計変更後の表 18.3 に示すデータの散布図,データから推定された回帰直線お

よび回路設計変更前の従来の回帰直線を図 18.5に示す.

併せて,推定された回帰直線の信頼率 95%信頼限界値である表 18.5 の結果も図 18.5 に

示した.なお,将来実現するであろう ix に対する個々の特性値 iy の信頼率 95%予測限界も

計算し図示した.

-295-

表 18.5 母回帰直線の信頼限界計算補助表

57040 .ˆ , 75301 .ˆ , 30n , 0215.x , 30852.Sxx , 47910.Ve , 048205028 ..,t

ix 点推定値

ii xˆˆˆ 10

e

xx

i VS

xx

nA

21

区間の幅

A,tB e

信頼上限

Bˆ i

信頼下限

Bˆ i

12.5 4.8425 0.074135 0.5576 5.4001 4.2849

13.5 5.5955 0.037131 0.3946 5.9901 5.2009

14.5 6.3485 0.018447 0.2782 6.6267 6.0703

15.5 7.1015 0.018080 0.2754 7.3769 6.8261

16.5 7.8545 0.036032 0.3888 8.2433 7.4657

17.5 8.6075 0.072303 0.5507 9.1582 8.0568

18.5 9.3605 0.126892 0.7295 10.0900 8.6310

図 18.5 電磁弁の構成部品の寸法 xと作動特性 y の関係の散布図

【蛇足 1】

本例題を作成した Original Soft「CROManalysis302.zip」を解凍し,インストール後「相

関分析と回帰分析 Ver3.02」を利用した解析結果の画面を図 18.6~図 18.8に示す.

746 0 .y'ˆ 516 00 .'

0215.x

02157350746

10

.x..

xxˆ'ˆˆ

02155480516

1000

.x..

xx'y

個々のデータ y の 95%予測区間

母回帰直線 の 95%信頼限界

y

x

-296-

図 18.6 相関分析と回帰分析 Ver3.02解析結果

図 18.7 相関分析と回帰分析 Ver3.02解析結果

-297-

図 18.8 相関分析と回帰分析 Ver3.02解析結果

【参考1】式(18.8)の平方和の分解について

Re

n

i

i

n

i

ii

n

i

iiiiii

n

i

iii

n

i

iyyT

SS

yˆˆyyˆˆyyˆˆy

yˆˆyyySS

2 1

2

1

2

1

22

1

2

1

2

xx

xy

R

xx

xy

xx

xx

xyn

i

i

n

i

i

n

i

i

n

i

iR

S

SS

S

SS

S

Sxxˆ

yxˆxˆyyxˆˆyˆS

22

2

2

1

221

1

2

11

1

2

10

1

2

n

i

ii

n

i

i

n

i

i

n

i

ii

n

i

ii

n

i

iie

xxyyˆxxˆyy

xxˆyyxˆxˆyyxˆˆyS

1

1

1

221

1

2

1

2

1

1

2

11

1

2

10

2

xx

xy

xy

n

i

iiS

SSˆxxyyˆ

2

1

1

1 222

RTeRT

xx

xxT

xx

xxxx

xx

xy

T SSSSSS

SS

S

SS

S

SS

2222

-298-

【参考2】平方和の期待値と分散分析表における E.m.sについて

回帰直線: ii x10

210 0 ,Nxy iiii ~

n,Nxy

2

10 0

~ 2

1

21

nEn

i

i

n

i

iiii

n

i

ii

n

i

ii

n

i

iyyT

xxxxExxE

xxEyyESESE

1

21

221

1

21

1

21010

1

2

2

02

22

21211

1

1

1

1

nxnxx

xxExxEn

i

ii

n

i

ii

221

1

2

1

221 1

nSExxE xx

n

i

i

n

i

i

n

i

ii

n

i

i

n

i

i

n

i

iR

xxxxExxE

xxEyESE

1

221

221

1

21

1

21010

1

2

2

02

22

21211

1

1

1

1

nxnxx

xxExxEn

i

i

n

i

i

jiE,ESSS

VE

SEn

SnExx

ExxE

jiixx

R

R

R

RR

xx

n

i

ixx

n

i

i

n

i

n

i

i

0

1

22221

221

1

221

2

1

221

1

2

1

221

2221

221 21 nSnSSESESSESE xxxxRTRTe

2

e

ee

SVE

【参考3】式(18.21)回帰係数 1 の分布について

推定値: xx

xy

S

Sˆ 1

211

1

xxS,Nˆ~

xx

n

i

ixx

n

i

ii

n

i

iii

n

i

iixy

SEESxxE

xxxxEyyxxESE

1

1

1

1

21

1

1010

1

-299-

1111 1

ˆESE

SS

SEˆE xy

xxxx

xy

21

22

221

1

111

xxxx

xx

xx

xy

xxxx

xy

SˆE

SS

SSVar

SS

SVarˆVar

2

11

2

111

1

0

xx

n

i

ii

n

i

i

n

i

i

n

i

ii

n

i

iii

n

i

iixy

S

xxyyVarxx

xxyyxxVaryxxyxxVar

yyxxVarSVar

【参考4】式(18.21)回帰係数 0 の分布について

推定値: xˆyˆ10

2

2

00

1

xxS

x

n,Nˆ ~

0110110110 xxxxˆˆExˆEyExˆyEˆE

00 ˆE

112

1110 2 2 ˆ,yCovxˆVarxyVarxˆ,yCovxˆVaryVarxˆyVarˆVar

01

1

1

0 1

1

11

1

1

22

1

1111

11111

1111

1

n

i

i

xx

n

i

i

xx

n

i

i

n

i

i

xx

n

i

ii

n

i

i

xx

n

i

i

n

i

i

n

i

i

n

i

ii

n

i

i

xx

n

i

ii

n

i

i

xx

xy

n

i

i

xx

xy

xx

n

i

i

xxS

nxxnS

yVarxxnS

yxx,yCovnS

xxyyxxyxxyxx,yCovnS

yyxx,yCovnS

S,yCovnS

SS

,yn

Covˆ,yCov

22

22

21

2 11

xxxx S

x

nS

x

nˆVarxyVar

22

0

1

xxS

x

nˆVar

【参考5】式(18.46)母回帰直線の分布について

0x を指定し第 1 回帰モデル 0100 x を考え,その推定値を 0100 xˆˆˆ とする

と, 0 の分布は,

期待値: 00100100100 xxˆEˆExˆˆEˆE

分 散: 0100100100 2 xˆ,ˆCovxˆVarˆVarxˆˆVarˆVar

1001200 2 ˆ,ˆCovxˆVarxˆVar

-300-

2

111

111

1111110

0

xxS

x

ˆVarxˆ,ˆCovx

ˆ,yCovˆ,xˆCov

ˆ,xˆCovˆ,yCovˆ,xˆyCovˆ,ˆCov

22

0

22

02220

20

2

20

2202

2

1001200

1

12

11

21

2

xx

xxxx

xxxxxx

S

xx

n

S

xx

nxxxx

Sn

S

xx

S

x

S

x

n

ˆ,ˆCovxˆVarxˆVar

となる.また, 0x を指定し第 2 回帰モデル 0100 xx' を考え,その推定値を

0100 xxˆ'ˆˆ とすると, 0 の分布は yxˆˆ'ˆ 100 より,

期待値: xxˆxˆˆExxˆ'ˆEˆE 01100100

0010010010 xxˆEˆExˆˆE

分 散: xxˆ'ˆVarˆVar 0100

101

20

0101

2

ˆ,yCovxxˆVarxxyVar

xxˆ,yCovxxˆVaryVar

01 ,yCov

2

202

202

12

0

11

xxxx S

xx

nS

xx

n

ˆVarxxyVar

【参考6】式(18.52)個々のデータに対する予測の分布について

0xx のとき推測された回帰直線から予測される目的変数 0y の値は,

01000 xy 20 ,N~

として予測値は,

xˆˆeˆy 10000

となる.よって,

期待値: ExˆEˆExˆˆEyE 0100100

0010 x

分 散: 0100 xˆˆVaryVar

2 2 2 010010

010

,xˆCov,ˆCovxˆ,ˆCov

VarxˆVarˆVar

1001200 2 ˆ,ˆCovxVarˆVarxˆVar

xxSxˆVarx

ˆ,yCovˆ,ˆCovxˆ,xˆCov

ˆ,xˆCovˆ,yCovˆ,xˆyCovˆ,ˆCov

21

11111

1111110

0

-301-

22

0

222

022220

20

2

20

22202

2

11

12

11

21

xx

xxxx

xxxxxx

S

xx

n

S

xx

nxxxx

Sn

S

xx

S

x

S

x

n

となる.よって, 0xx のとき推定された回帰直線による信頼率 1100 %個々のデータの

予測値 0y の予測限界は 050. とすると.

e

xx

e

xx

e VS

xx

n.,ntxˆˆV

S

xx

n,tˆ

20

010

20

0

10501

1

【参考7】相関分析との関係について

相関分析は,2変量間の関連性の強さの程度を解析する手法であり,変数 xと yの試料相

関係数 yyxxxy SSSr を用いて検討する.

単回帰分析での仮説 010 :H , 011 :H の検定統計量は,

xx

xy

yy

xx

xxxy

Ryy

xx

xxxy

e

xx

e

xx S

SS

nS

SS

SSnS

SS

n

S

S

ˆ

VS

ˆt

2

110

2

12

1

2

11

,rSSSSS

Sr

S

SSS

nS

SSyyxxxy

yyxx

xy

xx

xyyyxx

xx

xxxyとおいてよりただし, 22

2

2

1

2

2222

1

2

1

2

1

222

r

nr

r

n

SS

S

rSS

nS

rSSSS

nS

SSS

nS

yyxx

xy

yyxx

xy

yyxxyyxx

xy

xyyyxx

xy

となり,相関分析では, 0t が自由度 2n の t分布に従うことを利用し 00 :H , 01 :H

の仮説検定が行われる.この検定を無相関の検定と呼んでいる.

相関分析は,変数 xと yの周辺分布が共に正規分布に従い,母集団分布は 2次元正規分布

に従っている下で解析される.変数 xと yの 2次元正規分布の確率密度関数は,それぞれの

周辺分布を 2xx ,N , 2

yy ,N として,

母相関係数をyx

xy

2

と定義し,

確率密度関数

2

2

2

2

22

12

1

212

1 y

y

yx

yx

x

xyyxx

yx

ey,xf

で表される.したがって,変数 xを指定したとき変数 yの条件付分布は,

xx

y

y

y

xy

y

exf

y,xfxyf

2212

1

212

1

となり,期待値と分散は,

-302-

x

x

y

y xxyE

221 yxyVar

となる.すなわち, xを指定したとき yの条件付分布の期待値の推定値は回帰直線となる.

回帰直線と表し, yˆy , xˆ

x ,yx

xy

ˆˆ

ˆˆ

2

とおくと,

xxˆyxxˆ

ˆyxx

ˆ

ˆ

ˆˆ

ˆyˆx

ˆ

ˆˆˆxyEˆ

x

xy

x

y

yx

xy

x

x

y

y 12

22

xx

xy

x

xy

S

S

ˆ

ˆˆ

2

2

1

また分散を 2 と表し,その推定値は,

Ryy

x

xy

yy

yx

xy

yyyy SSˆ

ˆˆˆ

ˆˆ

ˆˆˆˆˆˆˆxyarVˆ

2

22

22

22

2222222 1

Tyyy SSˆ 2 , xyxy Sˆ 2 , xxx Sˆ 2 , R

xx

xyS

S

S

2

→ Ryye SSS

となる.よって,繰返しのない単回帰分析の解析は,相関分析の解析も包含していることに

なる.

-303-

第18章 Excel演習問題

【問題 18-1】

ある化学工業(株)では塗料成分の開発を行っている.この塗料剤は,現場で一定量の添加

剤が加えられ撹拌し,常温下での塗布後の乾燥性能の向上を目指している.また,従来は塗

料成分の割合 xと乾燥性能である特性 y の関係は,回帰直線として x..y 0210558 の関係

にあった.

そこで,塗料成分比を新たに変更して現場での乾燥性能を調査するために,数カ所の現場

で使用された塗料剤を 30サンプル収集し,塗料成分の割合 xと乾燥性能である特性 y につ

いて常温下で測定し表 18-1.1 のデータを得た.ただし,データは数値変換してあり単位は

省略してある.

表 18-1.1 塗料剤の乾燥性能データ表(単位省略)

サンプル x y サンプル x y サンプル x y

1 8.4 66.8 11 14.2 78.9 21 9.3 69.3

2 10.5 71.2 12 11.7 74.3 22 4.7 60.6

3 9.7 64.4 13 13.0 72.1 23 8.2 64.5

4 10.3 73.7 14 12.9 74.3 24 7.6 69.8

5 11.0 71.1 15 11.7 70.0 25 12.3 70.9

6 10.2 65.5 16 7.7 65.4 26 7.2 60.9

7 9.3 67.4 17 10.5 67.0 27 7.7 67.8

8 9.4 69.7 18 5.7 63.0 28 9.6 67.2

9 12.0 73.4 19 9.0 71.7 29 10.9 71.5

10 11.7 68.8 20 8.7 70.4 30 11.0 73.3

次の設問に答えよ.

(1)測定データより散布図および従来の回帰直線を描き考察せよ.

(2)乾燥性能特性 y は,成分割合 xと直線関係にあるかを有意水準 5%で検定し,新しい

回帰直線を推定せよ.

(3)従来の回帰直線は,新しい回帰直線とそれぞれの回帰母数が異なるかを有意水準5%

で検定せよ.また,それらの回帰母数の信頼率 95%信頼限界を求めよ.

(4)新しい回帰直線を用いて, 04.xi (キザミ 0.2) 615. における特性 i の推定値および

信頼率 95%信頼限界を求めよ.

-304-

第19章 単回帰分析(繰返しあり)

前章の繰返しがない場合の単回帰分析では,原因(要因)系 xに対して結果(特性)系 y

への直線関係について述べた.

本章では,xの要因(例えば,温度,圧力など)の指定値について,繰返し数回の実験がなされ特性 y を得て,原因(要因)系 xに対して結果(特性)系 y への直線関係を把握し改

善に役立てる方法について述べる.

19.1 実験の配置

特性要因図 19.1 に示すように,例えば要因 A(例えば,温度,圧力など) l水準を取り

上げ,各水準の指定値 lx,,x,x 21 が連続量であり,各水準の繰返し数を in (ただし,

l

i

inN1

)合計 lN 回のランダム実験で特性値 y が得られたとする.すなわち,第 3章で述

べた一元配置による実験に相当する.

図 19.1 原因 xと結果 y の関係

表 19.1 一元配置法実験のデータ表 表 19.2 単回帰分析実験のデータ表

因子 1A 2A lA 因子 1A 2A lA

指定値 1x 2x lx

1 11y 21y 1ly

1 11y 21y 1ly

2 12y 22y 2ly 2 12y 22y 2ly

ijy ijy

in 11ny

22ny llny r

11ny 22ny

llny

一元配置実験では,取り上げた因子の水準での最適な条件を求めて改善等に役立てたの対

して,表 19.2 の単回帰分析では,取り上げた水準内での指定値 xと特性値 y との関数関係

を求め改善等に役立てることになる.データの構造は,両法の比較において,

一元配置実験: ijiijy ただし, ii a

単回帰分析: ijiiijy ただし, ii x10

ただし, i は回帰 2次以上の変動部分

となる.

19.2 繰返しのある単回帰モデル

繰返しのある単回帰モデルにおけるデータの構造式は,各水準の値 l,,,ixi 21 に対す

る ijy の母平均を i とすると,

ijiiijiiij xy 10

となる.各水準の指定値を説明変数 ix ,特性を目的変数 ijy として, ij は誤差である.また

0 , 1 は未知の定数であり 0 を切片, 1 を回帰係数( regression coefficient )と呼び,併

せて 0 , 1 を回帰母数( regression parameter )と呼ぶのは繰返しのない単回帰分析と同様

( 19.1 )

要因

特性

( 19.2 )

-305-

である.式(19.2)の回帰 2次以上の変動部分 i ,誤差 ij に関する条件として次を仮定する.

20 ri ,N ~ , 20 ,Nij~

これらの条件の下で式(19.2)の期待値は,

xyE ij 10

となり直線となる.式(19.4)を xに対する y の回帰直線( regression line of y to x )といい,

すなわち,繰返しのある単回帰分析でも,観測値 x,y より未知の定数である回帰母数を推

定し回帰線を確立することにある.単回帰モデルを図示すると図 19.2となる.

図 19.2 繰返しある単回帰モデル

要因系としての説明変数 xに対して,目的変数 y に繰返しがある実験で回帰直線の推定

は,変動部分を図 19.2に示すとおり,個々のデータから目的変数の平均までの距離を

yˆˆyyyyy iiiiijij

に分解し,総変動 yyT SS が,

l

i

n

j

i

l

i

n

j

ii

l

i

n

j

iij

l

i

n

j

i

l

i

n

j

iij

l

i

n

j

ijyyT

iii

ii

i

yˆˆyyy

yyyy

yySS

1 1

2

1 1

2

1 1

2

1 1

2

1 1

2

1 1

2

に分解できることを利用して,回帰直線の検討を行う.式(19.6)は,

(総変動)=(級内変動)+(当てはまりの悪さ変動)+(回帰による変動)

となる.第 18章で述べた回帰からの残差が,繰返し実験が実施されると,級内変動(残差

変動)と当てはまりの悪さによる変動に分解できることになる.当てはまりの悪さ( lack of

fit )が残差変動に比較して大きい場合,回帰直線(1次回帰)のみでは不足で 2次以上を持

つ回帰曲線を考慮することを意味する.したがって,各変動の平方和と自由度を,

総平方和:

l

i

n

j

ijyyT

i

yySS1 1

2 11

1

Nnl

i

iT

級間平方和:

l

i

n

j

iA

i

yyS1 1

2 1 lA

なお,級間平方和は一元配置法の実験による因子 Aの平方和に等しい.

iij yy iy

ix

x10

x

y

ii xˆˆˆ10

ijy

i

( 19.3 )

( 19.4 )

y

ijy

x

iiˆy

yˆi

yyij 総変動

級内変動

当てはまりの悪さ

回帰による変動

( 19.6 )

( 19.5 )

( 19.7 )

( 19.8 )

( 19.9 )

-306-

回帰による平方和::

l

i

n

j

iR

i

yˆS1 1

2 1R

当てはまりの平方和(高次平方和):

l

i

n

j

iilof

i

ˆyS1 1

2 2 llof

残差平方和:

l

i

n

j

iije

i

yyS1 1

2 lNe

とおいて,式(19.6)より,

lofReAeyyT SSSSSSS

lofReAeyyT

が成り立つことになる.

繰返しのある単回帰分析の実験によるデータ表は表 19.2 であり,データおよび計算補助

表は表 19.3となる.

表 19.3 繰返しのある単回帰分析よるデータ表および計算補助表

因子 1A 2A lA

水準値 ix 1x 2x lx 合計

in 1n 2n ln

l

i

inN1

ix 11xn 22xn ll xn

l

i

ii xn1

2

ix 2

11xn 2

22xn 2

ll xn

l

i

iixn1

2

11y 21y 1ly

データ特性 12y 22y 2ly

l

i

n

j

ij

i

y1 1

ijy ijy

11ny

22ny llny

in

j

iji yT1

1T 2T lT

l

i

iTT1

in

j

ijy1

2

1

1

2

1

n

j

jy

2

1

2

2

n

j

jy

ln

j

ljy1

2

l

i

n

j

ij

i

y1 1

2

iiTx 11Tx 22Tx llTx

l

i

iiTx1

19.3 回帰母数の推定

繰返しのある単回帰分析でも回帰直線の推定では,第 18章を基礎としてデータより回帰

母数 0 , 1 の推定値は xˆyˆ10 , xxxy SSˆ 1 と求められる.表 19.3補助表より実

験データの総数をN として,

N

xn

xnN

xn

xnxxS

l

i

iil

i

ii

l

i

iil

i

ii

l

i

n

j

ixx

i

2

1

1

2

2

1

1

2

1 1

2

( 19.10 )

( 19.11 )

( 19.12 )

( 19.13 )

( 19.14 )

-307-

N

yxn

yxyyxxS

l

i

n

j

ij

l

i

iil

i

n

j

iji

l

i

n

j

ijixy

i

ii

1 11

1 11 1

N

Txn

Tx

l

i

iil

i

ii

1

1

ただし,

in

j

iji yT1

xx

xy

l

i

iil

i

ii

l

i

iil

i

ii

S

S

N

xn

xn

N

Txn

Txˆ

2

1

1

2

1

11

xˆyN

xnˆ

N

y

ˆ

l

i

ii

l

i

n

j

ij

i

11

1

1 1

0

を計算して回帰直線は,

xxˆ'ˆxxˆyˆiii 101 ただし, y'ˆ 0

と求められる.

単回帰モデルのデータの構造式は,

モ デ ル単 回 帰 第

モ デ ル単 回 帰 第

2

1

10

10

ijiiij

ijiiij

xx'y

xy

と記述することができる.

19.4 繰返しのある単回帰分析における分散分析法

単回帰分析では,説明変数 xを指定したとき目的変数 y の推定を図るのが目的であった.

繰返しのある単回帰分析で推定された回帰直線の妥当性を分散分析により,統計的に判断

するには,データの構造式を

第 1モデル ijiiij xy 10 20 ri ,N ~ , 20 ,Nij~

第 2モデル ijiiij xx'y 10 20 ri ,N ~ , 20 ,Nij~

として,それぞれの変動に対する平方和と自由度を計算する.繰返しのある単回帰分析によ

るデータ計算補助表 19.3の記号を利用して,

l

i

inN1

l

i

n

j

ij

i

yT1 1

in

j

iji yT1

とおくと,

総平方和(総変動) N

TyyySS

l

i

n

j

ij

l

i

n

j

ijyyT

ii 2

1 1

2

1 1

2

1 NT

A間平方和(級間変動) N

T

n

TyyS

l

i i

il

i

n

j

iA

i 2

1

2

1 1

2

1 lA

( 19.16 )

( 19.18 )

( 19.19 )

( 19.20 )

( 19.21 )

( 19.22 )

( 19.15 )

( 19.17 )

( 19.23 )

-308-

回帰による平方和(直線回帰)xx

xy

RS

SS

2

1R

ただし, N

Txn

TxyyxxS

l

i

iil

i

ii

l

i

n

j

ijixy

i

1

11 1

N

xn

xnxxS

l

i

iil

i

ii

l

i

n

j

ixx

i

2

1

1

2

1 1

2

当てはまりの悪さの平方和(高次回帰) RAlof SSS

2 lRAlof

級内平方和(残差変動) ATe SSS lNATe

と求められる.分散分析表を作成すると表 19.4になる.

表 19.4 分散分析表

要因 平方和 自由度 平均平方 Fo

直線回帰 R xxxyR SSS 2 1R RRR SV eR VV

高次回帰 lof RAlof SSS 2 llof lofloflof SV elof VV

級間 A AS 1 lA

AAA SV eA VV

級内 e Ayye SSS lNe eee SV

合計 T yyT SS 1 NT

分散分析による検定では,まず級間変動に対して有意水準 5%とすると,

仮 説: 02

0 A:H , 02

1 A:H に対し,

棄却域: 0500 .;,FVVF eAeA

次に, xに対する y の回帰直線の判断は,有意水準 5%とすると,

仮 説: 0210 :H , 02

11 :H に対し,

棄却域: 0500 .;,FVVF eReR

として回帰係数による検定を行えばよい.さらに,高次効果に対して,

仮 説: 02

0 r:H , 02

1 r:H に対し,

棄却域: 0500 .;,FVVF elofelof

として検定を行えばよい.繰返しありの単回帰分析では,回帰直線の推定を目的として,デ

ータの分解から当てはまりの悪さ(高次回帰)分離される.検定の結果,高次回帰が有意と

判定された場合,2次以上の回帰モデルが想定されることを意味する.2次以上の回帰モデ

ルについては水準指定値が等間隔であれば直交多項式による分析,また一般的では重回帰

分析による方法が利用される場合がある.

また,当てはまりの悪さ(高次回帰)が検定の結果,有意で場合には高次回帰は級内にプ

ーリングして誤差と考えればよい.プーリング後の分散分析表を表 19.5に示す.

表 19.5 プーリング後の分散分析表

要因 平方和 自由度 平均平方 Fo

直線回帰 R xxxyR SSS 2 1R RRR SV 'eR VV

残差 'e lofe'e SSS lofe'e 'e'e'e SV

合計 T yyT SS 1 NT

0500 .;,FVVF eReR

回帰直線による寄与率は,

( 19.30 )

( 19.24 )

( 19.25 )

( 19.26 )

( 19.27 )

( 19.28 )

( 19.29 )

( 19.31 )

-309-

寄与率:yyxx

xy

yy

xxxy

T

R

SS

S

S

SS

S

S22

となる.

19.5 回帰母数の検定と推定

得られた回帰直線の回帰母数の推定値における検定および推定については,それぞれの

回帰母数の推定値 1 , 0 は,

回帰係数:

2

11

1

xxS,Nˆ~ ,切片:

2

2

00

1

xxS

x

N,Nˆ ~

の正規分布に従うことを利用して検討する.

19.5.1 回帰母数に関する検定

回帰直線の傾きが 01 および従来の回帰直線が存在しその回帰係数が 101 ( 10 は

検定のための設定値)であるかどうかの統計的な判断は第 18章に準じて行う.

(1)仮説ゼロの検定

帰無仮説 010 :H

対立仮説 011 :H (有意水準 050. )

表 19.5 プーリングした分散分析表を用いると,検定統計量は,推定量 'eVˆ 2 で置き換

えると xx'e SVˆt 11 は自由度 'e の t分布に従うことから.帰無仮説の下における

検定統計量は,

推定値 xx

xy

S

Sˆ 1

検定統計量

xxe SV

ˆt 10

棄却域 0500 .,t,tt 'ee

となる.

(2)回帰係数 1 の一般的な検定

帰無仮説 1010 :H ( 10 :設定値)

対立仮説 1011 :H (有意水準 050. )

に対する帰無仮説の下における検定統計量は,

推定値 xx

xy

S

Sˆ 1

検定統計量 xx'e SV

ˆt 1010

棄却域 0500 .,t,tt 'e'e

となる.

(3) 0ix における切片 0 の検定

( 19.32 )

( 19.33 )

( 19.34 )

( 19.35 )

( 19.36 )

( 19.38 )

( 19.39 )

( 19.37 )

-310-

推定した回帰直線が 0ix のとき切片 000 ( 00 は検定のための設定値)であるかど

うか,または xxi のとき 000 '' ( 00 ' は検定のための設定値)であるかどうかの統計

的な判断は同様に第 18章に準じて行う.

帰無仮説 0000 :H ( 00 :設定値)

対立仮説 1001 :H (有意水準 050. )

検定統計量は,推定量 'eVˆ 2 で置き換えると xx'e SxNVˆt 2

000 1 は自

由度 'e の t分布に従うことから,帰無仮説の下における検定統計量は,

推定値 xˆyˆ10

検定統計量

'e

xx

VS

x

N

ˆt

2

0000

1

棄却域 0500 .,t,tt 'e'e

となる.

(4) xxi における 0 ' の検定

帰無仮説 0000 '':H ( 00 ' :設定値)

対立仮説 0001 '':H (有意水準 050. )

統計量 0 ' は,式(19.17)より y'ˆ 0 であり第 18 章に準じて,分散の推定量 'eVˆ 2 で

置き換えると NV''t 'e000 は自由度 'e の t分布に従うことから,帰無仮説の下

における検定統計量は,

推定値 y'ˆ 0

検定統計量

'eVN

'yt

1

000

棄却域 0500 .,t,tt 'e'e

となる.

19.5.2 回帰母数に関する区間推定

(1)回帰係数 1 の区間推定

回帰係数の推定値 1 は,分散の推定量 'eVˆ 2 で置き換えると xx'e SVˆt 11 が

自由度 'e の t分布に従うことから,回帰係数 1 の信頼率 1100 %信頼限界は 050.

とすると.

xx

'e'e

xx

'ee

S

V.,tˆ

S

V,tˆ 05011

となる.

(2)切片 0 の区間推定

切片の推定値 0 は,推定量 'eVˆ 2 で置き換えると xx'e SxNVˆt 2

00 1

( 19.40 )

( 19.41 )

( 19.42 )

( 19.43 )

( 19.44 )

( 19.45 )

( 19.46 )

-311-

は自由度 'e の t 分布に従うことから,回帰係数 0 の信頼率 1100 %信頼限界は

050. とすると,

'e

xx

'e'e

xx

'e VS

x

N.,tˆV

S

x

N,tˆ

2

0

2

0

1050

1

となる.

(3) xxi における 0 ' の区間推定

xxi における推定値 0 ' は,推定量 'eVˆ 2 で置き換えると nV''ˆt 'e00 は

自由度 'e の t分布に従うことから, xxi における推定値 0 ' の信頼率 1100 %信頼限

界は 050. とすると,

'e'e'e'e VN

.,t'ˆVN

,t'ˆ1

050 1

00

となる.

19.6 母回帰直線の区間推定

推定された直線回帰式(19.18)に対し,指定した 0x に対する母回帰式は,

第 1回帰モデル 010 x

第 2回帰モデル xx' 010

であり,その推定値は,

第 1回帰モデル 0100 xˆˆˆ

第 2回帰モデル xxˆ'ˆˆ 0100

で与えられる.回帰母数 0 , 1 は正規分布に従うことから,式(19.50)の期待値と分散は,

00 ˆE

2

2

00

1

xxS

xx

NˆVar

をもつ.表 19.5 の分散分析表を用いて分散の推定量 'eVˆ 2 で置き換えて標準化式を考え

ると 'exx VSxxNˆt2

000 1 は自由度 'e の t分布に従うことになる.よっ

て,回帰直線 0 における信頼率 1100 %信頼限界は 050. とすると.

'e

xx

'e VS

xx

N,tˆ

2

00

1

'e

xx

'e VS

xx

N.,txˆˆ

2

0010

1050

となる.

信頼限界の幅は, xx 0 のとき最小となり, 0x 値が xから離れることにより大きくなる

ことがわかる.

( 19.47 )

( 19.49 )

( 19.50 )

( 19.51 )

( 19.52 )

( 19.53 )

( 19.48 )

-312-

19.7 個々のデータの予測限界

推定式として得られた回帰直線式(19.50)を利用して,表 19.3に示す個々のデータ y がど

のような値として予測されるかを考えることができる.

表 19.5の分散分析表を用いて 0xx のとき推測された回帰直線から予測される目的変数

0y の値は,第 1回帰モデルを利用すると,

01000 xy 20 ,N~

として予測値は,

xˆˆeˆy 10000

となる.よって,予測値 0y は,第 18章と同様に分散の推定量を 'eVˆ 2 で置き換え標準化

式 'exx VSxxNyyt2

000 11 が自由度 'e の t分布に従うことから, 0xx

のとき推定された回帰直線による信頼率 1100 %個々のデータの予測値 0y の予測限界

は 050. とすると.

'e

xx

'e VS

xx

N,tˆ

2

00

11

'e

xx

'e VS

xx

N.,txˆˆ

2

0010

11050

となる.

19.8 例題1

某染料(株)では,染色ムラ減少に取り組んでおり,代表特性による染色試験による評価で

は結果が判明するまでに時間がかかり問題となっている.そこで,某社では,従来よりその

特性は,染料 Aの y 特性と成分Cの配合比 xとの間には x..y 1651092672 の関係が

あることがわかり配合比 xで y 特性を調整していた.

このたび,会社方針として染料 Aの原料購入先の変更を考えており,従来の回帰式が使

用できるかどうか実験を実施し検討することになった.実験は,成分Cの配合比 4 水準で

調整した新原料による染料を準備し,各水準で繰返し 4 回合計 4×4=16 回の実験をランダ

ムに実施し表 19.6に示す特性のデータを得た.データは単位を省略し数値は変換してある.

表 19.6 繰返しのある単回帰分析よるデータ表

因子 1A 2A 3A

4A

水準値 ix 4 6 8 10

2.1 1.6 1.6 1.1

データ特性 2.3 2.1 1.3 1.2

ijy 2.2 1.9 1.4 1.0

2.5 2.0 1.7 0.8

次の設問に答えよ.

(1)成分の配合比 xに対する染料の y 特性は直線関係にあるかを検討し,染料の原料購入

先の変更に対する新しい回帰直線を推定せよ.

(2)従来の直線関係は,新しい回帰直線と異なるかを有意水準 5%で検定せよ.

また,それぞれの回帰母数の信頼率 95%信頼限界を求めよ.

(3)新しい回帰直線を用いて x 4,5,6,7,8,9,10における y の信頼率 95%信頼限

界を求めよ.

( 19.54 )

( 19.55 )

( 19.56 )

-313-

表 19.7 繰返しのある単回帰分析よる計算補助表

因子 1A 2A 3A

4A

水準値 ix 4 6 8 10 合計

in 4 4 4 4

l

i

inN1

16

ii xn 16 24 32 40

l

i

iixn1

112

2

iixn 64 144 256 400

l

i

ii xn1

2864

2.1 1.6 1.6 1.1

データ特性 2.3 2.1 1.3 1.2

l

i

n

j

ij

i

y1 1

26.8 ijy 2.2 1.9 1.4 1.0

2.5 2.0 1.7 0.8

in

j

iji yT1

9.1 7.6 6.0 4.1

l

i

iTT1

26.8

in

j

ijy1

2 20.79 14.58 9.10 4.29

l

i

n

j

ij

i

y1 1

248.76

iiTx 36.4 45.6 48.0 41.0

l

i

iiTx1

171.0

(4)データ x, y の散布図を描き,推定された新しい回帰直線,従来の回帰直線および信

頼限界を図示せよ.

本例題は,xと特性 y について関数関係を把握する目的で,一元配置法による実験を実施

して単回帰分析の方法例である.また分析では高次回帰を検討できる特徴がある.水準が連

続量で実験されている第 3 章で述べた一元配置法での実験データを利用して,さらに拡張

的に併せて活用される場合もある.

(1)分散分析と回帰直線の推定

a)平方和と自由度の計算

題意によるデータの構造を式(19.2)より,

ijiiij xy 10 20 ri ,N ~ , 20 ,Nij~

または, ijiiij xx'y 10 20 ri ,N ~ , 20 ,Nij~

と考え,表 19.6データ表より表 19.7の計算補助表を作成する.

総平方和(総変動) N

TyyySS

l

i

n

j

ij

l

i

n

j

ijyyT

ii 2

1 1

2

1 1

2

870316

8267648

2

..

. 15116 yyT

A間平方和(級間変動) N

T

n

TyyS

l

i i

il

i

n

j

iA

i 2

1

2

1 1

2

-314-

16

82614066719

4

1 22222 .

....

4553894434548 ... 314 A

回帰による平方和(直線回帰)

4453080

61622

..

.

S

SS

xx

xy

R

1R

ただし,N

Txn

TxS

l

i

iil

i

iixy

1

1

61616

8261120171 .

..

N

xn

xnS

l

i

iil

i

iixx

2

1

1

2

08016

112864

2

.

当てはまりの悪さの平方和(高次回帰) 010044534553 ...SSS RAlof

213 RAlof

級内平方和(残差変動) 415045538703 ...SSS ATe

12315 ATe

b)分散分析

統計量の計算から分散分析表を作成すると表 19.8となる.

表 19.8 分散分析表

要因 平方和 自由度 平均平方 Fo

直線回帰 R 3.445 1 3.445 98.4

高次回帰 lof 0.010 2 0.005 0.143

級間 A 3.455 3 1.152 32.9

級内 e 0.415 12 0.035

合計 T 3.870 15

分散分析による検定では,まず級間変動に対して有意水準 5%とすると,

仮 説: 02

0 A:H , 02

1 A:H に対し,

棄却域: 4930501239320 ..;,F.VVF eA

となり,水準間は有意である.次に,xに対する y の回帰直線の判断は,有意水準 5%

とすると,

仮 説: 0210 :H , 02

11 :H に対し,

棄却域: 7540501214980 ..;,F.VVF eR

となり有意である.よって回帰直線は認められる.さらに,高次効果に対して,

仮 説: 02

0 r:H , 02

1 r:H に対し,

棄却域: 8930501220 ..;,FVVF elof

となり有意でない.よって高次効果を級内変動にプーリングし分散分析表を再作成

する.プーリング後の分散分析表を表 19.9に示す.

xに対する y の回帰直線の判断は,有意水準 5%とすると,

仮 説: 0210 :H , 02

11 :H に対し,

棄却域: 60405014181140 ..;,F.VVF 'eR

となり有意である.よって回帰直線は認められる.

-315-

表 19.9 分散分析表

要因 平方和 自由度 平均平方 Fo

直線回帰 R 3.445 1 3.445 114.8

残差 'e 0.425 14 0.030

合計 T 3.870 15

c)回帰直線の推定

回帰直線の推定には式(19.15)および式(19.16)で求められる.

回帰係数 20750080

6161 .

.

.

S

xx

xy

切片 127530720750675110 ....xˆyˆ

ただし, 675116

826.

.

N

Ty , 07

16

1121 .N

xn

x

l

i

ii

よって,推定される回帰直線はモデル式(19.17)より,

単回帰第 1モデル iii x..xˆˆˆ 207501275310

または,単回帰第 2モデル 07207506751 10 .x..xxˆ'ˆˆiii

と推定される.

(2)回帰母数の検定

推定された回帰直線が,従来の回帰直線と異なるかを統計的に検定してみると,従来

の回帰直線は, x..y 1651092672 より,

x..xy 16510926721000

07165107711 1000 .x..xx'y

となる.

a)回帰係数の検定と区間推定

回帰係数 1 における検定は,式(19.36)(19.37)(19.38)より,

帰無仮説 1010 :H ( 1651010 . )

対立仮説 1011 :H (有意水準 050. )

帰無仮説の下における検定統計量は,

推定値 20750080

6161 .

.

.

S

xx

xy

検定統計量

18920800300

16510207501010 .

..

..

SV

ˆt

xx'e

棄却域 0500 .,t,tt 'e'e より,

判定 14520501418920 ..,t.t

となる.ゆえに,回帰係数は有意水準 5%で有意である.すなわち,染料 Aの原料購入先変更の実施より回帰直線の回帰係数は,従来の回帰式の回帰係数と異なるとい

える.

推定した回帰直線の回帰係数 1 の信頼率 95%信頼限界は式(19.45)より,

-316-

080

030005014207501

.

..,t.

S

V,tˆ

xx

'e'e

24900

1660004150207500193650145220750

.

......

となる.

b)切片( 0ix における) 0 の検定と区間推定

切片 0 における検定は,式(19.40)(19.41)(19.42)より,

帰無仮説 0000 :H ( 9267200 . )

対立仮説 1001 :H (有意水準 050. )

帰無仮説の下における検定統計量は,

推定値 127530720750675110 ....xˆyˆ

検定統計量

0300080

07

16

1

9267212753

122

0000

..

.

..

VS

x

N

ˆt

'e

xx

411114230

20080.

.

.

棄却域 0500 .,t,tt 'e'e より,

判定 14520501441110 ..,t.t

となる.ゆえに, 0ix における切片は有意水準 5%で有意ではない. 0ix におけ

る回帰直線の切片は,従来の回帰式の切片と異なるとはいえない.

推定した回帰直線の 0ix における切片 0 の信頼率 95%信頼限界は,式(19.47)

より,

0300080

07

16

10501412753

1 22

0 ..

..,t.V

S

x

N,tˆ

'e

xx

'e

82232

43273305201275314230145212753

.

......

となる.

c) xxi における 0 ' の検定と区間推定

xxi における 0 ' の検定は,式(19.43)(19.44)(19.45)より,

帰無仮説 0000 '':H ( 7711 00 .' )

対立仮説 0001 '':H (有意水準 050. )

帰無仮説の下における検定統計量は,

推定値 6751 0 .y'ˆ

検定統計量 2172043300

0960

030016

1

77116751

1

000 .

.

.

.

..

VN

'yt

'e

棄却域 0500 .,t,tt 'e'e

判定 14520501421720 ..,t.t

-317-

となる.ゆえに, xxi における切片は有意水準 5%で有意である.すなわち,染料

Aの原料購入先変更の実施より xxi における回帰直線の切片は,従来の回帰式の

切片と異なるといえる.

推定した回帰直線の xxi における切片 0 の信頼率 95%信頼限界は,式(19.48)

より,

58211

7679109290675104330014526751

030016

1050146751

1 0

.

......

..,t.VN

,t'ˆ 'e'e

となる.

(3)母回帰直線の区間推定

推定する母回帰直線は推定値を式(19.50)で表すと,その信頼限界は式(19.53)で表せる.

指定する ix に対する母回帰直線の信頼率 1100 %信頼限界は 050. とすれば,

0 3 00080

07

16

105014

12

0

2

0 ..

.x.,tˆV

S

xx

N,tˆ i

'e

xx

i'e

となる.よって,各 ix に対する計算値は表 19.10となる.

(4)散布図の作成

表 19.6 に示すデータの散布図,データから推定された回帰直線および従来の回帰直線を

図 19.3に示す.

併せて,推定された回帰直線の信頼率 95%信頼限界値である表 19.10の結果も図 19.3に

示した.なお,将来実現するであろう ix に対する個々の特性値 iy の信頼率 95%予測限界も

計算し図示した.

表 19.10 母回帰直線の信頼限界計算補助表

127530 .ˆ , 207501 .ˆ , 16n , 0215.x , 080.Sxx , 0300.V 'e , 145205014 ..,t

ix 点推定値

ii xˆˆˆ 10

'e

xx

i VS

xx

NA

21

区間の幅

A,tB 'e

信頼上限

Bˆ i

信頼下限

Bˆ i

4 2.2975 0.005250 0.1554 2.4529 2.1421

5 2.0900 0.003375 0.1246 2.2146 1.9654

6 1.8825 0.002250 0.1017 1.9842 1.7808

7 1.6750 0.001875 0.0929 1.7679 1.5821

8 1.4675 0.002250 0.1017 1.5692 1.3658

9 1.2600 0.003375 0.1246 1.3846 1.1354

10 1.0525 0.005250 0.1554 1.2079 0.8971

-318-

図 19.3 原料購入先変更後推測される xと特性 y の関係の散布図

【蛇足1】

本例題1を作成した Original Soft「CROManalysis302.zip」を解凍し,インストール後

「相関分析と回帰分析 Ver3.02」を利用した解析結果の画面を図 19.4~図 19.7に示す.

図 19.4 相関分析と回帰分析 Ver3.02解析結果

6751 0 .y'ˆ 7711 00 .'

07.x

07207506751

10

.x..

xxˆ'ˆˆ

07165107711

1000

.x..

xx'y

個々のデータ y の 95%予測区間

母回帰直線 の 95%信頼限界

y

x

-319-

図 19.5 相関分析と回帰分析 Ver3.02解析結果

図 19.6 相関分析と回帰分析 Ver3.02解析結果

-320-

図 19.7 相関分析と回帰分析 Ver3.02解析結果

19.9 例題2

本節の例題は,前節に対し高次回帰が必要と考えられる場合のデータ例である.因子 A

を取り上げ,因子の水準が連続量として 5水準( ix 1.0,1.5,2.0,2.5,3.0:水準間は等

間隔)設定し,繰返し 4 回合計 5×4=20 回の実験を実施し特性 ijy のデータを得たとする.

表 19.11にデータ表を示す.データから xに対する y の回帰関係を検討する.

表 19.11 繰返しのある単回帰分析よるデータ表

因子 1A 2A 3A

4A 5A

水準値 ix 1.0 1.5 2.0 2.5 3.0

75 68 86 85 74

データ特性 66 88 98 80 79

ijy 68 81 87 98 86

71 76 78 88 82

本例題に,本章述べた繰返しのある単回帰分析による解析法を適用してみる.

(1)分散分析

a)平方和と自由度の計算

題意によるデータの構造を式(19.2)より,

ijiiij xy 10 20 ri ,N ~ , 20 ,Nij~

-321-

または, ijiiij xx'y 10 20 ri ,N ~ , 20 ,Nij~

表 19.7 繰返しのある単回帰分析よる計算補助表

因子 1A 2A 3A

4A 5A

水準値 ix 1.0 1.5 2.0 2.5 3.0 合計

in 4 4 4 4 4

l

i

inN1

20

ii xn 4 6 8 10 12

l

i

iixn1

40

2

iixn 4 9 16 25 36

l

i

ii xn1

290

75 68 86 85 74

データ特性 66 88 98 80 79

l

i

n

j

ij

i

y1 1

1614 ijy 68 81 87 98 86

71 76 78 88 82

in

j

iji yT1

280 313 349 351 321

l

i

iTT1

1614

in

j

ijy1

2 19646 24705 30653 30973 25837

l

i

n

j

ij

i

y1 1

2131814

iiTx 280.0 469.5 698.0 877.5 963.0

l

i

iiTx1

3288.0

総平方和(総変動) N

TyyySS

l

i

n

j

ij

l

i

n

j

ijyyT

ii 2

1 1

2

1 1

2

2156420

1614131814

2

. 19120 yyT

A間平方和(級間変動) N

T

n

TyyS

l

i i

il

i

n

j

iA

i 2

1

2

1 1

2

20

1614321351349313280

4

1 222222

28538130249131103 .. 415 A

回帰による平方和(直線回帰) 36010

6022

xx

xy

RS

SS 1R

ただし,N

Txn

TxS

l

i

iil

i

iixy

1

1

6020

16144003288

.

N

xn

xnS

l

i

iil

i

iixx

2

1

1

2

1020

4090

2

当てはまりの悪さの平方和(高次回帰) 24933602853 ..SSS RAlof

-322-

314 RAlof

級内平方和(残差変動) 0711285321564 ...SSS ATe

12315 ATe

b)分散分析

統計量の計算から分散分析表を作成すると表 19.8となる.

表 19.8 分散分析表

要因 平方和 自由度 平均平方 Fo

直線回帰 R 360.0 1 360.0 7.59*

高次回帰 lof 493.2 3 164.4 3.47*

級間 A 853.2 4 213.3 4.50*

級内 e 711.0 15 47.4

合計 T 1564.2 19

分散分析による検定では,有意水準 5%とすると級間変動は,

仮 説: 02

0 A:H , 02

1 A:H に対し,

棄却域: 0630501545040 ..;,F.VVF eA

となり,水準間は有意である.次に, xに対する y の回帰直線の判断は,

仮 説: 0210 :H , 02

11 :H に対し,

棄却域: 5440501515970 ..;,F.VVF eR

となり有意である.また,高次効果は,

仮 説: 02

0 r:H , 02

1 r:H に対し,

棄却域: 2930501534730 ..;,F.VVF elof

となり有意となった.

すなわち,表 19.11のデータに対して回帰直線は有意であるが,回帰直線のみなら

ず当てはまりの悪さ(高次回帰 lof )有意であり,2次以上を持つ回帰曲線の推定が

必要であることを意味している.

(2)回帰直線の推定

回帰係数 0610

601 .

S

xx

xy

切片 768020678010 ....xˆyˆ

ただし, 78020

1614.

N

Ty , 02

20

401 .N

xn

x

l

i

ii

よって,推定される回帰直線は,

単回帰第 1モデル iii x..xˆˆˆ 0676810

または,単回帰第 2モデル 0206780 10 .x..xxˆ'ˆˆiii

と推定される.

【蛇足2】

本例題2を作成した Original Soft「CROManalysis302.zip」を解凍し,インストール後

「直交多項式 Ver3.02」を利用した解析結果の画面を図 19.8~図 19.12に示す.

-323-

図 19.8 直交多項式 Ver3.02解析結果

図 19.9 直交多項式 Ver3.02解析結果

直交多項式による解析では,因子 Aの水準は 5 水準あり xについては 4 次まで分解可能

であり,その分散分析の結果は図 19.9 である.3 次以上の高次回帰は有意と判定されない

のでプーリングすると図 19.10の結果を得る.

-324-

図 19.10 直交多項式 Ver3.02解析結果

図 19.11 直交多項式 Ver3.02解析結果

-325-

直交多項式の解析で推定される回帰曲線は図 19.11より直交回帰係数を用いると,

直交多項式モデル

22

2

21012

1c

axxbxxbbˆ

iii ただし,a:水準数,c:水準間隔

2

2

22

2

428611714451699928

530442861101206780

5012

15024286110206780

ii

iii

ii

x.x..

.x.x..x..

..x..x..

また,図 19.11より回帰係数を用いると,

曲線回帰モデル

2

210 iii xˆxˆˆˆ 2428611714351728 ii x.x..

となる.回帰曲線は図 19.12 となり,特性を最大とする条件は水準の指定値 262.x のと

き,点推定値 87.2018,信頼上限 91.8402,信頼下限 82.5634と推定される.

図 19.12 直交多項式 Ver3.02解析結果

-326-

【蛇足3】

本例題2を作成した Original Soft「CROManalysis302.zip」を解凍し,インストール後

「重回帰分析 Ver3.02」を利用した解析結果の画面を図 19.13~図 19.15に示す.

重回帰では,重回帰モデルを, 2

210 iii xx

と表し,分散分析の結果,図 19.13 より回帰による効果は有意となり,偏回帰係数は 0 ,

1 ,2 の推定値は図 19.14より,

2428611714351728 iii x.x..ˆ

と推定される.また, 000 :H の仮説検定では有意であり,それぞれ偏回帰係数1 ,

2

の 95%信頼限界は,

1 :信頼上限 81.9431,信頼下限 21.4854

2 :信頼上限 -3.9527,信頼下限 -18.9045

であることがわかる.

図 19.13 重回帰分析 Ver3.02解析結果

-327-

図 19.14 重回帰分析 Ver3.02解析結果

図 19.15 重回帰分析 Ver3.02解析結果

-328-

例題 2 の表 19.11 データ表の散布図を図 19.16 に示す.散布図を検討することにより回

帰直線の当てはめが妥当か?回帰曲線の当てはめが妥当か?グラフからの解釈も含めて判

断することが望ましい.

図 19.16 例題 2のデータの散布図

また,回帰直線および回帰曲線が技術的に理論式に合致するかなど回帰係数の検定,推定

も検討が可能である.QCツールの七つ道具にグラフ(総称)があるデータの見える化も不

可欠である.

-329-

第19章 Excel演習問題

【問題 19-1】

ある建設(株)では,コンクリートの圧縮強度を確保するために添加剤を使用している.こ

の添加剤 Aの添加量 xと圧縮強度 y との間には次の直線関係があることがわかっている.

x..y 2611230 (ただし, 3010 x )

先般,コスト低減に寄与する添加剤が開発された.この添加剤の効果を把握するため新添

加剤の添加量を従来の水準範囲 5 水準で変化させ繰返し 4 回計 5×4=20回の実験をランダ

ムに実施し圧縮強度のデータを得た.表 19-1-1 にデータ表を示す.データは数値変換して

あり単位は省略してある.

表 19-1.1 圧縮強度のデータ表(単位省略)

因子 1A 2A 3A

4A 5A

水準値 ix 10 15 20 25 30

238 248 261 266 271

データ特性 240 244 256 270 278

ijy 246 252 252 260 274

245 251 263 262 268

次の設問に答えよ.

(1)測定データより散布図および従来の回帰直線を描き考察せよ.

(2)圧縮強度 y は,添加剤の添加量 xと直線関係にあるかを有意水準 5%で検定し,新し

い回帰直線を推定せよ.

(3)従来の回帰直線は,新しい回帰直線とそれぞれの回帰母数が異なるかを有意水準5%

で検定せよ.また,それらの回帰母数の信頼率 95%信頼限界を求めよ.

(4)新しい回帰直線を用いて, 10ix (キザミ 2)30における特性 i の推定値および信頼

率 95%信頼限界を求めよ.

参 考 文 献

1) 新編日科技連:数値表-第 2版-,日科技連出版社(2012)

2) 安藤貞一,朝尾正編:実験計画法演習,日科技連出版社(1985)

3) 安藤貞一,松村嘉高著:技術者のための統計的品質管理入門,共立出版株式会社

(1981)

4) 安藤貞一監修,朝尾正,二見良治,坂元保秀著:ザ・SQCメソッドによる統計的

方法の実践Ⅱ-実験計画法編-,共立出版株式会社(1996)

5) 安藤貞一,田坂誠男著:実験計画法入門,日科技連出版社(1986)

6) 二見良治,西敏明著:課題解決のための実験計画法Ⅰ,Ⅱ,日科技連出版社(2001)

7) 朝木善次郎著:実験計画法,共立出版株式会社(1983)

8) 朝尾正,安藤貞一,楠正,中村恒夫著:最新実験計画法,日科技連出版社(1973)

9) 石川馨,中里博明,松本洋,伊東静男著:改訂版初等実験計画法テキスト,日科

技連出版社(1979)

Excel プログラムシートの Sample DATA は,以上の参考文献の例題等のデータを

利用させていただきました.

10) 統計数値表編集員会編:簡約統計数値表,日本規格協会(1977)

11) 日科技連QCリサーチ・グループ編:統計理論,日科技連出版社(1969)

12) 近藤良夫,舟阪渡共編:技術者のための統計的方法,共立出版株式会社(1967)

13) 小西省三著:例解演習実験計画法,日刊工業新聞社(1969)

14) 田口玄一著:最新実験計画法-上・下-,丸善株式会社(1962)

15) 福田次郎著:例解演習応用統計入門,日刊工業新聞社(1968)

16) 石川馨,米山高範著:分散分析法入門,日科技連出版社(1979)

17) 永田靖著:入門統計解析法,日科技連出版社(1992)

18) 安部季夫著:直交表実験計画法,日科技連出版社(1993)

19) 楠正,辻谷将明,松本哲夫,和田武夫著:応用実験計画法,日科技連出版社(1995)

20) 中里博明,川崎浩二郎,平栗昇,大滝厚著:品質管理のための実験計画法テキス

ト,日科技連出版社(1996)

21) 永田靖著:統計的方法のしくみ,日科技連出版社(1996)

22) 安藤貞一監修,朝尾正,二見良治,坂元保秀著:ザ・SQCメソッドによる統計的

方法の実践Ⅰ-QC七つ道具編-,共立出版株式会社(1996)

23) 近藤良夫,安藤貞一編:統計的方法百問百答,日科技連出版社(1970)

24) 富士ゼロックス(株)QC研究会編:実験計画法問答集,日本規格協会(1989)

25) 松本哲夫監修:実験計画法 100問 100答,日科技連出版社(2013)