1서론 2 일원배치법 3 이원배치법 4 spss를 이용한...

52
1 서론 2 일원배치법 3 이원배치법 4 SPSS를 이용한 실습 9장 분산분석

Upload: others

Post on 28-Feb-2020

7 views

Category:

Documents


0 download

TRANSCRIPT

1 서론

2 일원배치법

3 이원배치법

4 SPSS를 이용한 실습

9장 분산분석

뚜껑만 비꿨을 뿐인데 . . . . 2015. 12. 1

서론

우리는 흔히 어떤 속성이 여러 조건에 처해졌을 때 차이가 나는지에대하여 관심을 가진다.온도에 따른 화학공정의 생산성의 차이, 농도에 따른 직물의 인장강도의 비교 등이 관심의 대상일 경우가 많다.

분산분석(analysis of variance : ANOVA)은 실험계획법(experimental design)에서 가장 많이 사용되는 분석방법으로서, 특성값의 분산 또는 변동을 분석하는 방법이다. 즉, 특성값의 변동을제곱합으로 나타내고, 이 제곱합을 실험에 관련된 요인별로분해하여, 오차에 비해 큰 영향을 주는 요인이 무엇인가를 찾아내는 분석방법이다.

- 일원배치법(One-Way ANOVA), 이원배치법(Two-Way ANOVA)등이 있다.

서론

Ex) 여러 공법에 의하여 생산되는 금속가공품의 인장강도를 비교하기 위하여 실험을 한다.

인장강도는 특성값이 되고 공법은 하나의 요인이 된다. 특성값의 변동을 나타내는 제곱합(총제곱합,totals sum of squares;SSTO)은공법에 의하여 일어나는 제곱합(요인에 의한 제곱합, treatments sum of squares; SSTr)과 요인이외의 작업자들의 작업능률의 차이에 의한 변동 같은 오차라는 요인의 제곱합(오차에 의한 제곱합, errors sum of squares; SSE)으로 분해할 수 있다.

일원배치법(ONE-Way ANOVA)

일원배치법(one-way factorial design)은 특성값에 대한 한 종류의 인자만의 영향을 조사하고자 할 때 사용하는 방법.

특징

(1) 수준 수와 각 수준에서 취하여지는 측정치의 반복수에는 별로 제한이 없다. 그러나 수준수는 3~5수준, 반복수는 3~10 정도가 많

이 사용된다.

(2)반복수가 모든 수준에 대하여 같지 않아도 좋다. 따라서 결측치(missing value)가 있어도 이를 추정하여 넣어 줄 필요가 없으며 그대로 해석할 수 있다.

(3)실험의 측정은 실험의 전체를 완전히 랜덤화하여 모든 특성치를 랜덤한 순서에 의하여 구해 주어야 한다.

반복수가 같은 일원배치법 (예)

예제 9.1) 어느 공장에서 제품을 생산하는데 열처리 온도에 따라서 제품의 강도가 차이를 보이는지를 조사하기 위하여 열처리 온도를A1=125℃, A2=150℃, A3=175℃, A4=200℃로 변화시키고, 각 열처리 온도에서 6개의 제품을 표본으로 추출하고 강도를 측정한 결과다음의 자료를 얻었다. 제곱합의 분해 과정을 상세히 보여라.

온도 125℃ 150℃ 175℃ 200℃

제품의강도

23 35 36 32

27 32 41 30

24 38 38 37

25 36 39 34

29 32 40 35

30 33 38 34

일원배치법

일원배치법을 계획할 때에는 완전랜덤화 계획을 세워서 실험을 진행하여야 한다. 그래서 일원배치법을 완전랜덤화계획법(completely randomized design)이라고도 부른다.

가장 간단한 완전랜덤화 계획은 각 실험단위에 번호를 부여하고 난수표 등을 사용하여 먼저 나오는 번호 순서대로 실험을 할 수 있다.

A1 A2 A3 A4

실험의반복

1 1 6 11 16

2 2 7 12 17

3 3 8 13 18

4 4 9 14 19

5 5 10 15 20

반복수가 같은 일원배치법

인자 A의 수준이 k개 있고 각 수준에서 반복수가 똑같이 n개인 일원배치법의 데이터는 아래 표와 같이 배열하는 것이 편리하다.

위의 표에서 사용된 합계와 평균의 기호는 다음과 같다.

nyyyy i

i

n

iiji

..

1.

knyyyy

k

i

n

jij

....

1 1..

처리1(A1) 처리2(A2) … 처리k(Ak)

실험의반복

y11 y21 … yk1

y12 y22 … yk2

… … … …

y1n y2n … ykn

합계 y1. y2. … yk. y..

평균…

.1y .2y .ky..y

반복수가 같은 일원배치법

반복수가 같은 경우 일원배치법의 통계적 모형은 아래와 같다.

일원배치법의 통계적 모형(반복수가 같은 경우)

eij~N(0,σ2)이고, 서로 독립

μ=실험전체의 모평균αi=i번째 처리가 주는 주효과eij=i번째 처리의 j번째 반복에서 얻은 측정값의 오차

01

k

ii

njkieY ijiij ,,2,1,,2,1,

반복수가 같은 일원배치법

① 정규성 : 오차 eij는 정규분포를 따른다.

② 독립성 : 임의의 eij와 ei'j' (i≠i’ 또는 j≠j’)는 서로 독립이다.

③ 비편향성 : 오차 eij의 기대값은 0이다.

④ 등분산성 : 오차 eij의 분산은 σ2으로 어떤 i,j에 대해서도 일정하다.

앞의 모형에 나타나 있는 오차 eij는 Ai 에서 j 번째 측정된 yij가 수반하는 오차로서 확률변수이며 다음과 같은 성질을 가진다.

(1) eij 는 랜덤으로 변하는 값이며 모평균은 0이고 분산은 σ2이다.(2) eij 는 정규분포 N(0,σ2)으로부터 확률추출된 것이라고 가정한다. 이

가정은 다음 장의 4가지를 구체적으로 의미하고 있다.

반복수가 같은 일원배치법

K개의 처리효과 간에 유의한 차이가 있는지를 검정하기 위해 먼저 총제곱합을 처리제곱합과 오차제곱합으로 분해하자.

관측값 yij와 총평균 과의 차인 총편차 를 분해하면

로 나타낼 수 있다. 이것의 양변을 제곱하여 정리하면 다음이 성립한다.

)()()( ...... iijiij yyyyyy

SSESStrSST

yyyyyyk

i

n

jiij

k

i

n

ji

k

i

n

jij

1 1

2.

1 1

2...

1 1

2.. )()()(

좌변을 총제곱합(SST)이라고 하고, 우변의 첫째 항은 각 수준의 효과차이로 인한 변동이므로 처리제곱합(SStr)이라 하고, 우변의 둘째 항은 각 수준 내에서의 편차의 제곱합이므로 잔차제곱합 또는 오차 제곱합(SSE)이라 한다.

..y ..yyij

반복수가 같은 일원배치법

실제로 관측값으로부터 SST, SStrt, SSE를 계산할 때에는 다음과같은 공식을 사용하면 간편하다.

k

i

n

j

k

i

n

jijij

k

i

n

jij

ykn

y

yySST

1

2

1 1 1

2

1

2

1

1

)..(

2

1 11

2

.

1

2...

1

2

1.

1

)()..(

k

i

n

jij

k

ii

k

ii

k

i

n

ji

ykn

yn

yynyySStr

SStrSST

ykn

ynykn

y

ynyyySSE

k

i

n

jij

k

ii

k

i

n

jij

k

i

n

jij

k

ii

k

i

n

jij

k

i

n

jiij

2

1 11

2

.

2

1 11 1

2

1

2

.1 1

2

1 1

2

.

11

반복수가 같은 일원배치법

예제 9.1) 어느 공장에서 제품을 생산하는데 열처리 온도에 따라서 제품의 강도가 차이를 보이는지를 조사하기 위하여 열처리 온도를A1=125℃, A2=150℃, A3=175℃, A4=200℃로 변화시키고, 각 열처리 온도에서 6개의 제품을 표본으로 추출하고 강도를 측정한 결과다음의 자료를 얻었다. 제곱합의 분해 과정을 상세히 보여라.

온도 125℃ 150℃ 175℃ 200℃

제품의강도

23 35 36 32

27 32 41 30

24 38 38 37

25 36 39 34

29 32 40 35

30 33 38 34

반복수가 같은 일원배치법

풀이)인자의 수준

A1 A2 A3 A4

실험의반복

23 35 36 32

27 32 41 30

24 38 38 37

25 36 39 34

29 32 40 35

30 33 38 34

합계 158 206 232 202 798

평균 26.33 34.33 38.67 33.67 33.25

오차효과수준의각총편차

...... iijiij yyyyyy

333.0667.0333.1667.3333.1333.1333.2667.2333.0333.0667.1333.1333.3667.0667.3333.2667.3333.2333.2667.0667.1667.2667.0333.3

417.0417.5083.1917.6417.0417.5083.1917.6417.0417.5083.1917.6417.0417.5083.1917.6417.0417.5083.1917.6417.0417.5083.1917.6

75.075.425.025.375.175.625.125.475.075.575.225.875.375.475.425.925.375.725.125.625.175.275.125.10

반복수가 같은 일원배치법

제 1행 1열의 값은 다음과 같이 계산되었다.

제곱합의 정의에 따라 제곱합을 계산하면 다음과 같다.

)333.3()917.6()25.10()333.2623()25.33333.26()25.3323(

......

iijiij yyyyyy

5.584)75.0()25.6()25.10(

)(

222

4

1

6

1

2..

i jij yySST

167.471])01.0()63.0()51.0()49.0[(6

)(6

2222

4

1

2...

i

i yySStr

333.113)333.0()667.0()333.3(

)(

222

4

1

6

1

2.

i jiij yySSE

반복수가 같은 일원배치법

실무에서 제곱합을 계산할 때에는 공식의 마지막 식을 사용하는 것이더욱 편리하다.

5.2653324

)798( 2

24

1

3

12..

N

y

Ny i j

ij

5.5845.26533)34()27()23( 222

2..

4

1

3

1

2

NyySST

i jij

167.471

5.26533])202()232()206()158[(61 2222

2..

4

1

2.

N

ykySStr

j

i

333.133167.4715.584 SStrSSTSSE

반복수가 같은 일원배치법

제곱합의 자유도는 제곱을 한 편차의 개수에서 편차들의 선형제약조건의 개수를 뺀 것과 같다.

제곱합의 자유도 = (더해진 편차의 수)-(선형제약조건의 수)

관측값의 총개수를 N=kn이라 하면, 총제곱합엣는 N개의 편차제곱이 있고, 선형제약조건으로 이 하나 있으므로, 총제곱합의 자

유도는 (N-1)이 된다.

다른 두개의 제곱합에 대해서도 같은 방법을 적용시키면 처리제곱합의 자유도는 (k-1), 오차제곱합의 자유도는 (N-k)가 된다.

일반적으로 제곱합을 각각에 대응하는 자유도로 나눈 것을 평균제곱이라 한다. 즉,

이다. 따라서, 처리에 대한 평균제곱(MStr)과 오차에 대한 평균제곱(MSE)은각각 다음과 같이 나타낸다.

2)..( yyij

0)..(1 1

2

k

i

n

jij yy

자유도

제곱합평균제곱

반복수가 같은 일원배치법(복습) 반복수가 같은 경우 일원배치법의 통계적 모형은 아래와 같다.

일원배치법의 통계적 모형(반복수가 같은 경우)

eij~N(0,σ2)이고, 서로 독립

μ=실험전체의 모평균αi=i번째 처리가 주는 주효과eij=i번째 처리의 j번째 반복에서 얻은 측정값의 오차

01

k

ii

njkieY ijiij ,,2,1,,2,1,

반복수가 같은 일원배치법 (복습)

예제 9.1) 어느 공장에서 제품을 생산하는데 열처리 온도에 따라서 제품의 강도가 차이를 보이는지를 조사하기 위하여 열처리 온도를A1=125℃, A2=150℃, A3=175℃, A4=200℃로 변화시키고, 각 열처리 온도에서 6개의 제품을 표본으로 추출하고 강도를 측정한 결과다음의 자료를 얻었다. 제곱합의 분해 과정을 상세히 보여라.

온도 125℃ 150℃ 175℃ 200℃

제품의강도

23 35 36 32

27 32 41 30

24 38 38 37

25 36 39 34

29 32 40 35

30 33 38 34

F-검정

평균들의 동일성에 대한 F검정

검정통계량 :

기각역 :

. :,0: 01210 아니다가HHH k

MSEMStrF 0

. ),1( ),1(0

점이다인상위분포의는여기서

FkNkFkNkFF

지금까지의 결과를 분산분석표로 나타내면 아래와 같이 요약할 수 있다.

< k개의 처리에 대한 분산분석표(ANOVA) >

요인 제곱합 자유도 평균제곱 F0값 P-값

처리 SStr K-1 MStr MStr/MSE P{F≥F0}

오차 SSE N-k MSE

계 SST N-1

반복수가 같은 일원배치법

예제 9.2) 앞의 예제 9.1의 데이터에 대하여 유의수준 α=0.05에서 분산분석표에 의한 F-검정을 행하라.

풀이) 귀무가설 H0:α1=α2=…=α4를 검정한 결과 아래와 같은 분산분석표를 얻을 수 있다.

요인 제곱합 자유도 평균제곱 F0값 P-값

처리 471.167 3 157.056 27.716* 0.00001

오차 113.333 20 5.667

계 584.5 23

즉 검정통계량 F0의 값은 27.716으로서 유의수준 0.05에서의 기각값 3.10보다 매우 크므로 귀무가설 H0를 기각한다. 이상의 결과로서열처리 온도 A는 유의수준 0.05로 수준 간에 차이가 있고, 반응온도는 강도에 영향을 미치는 것이 확실하다.

다중신뢰구간(Multiple Confidence)

• 일원배치법에서 데이터의 분석에 있어서 분산분석표를 작성하고F-검정을 실시하는 것으로 그치면 충분히 데이터를 활용하였다고볼 수 없다.

• 인자의 수준 간에 유의차가 있다고 F-검정에 의하여 인정되는 경우=> 다음 과정 무엇인가??

1)각 수준마다 모평균을 추정하거나,

2) 2개의 수준의 모평균의 차를 추정하거나,

또는 3) 처리 간에 평균의 차이가 있는 것과 그렇지 않은 것을 찾아내는 것이 더 중요한 과제라고 할 수 있다. 그럼 지금부터 평균 차의 신뢰구간을 어떻게 구할 수 있는지를 알아보도록 하자.

다중신뢰구간(Multiple Confidence) 인자의 수준 간에 유의차가 있다고 F-검정에 의하여 인정되는 경우에

는, 각 수준마다 모평균을 추정하거나, 2개의 수준의 모평균의 차를추정하거나, 또는 처리 간에 평균의 차이가 있는 것과 그렇지 않은 것을 찾아내는 것은 어떻게?

인자 A의 i수준에서의 모평균 μi=μ+αi의 추정문제i수준에서 n개의 데이터, yij,j=1,2,…,n은 정규분포 N(μi,σ

2)에서얻어진 크기 n의 확률표본이라 볼 수 있다.

여기서 i수준에서의 표본평균 를 구하면

가 되고 이므로 그 기대값은

가 된다. 따라서 μi=μ+αi의 비편향 추정량은 아래와 같다.

.iy

.. iii eY 0. ieE

iiYE .

.ˆ ii Y

1) 다중신뢰구간 (개별신뢰구간) -컴퓨터

의 분산은

σ2의 비편향추정값으로 MSE를 사용하면 통계량

는 자유도가 (N-k)인 t-분포를 따른다. 따라서 μi의 100(1-α)% 신뢰구간을 구하면 아래와 같다.

.iY

n

eVar

eVarYVar

i

iii

2.

..

)(

)()(

nMSEYt ii

/.

nMSEkNtYi /)(2/.

2) 다중신뢰구간 (개별평균차) -컴퓨터

인자의 두 수준 i와 I’(i≠I')에서의 모평균의 차 μi-μi’=αi-αi'

두 개의 수준 Ai와 Ai'의 각 표본평균의 차를 구하면

가 되는데, 그 기대값은

이므로 μi-μi’의 점추정량은 가 된다. 이 추정량의 분산은

이 된다. σ2의 추정값으로 MSE를 사용하면 통계량

는 자유도가 N-k인 t-분포를 따른다.따라서 (μi-μi')의 100(1-α)% 신뢰구간은 아래와 같다(개별평균차).

.... ''' iiiiii eeYY

'' )( .. iiii YYE

.. 'ii YY 2

....2)()()( '' n

YVarYVarYYVar iiii

MSEn

YYt iiii

2)()( '' ..

nMSEkNtYY ii

2)()( 2/.. '

다중신뢰구간

F-검정이 유의적이라는 단서가 없더라도 위의 방법에 의하여 평균 차에 대한 각각의 신뢰구간을 구할 수 있다.

예를 들면, 4개의 처리가 있는 경우라면, 쌍의 평균 차 μi-μi'

을 생각할 수 있고, 위의 방법에 의해 이들 6쌍 각각에 대해 100(1-α)%신뢰수준을 갖는 신뢰구간을 구할 수 있다.

어느 정도의 신뢰수준에서 이 6개의 신뢰구간이 동시에 타당한가를결정하는 것은 쉬운 일이 아니다.

여러 개의 신뢰구간들이 동시에 타당하게 되는 결합확률이 미리 정해진 수주보다 낮지 않도록 하는 방법으로 여러 개의 신뢰구간을 구하는방법이 제기되었다, 그러한 신뢰구간을 다중신뢰구간(multiple confidence interval)이라 한다.

624

3) 다중신뢰구간 (m개의 수준 평균차) -컴퓨터

<다중 t 신뢰구간 >

m개의 평균차 μi-μi'에 대한 100(1-α)% 다중신뢰구간은 다음과같다.

여기서 m은 신뢰구간의 개수이고 tα/2m(N-k)는 자유도가 N-k인 t분포의 상위 α/(2m)인 점이다. 이 방법에 의하여 설정된 m개의 신뢰구간이 모두 타당하게 될 확률은 1-α이다.

예제 9.3) 예제 9.1에서1)각 수준 Ai , i=1,2,3,4의 모평균에 대한 95% 신뢰구간을 구하고, 2)모든 두 수준간의 모평균 차의 90% 다중 신뢰구간을 구하라.

nMSEkNtYY mii

2)()( 2/.. '

다중신뢰구간풀이) 예제 9.1의 표와 예제 9.2의 분산분석표의 값을 신뢰구간 공식에 대

입하면 신뢰구간의 폭은

이다. 따라서 1) 각 수준의 모평균의 신뢰구간은 다음과 같다.

2) 모평균 차의 신뢰구간의 신뢰폭을 먼저 구하면

이므로 모든 수준의 모평균 차에 대한 신뢰구간은 다음과 같다.

0273.29445.0086.26667.5)20(025.0 t

)694.35,639.31(027.2667.33:)694.40,639.36(027.2667.38:)361.36,306.32(027.2333.34:)361.28,306.24(027.2333.26:

4

3

2

1

591.3889.1613.26667.5)20(00833.0 t

)591.8,409.1(591.3)667.33667.38(:)743.3,925.10(591.3)667.33333.26(:)2579.4,925.2(591.3)667.33333.34(:)743.8,925.15(591.3)667.38333.26(:)743.0,925.7(591.3)667.38333.34(:)409.4,591.11(591.3)333.34333.26(:

4341

4231

3221

반복수가 다른 일원배치법 실제의 일원배치법에서는 처리의 어떤 특정한 수준에 대하여 모평균

추정의 정도(precision)를 높이기 위해 반복수를 다른 수준보다 많게 하거나, 측정에 실패하거나 결측치가 발생하여 처리에 따라 같은수의 표본을 얻지 못하는 경우가 발생한다.

처리1 처리2 … 처리k

y11 y21 … yk1

y12 y22 … yk2

… … … …

y1n1 y2n2 … yknk

합계 y1. y2. … yk. y..

평균 …

전체 관측값의 개수를 라 하면, 평균과 합계의 기호는 다음과같다.

kinyyyy iii

n

jiji

i

,,2,1/, ..1

.

Nyyyyk

i

n

jij

i

/..,1

..1

..

.1y .2y .ky ..y

n

iinN

1

반복수가 다른 일원배치법

반복수가 다른 경우 일원배치법의 통계적 모형은 다음과 같다.

일원배치법의 통계적 모형(반복수가 다른 경우)

eij~N(0,σ2)이고, 서로 독립μ=실험전체의 모평균

=i번째 처리가 주는 주효과eij=i번째 처리의 j번째 반복에서 얻은 측정값의 오차

01

k

iiin

iijiij njkieY ,,2,1,,2,1,

i

반복수가 다른 일원배치법

관측값 yij와 총평균 과의 차인 총편차 를 분해하면

이 되어 이것의 양변을 제곱하여 정리하면 다음이 성립한다.

..y ..yyij

)()()( ...... iijiij yyyyyy

Nyy

yySST

k

i

n

jij

k

i

n

jij

k

i

n

jij

ii

i

/

)(

2

1 11 1

2

1 1

2..

Nyny

yyn

yySStr

k

i

n

jij

k

i i

i

k

iii

k

i

n

ji

i

i

/

)(

)(

2

1 11

2.

1

2...

1 1

2...

SStrSST

yny

yySSE

k

iii

k

i

n

jij

k

i

n

jiij

i

i

1

2.

1 1

2

1 1

2..

)(

)(

반복수가 다른 일원배치법

제곱합 SST, SStr, SSE와 관련된 자유도는 각각 N-1, k-1, N-k가 된다. 그러므로, 평균제곱은 다음과 같이 주어진다.

1

kSStrMStr

kNSSEMSE

따라서, 반복수가 다른 일원배치법의 처리효과의 유의성 검정은 다음과 같이 요약할 수 있다.

< 평균들의 동일성에 대한 F-검정 >

H0:α1=α2=…=αk=0, H1: H0가 아니다.

검정통계량 :

기각역 : F0≥Fα(k-1,N-k)

MSEMStrF 0

반복수가 다른 일원배치법

반복수가 다른 일원배치법의 분산분석표

요인 제곱합 자유도 평균제곱 F0값 p-값

처리 SStr k-1 MStr MStr/MSE P{F≥F0}

오차 SSE N-k MSE

계 SST N-1

반복이 있는 일원배치법에서와 유사한 방법으로 모평균 및 모평균 차의 신뢰구간을 구할 수 있다.

모평균 μi의 100(1-α)% 신뢰구간은

이다. 그리고 모평균 차 μi-μi'의 100(1-α)% 신뢰구간은 다음과같다.

ii nMSEkNtY /)(2/.

'

'

11)()( 2/..ii

ii nnMSEkNtYY

반복수가 다른 일원배치법

예제 9.4) 4가지 교육방법의 효과를 비교분석하기 위하여 학생 40명을 무작위로 10명씩 4개 집단으로 나누고 한 학기 동안 각 교육방법으로 교육을 실시한 후에 치른 기말시험이 다음의 자료와 같다. 학기 중 여러사정에 의하여 기말시험을 치르지 못한 학생들 때문에 각 조의 자료의수가 같지 않다. 분산분석을 실시하라.

교육방법 1조 2조 3조 4조

기말고사성적

65 75 59 94

87 69 78 89

73 83 67 80

79 81 62 88

81 72 83

69 79 76

90

반복수가 다른 일원배치법풀이) 가설 H0:α1=α2=…=α4=0, H1:H0가 아니다를 검정하기 위해서

제곱합을 계산하면,n1=6, n2=7, n3=6, n4=4

요인 제곱합 자유도 평균제곱 F0값

처리 712.59 3 237.53 3.77

오차 1196.63 19 62.98

전체 1909.22 22

F0.05(3,19)=3.13이므로 유의수준 α=0.05에서 귀무가설이 기각된다.

78.13760123

)1779( 2

4

1 12..

N

y

Ny i

n

jij

i

22.190978.137601)88(...)87()65( 2222..

4

1 1

2 N

yySSTi

n

jij

i

59.71278.1376014

)351(6

)425(7

)549(6

)454( 22222..

4

1

2.

Ny

nySStr

j i

i

63.119659.71222.1909 SStrSSTSSE

즉, 4가지 교육방법에 차이가 존재한다.=>다중비교가 필요하다 !!

후쿠다 보고서’ 필자 후쿠다 다미오 인터뷰

- 보고서 읽은 이건희 회장 "처자식 빼고 다 바꿔" - “디자인 경영자원화 … 삼성은 실천했고 일본은 말만 했다”

- 이건희 회장 신경영 촉발 (1993. 6. 7, 200명 임원)

- 왜 보고서를 만들 생각을 했나.“제조업에서 디자인은 기획이나 설계와 관련이 깊다. 기업은 혁신을 창조해 경쟁회사를 이길 상품

개발 프로젝트를 수행하는 곳이다. 경영진과 디자인 부서가 서로를 모르는 것은 문제가 있다고 봤다. 당시만 해도 삼성 내부에는 업무비효율, 정보 공유 부족, 타 부서에 대한 이해 부족, 명확하지 않은 역할 분담 같은 문제가 있었다.”

- 보고서의 핵심은.“두 가지다. 하나는 디자인에 관한 프로세스 개선과 사고방식의 혁신이었고 또 다른 하나는 회사

전체에 대한 개선과 제안이었다.”

즉, 기획부터 생산까지의 전 과정에 디자인이 함께하는 방식으로 변신했다는것이다.

이원배치법

반복실험이 없는 이원배치법

2개의 인자를 A, B로 표시하고, 각각 p,q개의 수준을 갖고 있다고 하자. 이원배치법에서 완전랜덤화 계획은 pq회의 실험을 랜덤하게 선택된 순서에 의하여 시행하는 것이다.

B1 … Bj … Bq 합계 평균

A1 y11 … y1j … y1q y1.

… … … … … … … …

Ai yi1 … yij … yiq yi.

… … … … … … … …

Ap yp1 … ypj … ypq yp.

합계 y.1 … … y.q y..

평균 … …1.y1.y

1.y1.y 1.y 1.y

1.y1.y

1.y

1.y

p

i

q

jij

p

i

q

jij

p

iijj

p

iijj

q

jiji

q

jiji

ypq

yyy

qjyp

yyypiyq

yyy

1 1..

1 1..

1.

1.

1.

1.

1

,2,11,,2,11

이원배치법

이원배치법의 통계적 모형(반복이 없는 경우)

eij~N(0,σ2)이고 서로 독립μ=실험전체의 모평균αi=Ai가 주는 주효과βj=Bj가 주는 주효과yij=Ai와 Bj에서 얻은 측정값eij=Ai와 Bj에서 얻은 측정값의 오차

qjpieY ijjiij ,,2,1,,2,1,

이원배치법

관측값 yij와 총평균 과의 차인 총편차 는 다음과 같이 세 부분으로 나누어진다.

양변을 제곱하여 정리하면 다음이 성립함을 알 수 있다.

즉 총변동 SST는 A에 의한 변동(SSA), B에 의한 변동(SSB), 오차에 의한 변동(SSE)으로 나누어서 해석되어진다.

..y ..yyij

)()()()( ............ yyyyyyyyyy jiijjiij

)()(

)()(

)(

)()()(

2

1 1....

1

2...

1

2...

1

2

1..

SSEyyyy

SSyyp

SST

SSyyqyy

p

i

q

jjiij

B

q

jj

A

p

ii

p

i

q

jij

이원배치법

실제 데이터로부터 변동을 계산할 때에는 좀 더 간편한 공식으로 다음을 이용하는 것이 편리하다.

SST,SSA,SSB,SSE의 자유도는 pq-1, p-1. q-1, (p-1)(q-1)위의 제곱합과 자유도를 가지고 평균제곱을 구하면

MSA=SSA/(p-1)MSB=SSB/(q-1)MSE=SSE/(p-1)(q-1)

pqyy

yySST

p

i

q

jij

p

i

q

jij

p

i

q

jij

/

)(

2

1 11 1

2

1 1

2..

pqyqy

yySS

p

i

q

jij

p

ii

p

i

q

jiA

//

)(

2

1 11

2.

1 1

2...

pqypy

yySS

p

i

q

jij

q

ij

p

i

q

jjB

//

)(

2

1 11

2.

1 1

2...

BA

p

i

q

jjiij

SSSSSST

yyyySSE

1 1

2.... )(

이원배치법

인자 A와 인자 B의 각각의 효과에 대한 유의성 검정은 다음과 같이요약할 수 있고 얻어진 분산분석 표는 아래와 같다.

효과의 유의성 검정(반복실험이 없는 이원배치법)

인자 A 인자B

귀무가설 : H0:α1=…=αp=0 H0:β1=…=βq=0

검정통계량 :

기각역 : F1≥Fα(p-1,(p-1)(q-1) F2≥Fα(q-1,(p-1)(q-1))

요인 제곱합 자유도 평균제곱 F값 P-값

인자 A SSA p-1 MSA F1=MSA/MSE P{F≥F1}

인자 B SSB q-1 MSB F2=MSB/MSE P{F≥F2}

오차 SSE (p-1)(q-1) MSE

계 SST pq-1

MSEMSF A1 MSE

MSF B2

이원배치법

예제 9.5) 섬유에 대한 방수처리를 하는데, 네 가지 화학약품A1,A2,A3,A4의 효과를 비교하기 위하여 세 가지 서로 다른 섬유로부터 각각 크기가 동일한 네 개의 조각을 잘라서 네 가지 화학약품의 처리를 랜덤한 순거로 가한 후 물을 붓고 5분 후에 측정한 습도가 다음과 같다. 네 가지 화학약품과 세 가지 다른 섬유가 방수처리에 유의한영향을 미치는가의 여부를 유의수준 0.05에서 검정하라.

A1 A2 A3 A4

1 10.1 11.4 9.9 12.1

2 12.2 12.9 12.3 13.4

3 11.9 12.7 11.4 11.4

이원배치법

풀이) 인자 A와 인자 B의 귀무가설은 각각 H0:α1=…=α4, H0:β1=…=β3인데 이를 검정하기 위해서 제곱합을 계산하면,

07.1224.167331.168524.1673)4.11()2.12()1.10(

)34/(

222

24

1

3

1

4

1

3

1

2

i jij

i jij yySST

16.324.16734.1676

24.1673])9.36()6.33()37()2.34[(31

)34/(3/

2222

24

1

3

1

4

1

2.

i jij

iiA yySS

67.624.167391.1679

24.1673])4.47()8.50()5.43[(41

)34/(4/

222

24

1

3

1

3

1

2.

i jij

ijB yySS

24.267.616.307.12 BA SSSSSSTSSE

24.167312

)7.141()34/(22

4

1

3

1

i j

ijy

이원배치법

분산분석표

요인 SS d.f MS F

인자 A 3.16 3 1.053 2.823

인자 B 6.67 2 3.335 8.941

오차 2.24 6 0.373

전체 12.07 11

Fa=2.823, Fb=8.941이고 F0.05(3,6)=4.76, F0.05(2,6)=5.14Fa=2.823<F0.05(3.6)=4.76이고 Fb=8.941>F0.05(2,6)=5.14

그러므로 화학약품에 따라서는 방수처리에 차이가 없고 섬유의 종류에 따라서는 통계적으로 유의한 차이가 있다고 할 수 있다.

SPSS를 이용한 실습

예제 9.6) SPSS를 이용하여 예제 9.4의 교육방법의 효과를 분석해 보자.

풀이) 4가지 교육방법에 대한 기말고사 성적을 그림 9,3과 같이 입력한다.

SPSS를 이용한 실습

실행순서

SPSS를 이용한 실습(1) 분산의 동질성 검정

분산분석을 하기 전에 우선 분산의동질성에 대한 검정부터 살펴봐야하는데 유의확률은0.330으로 유의수준 0.05에서 귀무가설(각 집단의 분산이 같다)를 기각하지 못하므로각 집단들의 분산이 같다고 할 수 있다.

(2) 가설검정

4가지 교육 방법에 따른 교육의 효과를 비교하기 위해 분산분석 결과를 살펴 보면 검정통계량(F)이 3.771이고 유의확률이 0.028로 유의수준 0,05보다 작으므로 유의수준0.05에서 귀무가설을 기각하게 된다. 따라서 교육방법에 따라 기말고사의 성적에는 차이가 있다고 할 수 있다.

SPSS를 이용한 실습(3) 사후분석

사후분석 결과 교육방법 4는 교육방법 3, 교육방법 1과 통계적으로유의한 차이가 있다는 것을 알 수 있다.

SPSS를 이용한 실습

예제 9.7) SPSS를 이용하여 앞의 예제 9.5의 네 가지 화학약품과 세 가지 다른 섬유가 방수처리에 유의한 영향을 미치는가를 분석해 보자.

풀이) 4가지 화학약품과 3가지 섬유, 그리고 습도를 아래와 같이 입력한다.

SPSS를 이용한 실습

SPSS를 이용한 실습

실행결과 화학약품의 검정통계량(F)값이 2.830이고 유의확률이0.129로 유의수준 0.05보다 크므로 유의수준 0.05에서귀무가설을기각할 수 없다. 그리고 섬유종류의 검정통계량(F) 값은 8.955이고유의확률이 0.016으로 유의수준 0.05보다 작으므로 유의수준 0.05에서 귀무가설을 기각한다. 따라서 화학약품간에는 방수처리에 차이가 없고 섬유종류에 따라서는 방수처리에 차이가 있다고 할 수 있다.

SPSS를 이용한 실습

섬유종류 1의 습도는 10.875으로 섬유종류 2의 습도 12.7에 비해 수치가 낮아 통계적으로 유의한 차이를 나타내고 있다. 반면, 섬유종류3의 습도는 11.85로 섬유종류 1과 그 어느 종류와도 통계적 차이가없음을 나타낸다.