it.nation.ac.th › faculty › danai › download › statistics talks27... canonical correlation...

14
1 Canonical Correlation Analysis (Cancorr) Canonical correlation analysis เป็นเทคนิคทางสถิติที่ใช้ในการหาความสัมพันธ์ระหว่างตัวแปรสองกลุ่ม กลุ่มแรกจะเป็นกลุ ่มของตัวแปรอิสระ( สมมติประกอบด้วย X1,X2,X3 ) อีกกลุ ่มจะเป็นกลุ่มของตัวแปร ตาม (สมมติประกอบด้วย Y1,Y2,Y3,Y4,Y5) ซึ ่งในแต่ละกลุ ่มอาจจะประกอบด้วยจํานวนตัวแปรไม่เท่ากัน กลไกของcancorr จะอาศัยการสร้างตัวแปรสังเคราะห์ (synthetic variable)หรือที่เรียกว่า variateซึ ่งเป็น linear combination ของตัวแปรในแต่ละกลุ่ม ( ตัวแปรสังเคราะห์ของกลุ ่มตัวแปรอิสระเรียกว่า covariate canonical variable ส่วนตัวแปรสังเคราะห์ของกลุ ่มตัวแปรตามเรียกว่า dependent canonical variable )โดย covariate canonical variable และdependent canonical variable ที่สร้างขึ ้นจะมีความสัมพันธ์เชิงเส้นตรง สูงสุด หากมี varianceที่ยังไม่สามารถอธิบายได้ด้วย variate คู่แรก cancorr จะสร้างตัวแปรสังเคราะห์หรือ variate คู่ต่อไปซึ ่งเป็น linear combination ของตัวแปรในแต่ละกลุ ่มขึ ้นมา และ linear combination ของ variate คู่ใหม่นี ้จะ orthogonal( มีความเป็นอิสระ/ไม่ขึ ้นกัน ) กับ linear combination ของ variate คู่แรก ทีสําคัญก็คือความสัมพันธ์เชิงเส้นตรงระหว่างvariate ทั ้งสองจะมีค่าสูงสุด หากมี variance ที่ยังไม่สามารถ อธิบายได้อยู ่อีก ก็จะมีการหาตัวแปรสังเคราะห์หรือ variate คู่ต่อไป ในทางปฎิบัติ cancorr จะหาตัวแปร สังเคราะห์หรือ variate ไม่เกินจํานวนตัวแปรในกลุ่มที่มีจํานวนสมาชิกน้อยกว่า ( หากมีตัวแปรอิสระ X1,X2,X3 และตัวแปรตาม Y1,Y2,Y3,Y4,Y5ตามตัวอย่างข้างต้น จะมี canonical variable 3 คู่) เพื่อให้ เข้าใจได้ง่ายขึ ้นเราลองพิจารณาภาพดังต่อไปนี เอกสารวิชาการด้านศาสตร์การวิจัยและสถิติประยุกต์ 27

Upload: others

Post on 22-Feb-2020

7 views

Category:

Documents


0 download

TRANSCRIPT

Page 1: it.nation.ac.th › faculty › danai › download › statistics talks27... Canonical Correlation Analysis (Cancorr)1 Canonical Correlation Analysis (Cancorr) Canonical correlation

1

Canonical Correlation Analysis (Cancorr)

Canonical correlation analysis เปนเทคนคทางสถตทใชในการหาความสมพนธระหวางตวแปรสองกลม

กลมแรกจะเปนกลมของตวแปรอสระ( สมมตประกอบดวย X1,X2,X3 ) อกกลมจะเปนกลมของตวแปร

ตาม (สมมตประกอบดวย Y1,Y2,Y3,Y4,Y5) ซงในแตละกลมอาจจะประกอบดวยจานวนตวแปรไมเทากน

กลไกของcancorr จะอาศยการสรางตวแปรสงเคราะห(synthetic variable)หรอทเรยกวา variateซงเปน

linear combination ของตวแปรในแตละกลม ( ตวแปรสงเคราะหของกลมตวแปรอสระเรยกวา covariate

canonical variable สวนตวแปรสงเคราะหของกลมตวแปรตามเรยกวา dependent canonical variable )โดย

covariate canonical variable และdependent canonical variable ทสรางขนจะมความสมพนธเชงเสนตรง

สงสด หากม varianceทยงไมสามารถอธบายไดดวย variate คแรก cancorr จะสรางตวแปรสงเคราะหหรอ

variate คตอไปซงเปน linear combination ของตวแปรในแตละกลมขนมา และ linear combination ของ

variate คใหมนจะ orthogonal( มความเปนอสระ/ไมขนกน ) กบ linear combination ของ variate คแรก ท

สาคญกคอความสมพนธเชงเสนตรงระหวางvariate ทงสองจะมคาสงสด หากม variance ทยงไมสามารถ

อธบายไดอยอก กจะมการหาตวแปรสงเคราะหหรอ variate คตอไป ในทางปฎบต cancorr จะหาตวแปร

สงเคราะหหรอ variate ไมเกนจานวนตวแปรในกลมทมจานวนสมาชกนอยกวา( หากมตวแปรอสระ

X1,X2,X3 และตวแปรตาม Y1,Y2,Y3,Y4,Y5ตามตวอยางขางตน จะม canonical variable 3 ค) เพอให

เขาใจไดงายขนเราลองพจารณาภาพดงตอไปน

เอกสารวชาการดานศาสตรการวจยและสถตประยกต

27

Page 2: it.nation.ac.th › faculty › danai › download › statistics talks27... Canonical Correlation Analysis (Cancorr)1 Canonical Correlation Analysis (Cancorr) Canonical correlation

2

ภาพท 1 ดานซายแสดงกลมของตวแปรสองกลม คอกลม

ของตวแปร X’s (มจานวนตวแปร 3 ตว) และกลมของตว

แปร Y’s (มจานวนตวแปร 5 ตว )

Canonical correlation analysisจะหา

variate/synthetic variable(X*)ทเปนตวแทนของ X’s

และ( Y*)ทเปนตวแทนของ Y’s ทซงความสมพนธระหวาง

X* และY*สงสด

หมายเหต:-X*เปน linear combination ของ X’s

Y*เปน linear combination ของ Y’s

เนองจากโดยปกต X* ไมสามารถอธบาย variance ของ Y*

ไดหมด ( R2C1<1.0 ) เมอเปนเชนนจะตองอาศย variate/

synthetic variable คใหมทไมมความสมพนธกบ

variate/synthetic variable X*,Y* เลย

Variate/synthetic variable คใหมคอ X**,Y**

เนองจากอาจม variance ของ Y’s ทไมสามารถอธบาย

ไดดวย X’s ทเหลออย แม variance สวนใหญจะอธบายได

ดวยค X*,Y* และ X**,Y** เมอเปนเชนน canonical

analysis จะตองหา variate/synthetic variableคตอไป

(ใหชอวา X***, Y***)

หมายเหต :-จานวน variate จะมจานวนสงสดเทากบ

จานวนตวแปรในกลมทมสมาชกนอยกวา ตวอยางเชน

ตามภาพ จะมแค variate สามคเทานน

หมายเหต:- R2C คอ Pearson correlation coefficientระหวาง

variate แตละคยกกาลงสองนนเอง

Page 3: it.nation.ac.th › faculty › danai › download › statistics talks27... Canonical Correlation Analysis (Cancorr)1 Canonical Correlation Analysis (Cancorr) Canonical correlation

3

ตอไปนเปนตวอยางลกษณะปญหาทางสถตทสามารถใช Cancorr ในการไขปญหา

ในวงการศกษา : หาความสมพนธระหวางกลมของตวแปรทวดความสามารถในทางวชาการ

กบกลมของตวแปรทวดความสาเรจในการเรยน

ในวงการสงคมศาสตร : หาความสมพนธระหวางกลมของตวแปรทใชวด social mobility ท

ประเมนจากการสมภาษณ กบกลมของตวแปรทเปนดชนชวด social mobilityทเกดขนจรง

ในภายหลง

ในวงการแพทย : หาความสมพนธระหวางกลมของตวแปรทเปนปจจยเสยงกบกลมของ

ตวแปรทแสดงการเกดอาการตางๆขน

ในวงการจตวทยา : หาความสมพนธระหวางกลมของตวแปรทางดานจตวทยากบกลมของ

ตวแปรดานวชาการและเพศ

ในวงการจตเวช : หาความสมพนธระหวางตวแปรทใชทดสอบบคลกภาพในมตทเปน

MMPI ( The Minnesota Multiphasic Inventory) กบกลมของตวแปรทใชทดสอบบคลก

ภาพในมตทเปน NEO ( Neuroticism-Extraversion-Openness Inventory)

ในวงการสขภาพ: หาความสมพนธระหวางกลมของตวแปรทเกยวของกบการออกกาลงกาย

(อตราการไตกาวขนบนได, ความเรวในการวง, นาหนกทยกได, จานวน push-ups ททาได

ตอนาท) และกลมของตวแปรดานสขภาพ ( ความดนโลหต, ระดบคลอเรสเตอรอล, ระดบ

นาตาลในเลอด, ดชนวดมวลกาย)

Page 4: it.nation.ac.th › faculty › danai › download › statistics talks27... Canonical Correlation Analysis (Cancorr)1 Canonical Correlation Analysis (Cancorr) Canonical correlation

4

ในวงการสงแวดลอม : หาความสมพนธระหวางกลมของตวแปรทใชวดสขอนามยดาน

สงแวดลอม (จานวนพนธสตวทนบได , ความหลากหลายของพนธสตวทพบ, มวลของ

สารอนทรย, ผลตภาพของธรรมชาตสงแวดลอม) กบกลมของตวแปรทใชวดสารพษทม

ในสงแวดลอม( ความเขมขนของโลหะหนก ยาฆาแมลง สารไดออกซน)

ในวงการตลาด : หาความสมพนธระหวางกลมของตวแปรทวดผลการดาเนนงานดาน

ยอดขายกบกลมของตวแปรทเปนมาตรวดดานสตปญญาและการสรางสรรค

ในวงการกฬา : หาความสมพนธระหวางกลมของตวแปรทใชวดสรรศาสตร ( นาหนก

เปนปอนด เสนรอบเอวเปนนว อตราการเตนของหวใจตอนาท ) กบกลมของตวแปรทใช

วดการออกกาลงกาย ( จานวนChin-up ททาได จานวน sit-up ททาได จานวน jumping-

jack ททาได )

ในวงการจตเวช : หาความสมพนธระหวางกลมของตวแปรทแสดงแรงสนบสนนทาง

สงคม ( แรงสนบสนนทางสงคมรวม แรงสนบสนนทางสมคมทไดมาจากครอบครว แรง

สนบสนนทางสงคมทไดจากเพอน แรงสนบสนนทางสงคมทสาคญอนๆ ) กบกลมของ

ตวแปรทแสดงสขภาพจต ( ความเศราซม ความวาเหว ความเครยด)

ในวงการเศรษฐศาสตร : หาความสมพนธระหวางกลมของตวแปรทเปนตวกาหนด

นโยบายภาครฐกบกลมของตวแปรทเปนดชนชวดฐานะทางเศรษฐกจ

ในวงการบรหารทรพยากรมนษย : หาความสมพนธระหวางกลมของตวแปรทแสดง

ลกษณะงาน ( ความหลากหลายของงาน feedback ความเปนอสระในการทางาน ) กบกลม

ของตวแปรทแสดงความพงพอใจในงาน ( ความพงพอใจในเสนทางการทางาน ความพง

พอใจในฝายจดการและหวหนางาน ความพงพอใจในรายไดและสวสดการ )

Page 5: it.nation.ac.th › faculty › danai › download › statistics talks27... Canonical Correlation Analysis (Cancorr)1 Canonical Correlation Analysis (Cancorr) Canonical correlation

5

สงทตองทาความเขาใจเกยวกบการวเคราะห Cancorr

1. ผลทไดจากการวเคราะหจะเปน variate หลายค คแรกจะเปนคทม canonical correlation(RC ) สงสด คตอๆไปจะ

ม canonical correlation ทมขนาดเลกลงลดหลนกนลงไป อยางไรกตาม นกสถตตองทาใจวา คา RC อาจมคาไม

สงมาก เกณฑทอยในระดบทนาพอใจไดแกกรณRC มคาตงแต 0.30 ขนไป( variate ในกลมแรกสามารถอธบาย

ความผนผวนของ variate ในกลมทสองไดรอยละเกา-0.32)

2. ความสมพนธระหวาง variate แตละค กคอความสมพนธในมตทแตกตางกน ดงนนความสมพนธของ variate ในค

แรกจะอยในมตทแตกตางจากความสมพนธของ variate คอนๆ

3. แมจะม variate / R2C หลายค แตละคแสดงมตหนงของความสมพนธระหวางกลมของตวแปรอสระกบกลมของตว

แปรตาม แตเมอรวมทกมต กอาจอธบายความสมพนธระหวางกลมของตวแปรอสระกบกลมของตวแปรตามได

บางสวนซงอาจจะเปนสวนนอย

4. Cancorr จะใชในการหาความสมพนธระหวางกลมของตวแปรตามกบกลมของตวแปรอสระพรอมกน ไมเหมอน

การวเคราะหการถดถอยพหคณ( multiple regression analysis ) ทใชหาความสมพนธระหวางตวแปรตามเพยง

ตวเดยวกบกลมของตวแปรอสระ ไมผดนกถาจะกลาววา multiple regression analysis เปนกรณพเศษของ

Canonical correlation analysis

ในศาสตรทางดานจตวทยา การศกษาพฤตกรรมของมนษยสวนใหญมกจะเปนการศกษาเกยวกบตวแปรท

แสดงเหตและผลหลากหลายอยาง Cancorr เปนเทคนคทางสถตทเหมาะสมทจะใชในสถานการณเชนน

5. หากมกลมของตวแปรตามกบกลมของตวแปรอสระ ผลของการวเคราะหการถดถอยพหคณระหวางตวแปรตามท

ละหนงตวกบกลมของตวแปรอสระหลายๆครงตามจานวนตวแปรตามทมในกลมจะไมเทากบผลของการวเคราะห

โดยใช cancorr เพยงครงเดยว เพราะจะเพมโอกาสทจะม Type I error ( โอกาสทจะยอมรบสมมตฐานเทจวาเปน

จรง ) ยงทดสอบซาครงเทาใด confidence level จะลดลง ( significance level จะเพมขน )ทาใหความเชอมนทาง

สถตนอยลง

6. สเกลทใชวดกลมของตวแปรอสระอาจแตกตางจากสเกลทใชวดกลมของตวแปรตาม ตวอยางเชน ตวแปรตามอาจ

เปนLikert’s scale 1-5 ในขณะทตวแปรอสระอาจจะเปน binaryทมคาไดเพยงสองคา

7. ผลทไดจาก Cancorr Analysis อาจไมชวยในการกาหนดหรอพยากรณคาของกลมตวแปรตามหากเราทราบคา

ของกลมตวแปรอสระ ทงนตองยอมรบวตถประสงคหลกของ Cancorr ซงมไวเพอหาความสมพนธระหวางกลมของ

ตวแปร 2 กลม ไมเหมอนผลทได จากการวเคราะหการถดถอยพหคณทสามารถใชคาของตวแปรอสระในการ

พยากรณคาของตวแปรตาม

Page 6: it.nation.ac.th › faculty › danai › download › statistics talks27... Canonical Correlation Analysis (Cancorr)1 Canonical Correlation Analysis (Cancorr) Canonical correlation

6

8. ในการวเคราะห cancorr มความเปนไปไดท canonical variates จะมความสมพนธกนสงแตไมสามารถอธบายสดสวน

variance ของกลมตวแปรดงเดมไดในระดบทสงพอ

สมมตฐานทจาเปนสาหรบการวเคราะหCanonical correlation

1)ลกษณะการกระจายของตวแปร (distribution): ตวแปรทงหลายในประชากรตองมการกระจายแบบ multivariate

normal (นนหมายความวาตวแปรทงหมดตลอดจน linear combination ของมนมการกระจายแบบ Normal )

โดยเฉพาะอยางยงหากนกสถตจาเปนตองมการทดสอบผลทางสถต

หมายเหต :-ในกรณทการกระจายของประชากรมความเพยนจาก multivariate normal แตหากกลมตวอยางมขนาด

ใหญ การวเคราะห cancorr กจะยงคงมความนาเชอถอ

2)ขนาดของกลมตวอยาง : ตองมมากพอ โดยในขนตาควรมขนาดกลมตวอยาง 20 เทาของตวแปรทศกษาอย และจะ

เปนการดมาก ถาขนาดของกลมตวอยางเปน 40-60 เทา ของจานวนตวแปร

3)ขอมลทมปราศจากคาผดปกต(outliers) : หากในขอมลมคาผดปกต จะมผลตอ correlation coefficient

คอนขางมาก

4) ความสมพนธเชงเสนตรง (linearity) : ความสมพนธระหวางตวแปรในแตละกลมและระหวางกลมตองเปนเสนตรง

5) ความผนผวนใน error term ตองมคาคงท (homoscedasticity) : โดยvariance ของแตละตวแปรในกลมหรอ

ระหวางกลมตองมคาคงททกระดบคาของตวแปรอนๆ

6) แมทรกซทเปน correlation matrix ตองไมมลกษณะทเปน ill-conditioning matrix :ซงจะเกดขนเมอตวแปรหนง

มความสมพนธโดยสมบรณ (perfect relationship )กบตวแปรอน เปนผลทาใหเราไมสามารถหา inverted correlation

matrix ตลอดจนไมสามารถ ดาเนนการวเคราะห cancorr ตอไปได

ขอจากด

1. Linear combinationของกลมตวแปรหรอ variate ทไดอาจจะไมมความหมายในทางทฤษฎ และอาจมความ

ยงยากพอสมควรในความพยายามทจะตความผลทได

2. หากความสมพนธระหวางกลมของตวแปรเปน nonlinear อาจจะไมสามารถหาความสมพนธได

3. ผลทไดขนอยเปนอยางมากกบขอมลทรวมเขามาหรอตดออกไป

4. Correlation ไมไดบงบอกเหตและผลโดยอตโนมต

Page 7: it.nation.ac.th › faculty › danai › download › statistics talks27... Canonical Correlation Analysis (Cancorr)1 Canonical Correlation Analysis (Cancorr) Canonical correlation

7

การใชโปรแกรมสาเรจรปในการหา canonical correlation

ไมสามารถใชคาสงจาก menu แตจะตอง run โปรแกรมโดยสงการในรป syntax ซงเปนภาษาเฉพาะของโปรแกรมสาเรจรปน ทงน

สามารถเลอก run โปรแกรมไดสองทาง คอใช manova command หรอ cancorr command

ใช MANOVA syntax command

Page 8: it.nation.ac.th › faculty › danai › download › statistics talks27... Canonical Correlation Analysis (Cancorr)1 Canonical Correlation Analysis (Cancorr) Canonical correlation

8

ใช Cancorr syntax command

Page 9: it.nation.ac.th › faculty › danai › download › statistics talks27... Canonical Correlation Analysis (Cancorr)1 Canonical Correlation Analysis (Cancorr) Canonical correlation

9

ความหมายของศพทเฉพาะทใชและศพททางสถต:

Variable: ตวแปรซงแบงออกเปนสองกลม อาจแยกแยะออกเปนกลมตวแปรอสระ (independent variable/ predictor variable)

และกลมตวแปรตาม (dependent variable / criterion variable) หรออาจแยกแยะออกเปนตวแปรในกลมทหนงและตวแปรในกลม

ทสอง โดยจานวนตวแปรในแตละกลมไมจาเปนตองเทากน

Canonical correlation analysis: การวเคราะหความสมพนธระหวางกลมของตวแปรสองกลม

Canonical variate /canonical variable: ตวแปรสงเคราะห (synthetic variable) ทเปนlinear combination ของกลมตวแปร

แตละกลม โดยตวแปรสงเคราะหของกลมตวแปรตามเรยกวา dependent canonical variate/ dependent canonical variable

สวนตวแปรสงเคราะหของกลมตวแปรอสระเรยกวา covariate canonical variate/covariate canonical variable

Canonical variates/variants ไมใช factor ในความหมายเดยวกบ factor(s ) ทไดจากการทา factor analysis โดยใน

factor analysis จะมการคานวณหา factors ททาให variance ระหวางกลม(between-group variance) สงสดและ variance

ภายในกลม(in-group variance) ตาสด ในขณะท canonical variates คแรกจะจดกลมตวแปรทมงใหความสมพนธระหวาง

variates สงสด จากนน canonical variates คทสองจะถกสรางขนจาก residuals ทเหลอจาก variates คแรกทมงใหความสมพนธ

ระหวาง variates คทสองสงสด canonical variates ทสรางขนตามลาดบตดตอกนน จะ orthogonal ตอกนและกนโดยอตโนมต

หรอมความเปนอสระซงกนและกน

Canonical correlation : มไดหลายความหมาย

ความหมายแรก: หมายถงการวเคราะหแบบ Canonical (Canonical correlation analysis)

ความหมายทสอง: หมายถง canonical function /canonical root/ characteristic root ซงอาจมหลายfunction/ root

แตละfunctionหรอ root จะประกอบไปดวย Variate หนงค ไดแก dependent canonical variate และ covariate canonical

variate

ความหมายทสาม: หมายถง canonical correlation coefficient ซงแสดงความสมพนธเชงเสนตรงระหวาง dependent

canonical variate และ covariate canonical variate โดยcanonical correlation ทไดจาก function /root แรกจะอธบาย

ความสมพนธระหวางกลมตวแปรสองกลมไดเปนสวนใหญ มความหมายเฉกเชนเดยวกบ Pearson’s correlation coefficient

Canonical root: คของ canonical variates โดย root แตละ root แสดงมตหนงของความสมพนธระหวางคของตวแปรสงเคราะห

ทมาจากกลมตวแปรสองกลม โดย root แรกจะมขนาดใหญสดและใหขอมลเกยวกบความสมพนธระหวางคของตวแปรสงเคราะหมาก

ทสด root ถดไปจะแสดงมตอกมตหนงของความสมพนธระหวางคของตวแปรสงเคราะหทไมอาจอธบายไดดวยมตแรก จานวน root ท

Page 10: it.nation.ac.th › faculty › danai › download › statistics talks27... Canonical Correlation Analysis (Cancorr)1 Canonical Correlation Analysis (Cancorr) Canonical correlation

10

มแสดงใหเหนจานวนมตทชวยในการอธบายความสมพนธระหวางคของตวแปรสงเคราะห นกวจยไมจาเปนตองพจารณาความสมพนธ

ระหวางคของตวแปรสงเคราะหในทกมต โดยจะจากดตวเองอยในมตทสาคญๆเทานน (หมายเหต:- มตหนงๆจะไดรบความสนใจก

ตอเมอ RC=.30 หรอมากกวา)

Canonical weights/canonical function coefficients/canonical coefficients: แสดง partial correlation ระหวางตวแปร

กบ canonical root ของมน ชวยใหสามารถทราบวา แตละตวแปรมสวนสาคญมากนอยเพยงใดในการกาหนดตวแปรสงเคราะห และ

ชวยใหสามารถคานวณคาทแทจรงของ canonical variate ทเรยกวา canonical scores ได

Raw canonical coefficients for dependent(covariate) variables: บอกใหทราบวาหากตวแปรในกลม(ตวแปรตาม ะ/ตวแปร

อสระ ) เปลยนไปหนงหนวยโดยตวแปรอนๆในกลมมคาคงท จะมผลทาใหตวแปรสงเคราะห/ covariate ทเกยวของกบตวแปรในกลม

(ตวแปรอสระ/ตวแปรตาม ) เปลยนไปมากนอยเทาใด

Standardized canonical coefficients for dependent(covariate) variables: บอกใหเราทราบวาหากตวแปรในกลม ( ตวแปร

อสระ/ตวแปรตาม ) เปลยนไปเทากบหนงหนวยของสวนเบยงเบนมาตรฐาน จะมผลทาใหตวแปรสงเคราะห / covariate ทเกยวของกบ

ตวแปรในกลม (ตวแปรอสระ/ตวแปรตาม) เปลยนแปลงไปเปนสดสวนเทาใดของสวนเบยงเบนมาตรฐานของตวแปรสงเคราะห /

covariate นนๆ เปนประโยชนในการเปรยบเทยบความสาคญของตวแปรทมสเกลในการวดและความผนผวนแตกตางกน

Canonical factor loadings / canonical loadings / structure correlation coefficients /factor structure / structure

coefficients: บอกความสมพนธระหวางตวแปรสงเคราะหกบตวแปรแตละตวในกลมของมน (กรณ regular loadings หรอกรณปกต)

หรอบอกความสมพนธระหวางตวแปรสงเคราะหกบตวแปรแตละตวทอยขามกลม (กรณ cross loadings)

Canonical loadings นอกจากจะใหขอมลความสาคญของตวแปรนนๆใน canonical solution แลว ยงทาใหเหนความเชอมโยง

ระหวางกลมของตวแปรตามและกลมของตวแปรอสระผาน canonical root

จาก loadings ทได เราอาจตองมการกาหนดชอของตวแปรสงเคราะห เพอแสดงมตของความสมพนธและความหมายทม

แตในบางครงอาจทาไมไดหรอคอนขางเปนเรองยาก

Canonical scores: คาของ canonical variable ของแตละ case หาไดจากการเอา canonical coefficients( ของแตละตวแปร)

คณกบ standardized scores ของตวแปรแตละตวแปรใน case หนงๆ และรวมผลเขาดวยกนเปน canonical scores สาหรบcase

นนๆ

Page 11: it.nation.ac.th › faculty › danai › download › statistics talks27... Canonical Correlation Analysis (Cancorr)1 Canonical Correlation Analysis (Cancorr) Canonical correlation

11

Canonical correlation coefficient ( RC ): คอ Pearson’s correlation coefficient ระหวางตวแปรสงเคราะหสองตว

( dependent canonical variate และ covariate canonical variate) ทไดจาก canonical correlation function หนงๆ

Squared canonical correlation:สดสวน variance ทมรวมกนระหวางตวแปรสงเคราะหทงสองใน function หนงๆ และบอก

สดสวน ของ variance ทมรวมกนระหวางตวแปรสองกลม ( อสระ/ ตาม ) หรออกนยหนงใชบอกสดสวนvariance ของ

one group variate ทอธบายไดดวย group variate อกอน

Redundancy: สดสวน variance ของตวแปรในกลมหนงทอธบายไดดวย variate จากอกกลมหนง

Canonical communality coefficients : ผลรวมของ sq. structure coefficients ของ canonical variables ทงหมดของตวแปร

หนงๆ จะบอกประโยชนหรอความสาคญของแตละตวแปรในการวเคราะห cancorr หากตวแปรใดม canonical communality ตา

หมายความวาแบบจาลองทใชอยลมเหลวและผวเคราะหอาจพจารณาตดสนใจเอาตวแปรตวนนออกจากกระบวนการวเคราะห

cancorr

Canonical variate adequacy coefficients :คาเฉลยของ squared structure coefficient ของกลมตวแปรหนงๆในแตละ

function จะบอกวา canonical function แตละฟงกชนสามารถอธบาย variance ของ dependent variable หรอ independent

variable ไดมากนอยเทาใด

Redundancy coefficients: รอยละของ variance ของกลมตวแปรหนงๆทสามารถอธบายไดโดย canonical variable

ของอกกลมตวแปร โดยจะมredundancy coefficient สองจานวนตอcanonical correlation หนงๆ(redundancy coefficientของ

covariate canonical variate ทใชพยากรณ variance ของกลมตวแปรตาม และ redundancy coefficient ของ dependent

canonical variate ทใชพยากรณ variance ของกลมตวแปรอสระ)

Pooled redundancy coefficients :ผลรวมของ redundancy coefficients ของตวแปรทกตวในกลม(กลมตวแปรอสระหรอกลม

ตวแปรตาม) จะบอกประสทธภาพของ canonical variate ทกตวในการ capture variance ของตวแปรเดม (original variables)

Pillai’s trace(Pillais):ใชเพอทดสอบสมมตฐานทางสถตวาCanonical correlationทกตวทคานวณไดมคาเปนศนยหรอไมหรออกนย

หนงความสมพนธระหวางกลมตวแปรสองกลมมลกษณะเปนเสนตรงหรอไม(Null hypothesis: Canonical correlations=0)

คานวณไดโดยหาผลรวมของ squared canonical correlations

Page 12: it.nation.ac.th › faculty › danai › download › statistics talks27... Canonical Correlation Analysis (Cancorr)1 Canonical Correlation Analysis (Cancorr) Canonical correlation

12

Hotelling-Lawley trace(Hotellings):ใชเพอทดสอบสมมตฐานทางสถตวาCanonical correlationทกตวทคานวณไดมคาเปน

ศนยหรอไมเชนเดยวกบ Pillais คานวณไดโดยหาผลรวมของ (canonical correlation2 /(1-canonical correlation2))

Wilks’ lambda(Wilks):ใชเพอทดสอบสมมตฐานทางสถตวาCanonical correlationทกตวทคานวณไดมคาเปนศนยหรอไม

เชนเดยวกน คานวณไดจากผลคณของ (1-canonical correlation2 )ทกตว

Roy’s greatest root(Roys):ใชเพอทดสอบสมมตฐานทางสถตวาCanonical correlationทกตวทคานวณไดมคาเปนศนยหรอไม

เชนเดยวกน คานวณไดจากสตร (eigenvalue ทมคาสงสด/(1+eigenvalueทมคาสงสด ) เนองจากใชคาสงสด ดงนนในบางครงอาจ

ใหผลทางสถตขดแยงกบผลทไดจาก Pillais/Hotellings/Wilks ดงนนหากผลทไดจากการทดสอบสมมตฐานดวยคาสถตสามตวบง

บอกวาไมมนยสาคญทางสถตในขณะทพบวาหากใช Roys จะมนยสาคญทางสถต เราจะสรปวาผลการทดสอบสมมตฐานไมม

นยสาคญทางสถต

Approx.F: คอคาสถต F ทไดจากการประมาณการ และใชในการทดสอบ multivariate test

Hypoth.DF/Error DF: degree of freedom คานวณจาก mean squared errors ใชในการกาหนดคาของ F

Root no. อนดบของ eigenvalue เรยงจากคาสงไปหาคาตา จานวน root=min(จานวนตวแปรในชดท 1, จานวนตวแปรในชดท 2)

Eigenvalue:ขนาดของ eigenvalue จะสะทอนvarianceใน canonical variates ทอธบายไดดวย canonical correlation ของมน

สามารถคานวณไดจาก squared correlation/(1-squared correlation)

Pct.: รอยละของ variance ใน canonical variates ทอธบายไดดวย canonical correlation ของมน

Wilks L: เปนการทดสอบโดยใช Bartlett’s Chi-square ( ดจากคา Wilks) เปนการทดสอบสมมตฐานทางสถตทแตกตางจาก

Wilk’s lambda ใน multivariate หรอ omnibus test (ซงใช F-test) โดยในการทดสอบนไมไดใชเพอทดสอบความมนยสาคญของ

canonical correlation( หรอ ทดสอบวา eigenvalue มคาตางจากศนย) ทละคา แตใชในการทดสอบวา คา canonical

correlationทงหมดยกเวน canonical correlation กอนหนาทมคาใหญกวาแตกตางจากศนยอยางมนยสาคญหรอไม คานวณได

จากผลคณของ (1-canonical correlation2 ) การทดสอบจะมลกษณะเปนลาดบขนตอน(sequential) โดยสมมตวา เราม

canonical root อย 3 ตว (ขนาดของกลมตวแปรทมจานวนสมาชกนอยทสด =3) และถากาหนดวา canonical correlation ของ

root ท 1-3 เปน RC1 , RC2 , RC3 ตามลาดบ จะมการคานวณดงน

Wilk L ของ root ท 1= (1- R2C1). (1- R2

C2).(1- R2C3)

Wilk L ของ root ท 2= (1- R2C2).(1- R2

C3)

Page 13: it.nation.ac.th › faculty › danai › download › statistics talks27... Canonical Correlation Analysis (Cancorr)1 Canonical Correlation Analysis (Cancorr) Canonical correlation

13

Wilk L ของ root ท 3= (1- R2C3)

และกอนจบเอกสารวชาการน มประเดนทตองหยบยกดงน:-

ประเดนท 1

ตองเขาใจวา canonical correlation ไมไดใชวดสดสวน variance ของตวแปรดงเดม

(original variables) ทสามารถอธบายไดโดย canonical variate แตใชบอกความสมพนธ

ระหวางผลรวมถวงน าหนกของตวแปรสองกลม

ประเดนท 2

เนองจาก canonical coefficients อาจไดรบอทธพลจากการม multicollinearity ระหวางตว

แปรในกลม มผลทาใหเครองหมายอาจแตกตางไปจาก correlation ระหวางตวแปรกบ

canonical variable ได ดงนนความสมพนธระหวางตวแปรกบ canonical variable ควรใช

structure coefficient จะมความเหมาะสมกวา

ประเดนท 3

มความเปนไปไดทตวแปรบางตวมคา canonical weights ใกล 0 ในขณะท canonical factor

loadings (structure coefficients) สง โดยเฉพาะกรณทตวแปรใดตวแปรหนงม variance

รวมกนกบตวแปรอนๆ ทาใหตวแปรนนซ าซอน(redundant) กบตวแปรอนๆ มผลทาให

canonical weights เขาใกลศนย แต structure correlations อาจสง

Page 14: it.nation.ac.th › faculty › danai › download › statistics talks27... Canonical Correlation Analysis (Cancorr)1 Canonical Correlation Analysis (Cancorr) Canonical correlation

14

Contribution this issue: ดร.ดนย ปตตพงศ

ประเดนท 4

หากเปรยบเทยบความแตกตางระหวาง Cancorr analysis กบ Factor Analysis( Statistics

Talks # 12-15 )สามารถแจกแจงไดดงน :-

Cancorr Analysis Factor Analysis

1.มงเนนการแยกแยะตวแปรออกเปนตว

แปรอสระและตวแปรตาม

1.มงศกษาโครงสรางของตวแปรทงหมด

2.สรางตวแปรสงเคราะห (latent variable

/variate)และมงเนนความสมพนธทม

ระหวาง variate น

2.สรางตวแปรสงเคราะหขนเชนเดยวกน

แตไมไดเนนความสมพนธ

3.ศกษากลมตวแปรตนและตวแปรตาม 3.ศกษาความเปนอสระตอกนและกน

4.มกงดเวนไมมการ rotate 4.จะตองมการrotateเพอใหได solution