hoi quy pst

31
BI GING ĐIN T TIN HC NG DNG TRONG K THUT ĐA CHT & DU KHÍ Giảng viên : TS. Phạm Sơn Tùng Bộ môn : Khoan & Khai thc du khí (Bài giảng được viết dựa trên bài giảng năm 2007 của các tc giả: ThS. Đỗ Quang Khánh & ThS. Bi Tử An) Copyright 2015 HỒI QUY THỰC NGHIỆM

Upload: ho-hoang-phuc

Post on 06-Feb-2016

21 views

Category:

Documents


0 download

DESCRIPTION

Cac dang hoi quy va ung dung

TRANSCRIPT

Page 1: Hoi quy PST

BAI GIANG ĐIÊN TƯ

TIN HOC ƯNG DUNG

TRONG KY THUÂT ĐIA CHÂT & DÂU KHÍ

Giảng viên : TS. Phạm Sơn Tùng

Bô môn : Khoan & Khai thac dâu khi

(Bài giảng được viết dựa trên bài giảng năm 2007 của các tac giả: ThS. Đỗ Quang Khánh & ThS. Bui Tử An)

Copyright 2015

HỒI QUY THỰC NGHIỆM

Page 2: Hoi quy PST

Copyright 2015

HỒI QUY THỰC NGHIỆM 2

PHÂN TÍCH HỒI QUY (REGRESSION ANALYSIS)

Khái niệm về phân tích hồi quy

Hồi quy tuyến tính (Linear regression)

Hồi quy đa thức (Polynomial regression)

Hồi quy lũy thừa (Power regression)

Hồi quy mũ (Exponential regression)

Page 3: Hoi quy PST

Copyright 2015

HỒI QUY THỰC NGHIỆM 3

HỒI QUY TUYẾN TÍNH

Sir Francis Galton (16/2/1822-17/1/1911)

Galton’s conclusions:

Nature dominates: “families of reputation were much more likely than ordinary families to produce offspring of ability

His “genetic utopia”: “Bright, healthy individuals were treated and paid well, and encouraged to have plenty of children. Social undesirables were treated with reasonable kindness so long as they worked hard and stayed celibate”

He went to JD Dickson, a mathematician at Cambridge, who formalized the relationship by developing what we know as linear regression

Page 4: Hoi quy PST

Copyright 2015

HỒI QUY THỰC NGHIỆM 4

KHÁI NIỆM VỀ PHÉP PHÂN TÍCH HỒI QUY

Phương pháp phân tích dữ liệu

Phân tích tương quan (Correlation)

Xác định mức độ liên quan giữa các biến

X ↔ Y: n cặp số đo (x1, y1), (x2, y2), … (xn, yn)

Hệ số tương quan (Coefficient of Correlation)

Page 5: Hoi quy PST

Copyright 2015

HỒI QUY THỰC NGHIỆM 5

KHÁI NIỆM VỀ PHÉP PHÂN TÍCH HỒI QUY

Phân tích mối liên hệ giữa số giờ xem tivi trong

ngày và điểm trung bình học kỳ

Số giờ xem

tivi/ngày Điểm TB

học kỳ

4 4

2.5 5

3 4.8

1 6.4

0.5 7.6

Page 6: Hoi quy PST

Copyright 2015

HỒI QUY THỰC NGHIỆM 6

KHÁI NIỆM VỀ PHÉP PHÂN TÍCH HỒI QUY

Phương pháp phân tích dữ liệu (Data analysis)

Phân tích tƣơng quan (Correlation)

Tiên lƣợng (Prediction)

Nếu các biến có mối liên hệ thì xây dựng mô

hình liên hệ giữa chúng

Cân nhắc lựa chọn mô hình toán học thích hợp

Từ đó có thể tiên lượng: X → Y

− X : biến độc lập (independent variable),

biến tiên lượng (predictor variable), biến giải

thích…

− Y : biến phụ thuộc (dependant variable),

biến được giải thích (response variable),

biến mục tiêu…

Page 7: Hoi quy PST

Copyright 2015

HỒI QUY THỰC NGHIỆM 7

KHÁI NIỆM VỀ PHÉP PHÂN TÍCH HỒI QUY

Phép phân tích hồi quy: trên cơ sở một tập các dữ liệu thực

nghiệm

Dạng tổng quát: ў = f (x1, x2, x3,…, a0, a1, a2 , …)

xi (i=1:k): biến độc lập thay đổi trong thực nghiệm

y: biến phục thuộc

a0, a1, a2 , …: các hệ số hồi quy tương ứng với các biến

trong mô hình toán học

Tính toán các hệ số hồi quy

Nghiên cứu mô hình toán học phù hợp nhất:

− HQ tuyến tính

− HQ đa thức

− HQ lũy thừa

− HQ mũ

Page 8: Hoi quy PST

Copyright 2015

HỒI QUY THỰC NGHIỆM 8

HỒI QUY TUYẾN TÍNH

Mục tiêu : tìm một mô hình (phương trình) để mô

tả một mối liên hệ tuyến tính giữa một hay

nhiều biến độc lập Xi đến một biến phụ thuộc Y

Nếu có một biến độc lập: hồi quy tuyến đính đơn

(Simple linear regression)

Nếu có nhiều biến độc lập: hồi quy tuyến tính bội

(Multiple linear regression)

Dạng phương trình hồi quy tuyến tính bội

ў = a0 + a1x1 + a2x2 + … + amxm

Ví dụ: x1 là Độ tuổi, x2 là Trọng lượng, x3 là chiều

cao, y là nồng độ Cholesterol trong máu

Page 9: Hoi quy PST

Copyright 2015

HỒI QUY THỰC NGHIỆM 9

Phương phap bình phương cực tiểu (tối thiểu) Least square method by Carl Friedrich Gauss (1795)

Tổng bình phương các sai số giữa giá trị thực nghiệm

và giá trị tính toán của thông số tối ưu là min.

Đường cong biểu diễn là phù hợp nhất với dữ liệu thực

nghiệm mà không nhất thiết phải đi qua tất cả các giá trị

thực nghiệm.

Page 10: Hoi quy PST

Copyright 2015

HỒI QUY THỰC NGHIỆM 10

PHƢƠNG PHÁP BÌNH PHƢƠNG CỰC TIỂU

Bài toán xác định hệ số hồi quy đối với một dạng phương

trình hồi quy trên cơ sở một tập dữ liệu thực nghiệm cho

trước:

Bài toán cực tiểu:

yj (j=1:N): giá trị thực nghiệm

ўj : giá trị tính toán

n: tổng số lần thực nghiệm

xi (i=1:m): biến số độc lập trong thực nghiệm.

1

2

1 2 0 1 2

1

ˆ[ ]

[ ( , ,..., , , ...) ] min

n

j j

j

n

j j

j

y y

y f x x a a a

Page 11: Hoi quy PST

Copyright 2015

HỒI QUY THỰC NGHIỆM 11

PHƢƠNG PHÁP BÌNH PHƢƠNG CỰC TIỂU (tt)

Phương pháp giải:

Điều kiện: ў = f(xi, a0, a1, a2,…) là hàm khả vi

Điều kiện cần để hàm Φ cực tiểu: đạo hàm riêng phần

của hàm Φ theo các hệ số hồi quy ai bằng 0

Sắp xếp và biến đổi ta được hệ phương trình chuẩn có

số phương trình bằng số các hệ số hồi quy (a0, a1,

a2,…) trong mô hình.

Biểu diễn dưới dạng ma trận

Giải hệ phương trình xác định hệ số hồi quy (a0, a1,

a2,…)

min]...),,,([]ˆ[1

2

210

1

N

j

jij

N

j

jj aaaxfyyy

Page 12: Hoi quy PST

Copyright 2015

HỒI QUY THỰC NGHIỆM 12

PHÂN TÍCH HỒI QUY TUYẾN TÍNH BỘI

Dạng phương trình hồi quy tuyến tính bội

ў = a0 + a1x1 + a2x2 + … + amxm

Các bước tiến hành:

Thiết lập hàm Φ

Áp dụng phương pháp bình phương cực tiểu

− Thiết lập HPT đại số tuyến tính đối với (m+1) ẩn số a0,

a1, a2, …, am

− Biểu diễn dưới dạng ma trận: AX = B

− Vector ần số X = [a0, a1, a2, …, am]T

2 2

0 1 1 2 2

1 1

ˆ[ ] [ ]n n

j j j m m jj j

y y y a a x a x a x

Page 13: Hoi quy PST

Copyright 2015

HỒI QUY THỰC NGHIỆM 13

PHÂN TÍCH HỒI QUY TUYẾN TÍNH BỘI (tt)

Suy ra:

Vector vế phải;

Ma trận A là ma trận vuông cấp (m+1)

Giải theo các phương pháp (ma trận nghịch đảo, khử Gauss, …)

tìm X

Thay (a0, a1, a2, …, am) vào mô hình và biểu diễn đường cong hồi

quy phù hợp nhất với một tập điểm thực nghiệm lấy mẫu

{(yj,x1j,x2j,…,xmj), j=1:n}

j

mjj

j

jj

j

jj

j

j

xy

xy

xy

y

B

2

1

2

21

2

2

2212

112

2

11

21

mjmjjmjjmj

jmjjjjj

jmjjjjj

mjjj

xxxxxx

xxxxxx

xxxxxx

xxxN

A

Page 14: Hoi quy PST

Copyright 2015

HỒI QUY THỰC NGHIỆM 14

PHÂN TÍCH HỒI QUY TUYẾN TÍNH BỘI (tt)

Trường hợp đặc biệt: ў = a0 + a1x

Khi đó hàm tổng bình phương các sai số đối

với tập n điểm thực nghiệm lấy mẫu

{yj,xj,j=1:n} cho trước sẽ là:

Cực tiểu hóa các hàm nói trên:

2 2

0 1

1 1

ˆ[ ] [ ( ]n n

j j j j

j j

y y y a a x

0 1

10

0 1

11

2[ ( )] 0

2[ ( )] 0

n

j j

j

n

j j j

j

y a a xa

y a a x xa

Page 15: Hoi quy PST

Copyright 2015

HỒI QUY THỰC NGHIỆM 15

PHÂN TÍCH HỒI QUY TUYẾN TÍNH BỘI (tt)

Bài toán thực tế: Quan sát 2 đại lượng vật ly X và Y trong một thí

nghiệm: i X Y

1 2 66

2 19 77

3 6 37

4 23 106

5 10 55

6 23 89

7 9 52

8 30 128

9 18 63

10 25 104

11 19 76

12 2 44

13 27 97

14 28 109

15 8 40

16 29 124

17 29 98

18 16 63

19 33 131

20 3 41

21 34 111

22 32 151

23 13 76

24 33 114

25 35 143

Page 16: Hoi quy PST

Copyright 2015

HỒI QUY THỰC NGHIỆM 16

PHÂN TÍCH HỒI QUY TUYẾN TÍNH BỘI (tt)

Bài tập 1: Theo 18 mẫu thử hình ranh lấy ở cùng một

via trên các khu vực khác nhau, người ta ghi lại dung

trọng của than đá và độ tro của chung như sau:

Biết rằng dung trọng và độ tro có quan hệ bậc nhất.

Giai: Tiến hành các bước trên ta xây dựng được

phương trình hồi qui thực nghiệm (Sinh viên tiến hanh

cac bước tinh toan như môt bai tâp)

xi 9 20 20 17 24 24 24 25 25 26 30 33 36

yi 1,4 1,4 1,4 1,5 1,5 1,5 1,5 1,5 1,6 1,6 1,7 1,7 1,8

Page 17: Hoi quy PST

Copyright 2015

HỒI QUY THỰC NGHIỆM 17

PHÂN TÍCH HỒI QUY TUYẾN TÍNH BỘI (tt)

y = 1.1863+ 0.0153x

0

0.5

1

1.5

2

0 10 20 30 40Dung troïng

Ño

ä tro

Qua số liệu ta thấy độ tro X tăng lên khi giá trị trọng lượng lượng

riêng than đá tăng. Tuy nhiên mối liên hệ đó không phải luc nào

cũng được bảo toàn. Trong một trường hợp Y tăng nhưng X

không đổi có trường hợp X tăng nhưng Y không đổi. Điều này

được giải thích bởi trọng lượng riêng của than không những phụ

thuộc vào độ tro, mà con phụ thuộc vào độ ẩm cũng như phụ

thuộc vào mức độ biến chất của nó.

Đáp án Bài tập 1

Page 18: Hoi quy PST

Copyright 2015

HỒI QUY THỰC NGHIỆM 18

PHÂN TÍCH HỒI QUY TUYẾN TÍNH BỘI (tt)

Bài tập 2: Kết quả thí nghiệm về tính thấm của một loại đất dính,

ta được quan hệ giữa độ dốc thủy lực J và vận tốc thấm V (cm/d)

như sau:

Biết V và J có quan hệ tuyến tính, xác định mối quan hệ này.

Giai: Tiến hành các bước trên ta xây dựng được phương trình

hồi qui thực nghiệm (Sinh viên tiến hanh cac bước tinh toan

như môt bai tâp)

J 7 9 12 15 18

V (cm/d) 0,5 2 6,5 9,5 14

V = 1.2373J - 8.5952

0

4

8

12

16

0 5 10 15 20J

V (cm/d)

Page 19: Hoi quy PST

Copyright 2015

HỒI QUY THỰC NGHIỆM 19

PHÂN TÍCH HỒI QUY ĐA THỨC

Dạng phương trình hồi quy hàm đa thức bậc m

ў = a0 + a1x + a2x2

+ … + apxp

Các bước tiến hành:

Đặt x1 = x, x2 = x2, … , xp = xp

Đưa về dạng phương trình hồi quy tuyến tính bội

Các bước tiếp theo như mục trước…

Biểu diễn phương trình hồi quy và đường hồi quy thực

nghiệm

Trường hợp đặc biệt: p =2 -> PTHQ parabol: ў = a0 + a1x

+ a2x2

Page 20: Hoi quy PST

Copyright 2015

HỒI QUY THỰC NGHIỆM 20

PHÂN TÍCH HỒI QUY ĐA THỨC (tt)

Bài toán thực tế: Thử nghiệm ứng suất keo một hợp kim

có được bảng dữ liệu sau:

Biết rằng hai đại lượng Stress và Strain có quan hệ

parabol. Tìm quan hệ này.

Giai: Lập bảng tính toán chuyển về dạng hồi qui tuyến

tính.

Test Stress(ksi)

Y

Strain (in./in.)

X Test

Stress(ksi)

Y

Strain (in./in.)

X

1

2

3

4

5

91

97

108

111

114

0.001

0.002

0.003

0.005

0.006

6

7

8

9

10

110

112

105

98

91

0.006

0.009

0.011

0.016

0.017

Page 21: Hoi quy PST

Copyright 2015

HỒI QUY THỰC NGHIỆM 21

PHÂN TÍCH HỒI QUY ĐA THỨC (tt)

Y X1(X) X1Y X2(X2) X2Y X1X2 X2

2

91

97

108

111

114

110

112

105

98

91

1037

=Y

0.001

0.002

0.003

0.005

0.006

0.006

0.009

0.011

0.016

0.017

0.076

=X1

0.091

0.194

0.324

0.555

0.684

0.660

1.008

1.155

1.568

1.547

77.786

=X1Y

110-6

410-6

910-6

2510-6

3610-6

3610-6

8110-6

12110-6

25610-6

28910-6

85810-6

=X2

0.000091

0.000388

0.000972

0.02775

0.004104

0.003960

0.009072

0.012705

0.025088

0.026299

0.085454

=X2Y

110-9

810-9

2710-9

12510-9

21610-9

21610-9

72910-9

133110-9

409610-9

491310-9

1166210-19

=X1X2

110-12

1610-12

8110-12

62510-12

129610-12

129610-12

656110-12

1464110-12

6553610-12

8352110-12

17357410-12

=X22

1037 = 10a0 + 0.076a1 + 85810-6a2

7.786 = 0.076a0 + 85810-6a1 + 1166210-9a2

0.085454 = 85810-6a0 + 1166210-9a1 + 17357410-12a2

a0 = 89.6; a1 = 5378; b2 = -311829

= 89.6 + 5378X1 - 311829X2 = 89.6 + 5378X - 311829X

Y

Page 22: Hoi quy PST

Copyright 2015

HỒI QUY THỰC NGHIỆM 22

PHÂN TÍCH HỒI QUY ĐA THỨC (tt)

Ta có đường hồi quy thực nghiệm.

y = -311829x2 + 5378x + 89.583

80

90

100

110

120

0 0.005 0.01 0.015 0.02Strain (in./in.)

Str

ess (

ksi)

Page 23: Hoi quy PST

Copyright 2015

HỒI QUY THỰC NGHIỆM 23

PHÂN TÍCH HỒI QUY ĐA THỨC (tt)

Trong tính toán địa chất thủy văn người ta thường

xác định bán kính ảnh hưởng R theo các công

thức kinh nghiệm hoặc theo tài liệu hut nước thí

nghiệm. Khi phân tích các công thức xác định lưu

lượng của lô khoan chung ta thấy rằng quan hệ

giữa lưu lượng Q và mực nước hạ thấp S là quan

hệ bậc hai parabol đối với lô khoan trong tầng

chứa nước không áp: S = aQ + bQ2

Ưng dụng định luật thấm Darcy trong môi trường

đất đá, quan hệ giữa vận tốc thấm V và độ dốc

thuy lực J đối với đất đá thấm nước mạnh: J = aV

+ bV2.

Page 24: Hoi quy PST

Copyright 2015

HỒI QUY THỰC NGHIỆM 24

PHÂN TÍCH HỒI QUY LŨY THỪA

Dạng phương trình hồi quy hàm lũy thừa

ў = a0x1a1 x2

a2 … xmam

Các bước tiến hành:

Tuyến tính hóa: ln ў = ln a0 + a1(ln x1) + a2(ln x2) + … + am(ln xm)

Đặt ž = ln ў, b0 = ln a0, t1 = ln x1, t2 = ln x2, … , tm = ln xm

Đưa về dạng phương trình hồi quy tuyến tính bội

ž = b0 + a1t1 + a2t2 + … + amtm

Các bước tiếp theo như mục trước…->(b0, a1

, a2,…, am)

Tìm lại các hệ số hồi quy ban đầu: (b0, a1

, a2,…, am) ->(a0

, a1, a2

,…,

am)

Biểu diễn phương trình hồi quy và đường hồi quy thực nghiệm

Trường hợp đặc biệt: m =1 -> PTHQ lũy thừa một biến: ў =

a0x1a1

Page 25: Hoi quy PST

Copyright 2015

HỒI QUY THỰC NGHIỆM 25

PHÂN TÍCH HỒI QUY LŨY THỪA (tt)

Bài toán thực tế:

Quan hệ ứng xử cơ học của dung dịch khoan giữa ứng

suất trượt và tốc độ trượt theo mô hình hàm lũy thừa có

dạng: Để xác định mối quan hệ này, thực tế tiến hành

đo ứng suất trượt trên nhớt kế Fann theo các tốc độ

quay khác nhau (thông thường 3, 6, 100, 200, 300 và

600 vong/phut).

Page 26: Hoi quy PST

Copyright 2015

HỒI QUY THỰC NGHIỆM 26

PHÂN TÍCH HỒI QUY LŨY THỪA (tt))

Giai: Lập bảng chuyển sang dạng hồi quy tuyến tính:

Tốc độ

(rpm)

Tốc độ

(s-1)

X

Ứng suât

trƣợt

(lbf/100ft2)

Y

LnX lnY LnX.LnY (lnX)2

3

6

10

200

300

600

5.11

10.22

170.33

340.66

511

1022

22

35

48

58

65

76

1.631

2.324

5.138

5.831

6.236

6.930

28.090

=lnX

3.091

3.555

3.871

4.060

4.174

4.331

23.083

=lnY

5.042

8.264

19.889

23.676

26.033

30.010

112.914

=(lnX.lnY)

2.661

5.403

26.396

33.999

38.892

48.018

155.369

=(lnX)2

20310

090283691556

08323090289141126a

21.

).().(

).)(.().(

8962

6

203100902808323a0

....

Page 27: Hoi quy PST

Copyright 2015

HỒI QUY THỰC NGHIỆM 27

PHÂN TÍCH HỒI QUY LŨY THỪA (tt))

20310

10818

x203108962y

..

..ˆ

0

10

20

30

40

50

60

70

80

0 200 400 600 800 1000 1200

Page 28: Hoi quy PST

Copyright 2015

HỒI QUY THỰC NGHIỆM 28

PHÂN TÍCH HỒI QUY LŨY THỪA (tt))

Trong tính toán địa chất thủy văn người ta thường xác định

bán kính ảnh hưởng R theo các công thức kinh nghiệm

hoặc theo tài liệu hut nước thí nghiệm.

Khi phân tích các công thức xác định lưu lượng của lô

khoan chung ta thấy rằng quan hệ giữa lưu lượng Q và

mực nước hạ thấp S là quan hệ đường thăng đối với lô

khoan trong tầng chứa nước áp lực, con đối với lô khoan

trong tầng chứa nước không áp, quan hệ giữa Q và S là

quan hệ bậc hai parabol.

Thực tế hut nước thí nghiệm chứng minh rằng quan hệ

giữa lưu lượng Q và mực nước hạ thấp S rất phức tạp.

Page 29: Hoi quy PST

Copyright 2015

HỒI QUY THỰC NGHIỆM 29

PHÂN TÍCH HỒI QUY MŨ

Dạng phương trình hồi quy hàm mũ

ў = a0a1x1

a2x2

… amxm

Các bước tiến hành:

Tuyến tính hóa: ln ў = ln a0 + (ln a1) x1 + (ln a2) x2 + … + (ln am)

xm

Đặt ž = ln ў, b0 = ln a0, b1 = ln a1, b2 = ln a2, … , bm = ln am

Đưa về dạng phương trình hồi quy tuyến tính bội

ž = b0 + b1x1 + b2x2 + … + bmxm

Các bước tiếp theo như mục trước…->(b0, b1

, b2,…, bm)

Tìm lại các hệ số hồi quy ban đầu: (b0, b1

, b2,…, bm)->(a0

, a1, a2

,…,

am)

Biểu diễn phương trình hồi quy và đường hồi quy thực nghiệm

Trường hợp đặc biệt: m =1 -> PTHQ mũ một biến: ў = a0a1x1

Page 30: Hoi quy PST

Copyright 2015

HỒI QUY THỰC NGHIỆM 30

PHÂN TÍCH HỒI QUY MŨ (tt)

Bài toán ví dụ: Phân tích kết quả chơi cờ của máy tính

Number

of Games

X

Skill

Index

Y

lnY XlnY X2

3

7

8

12

14

9

9

4

11

13

12

8

7

6

3

126

=X

16

34

40

93

125

50

48

18

70

110

85

45

40

33

20

2.773

3.526

3.689

4.533

4.828

3.912

3.871

2.890

4.248

4.700

4.443

3.807

3.689

3.497

2.996

57.402

=lnY

8.318

24.685

29.511

54.391

67.596

35.208

34.841

11.561

46.733

61.106

53.312

30.453

25.822

20.979

8.987

513.505

=XlnY

9

49

64

144

196

81

81

16

121

169

144

64

49

36

9

1232

=X2

Page 31: Hoi quy PST

Copyright 2015

HỒI QUY THỰC NGHIỆM 31

y = 10.083(1.1972)X

0

50

100

0 5 10 15

Number of Games

Skill In

dex

PHÂN TÍCH HỒI QUY MŨ

Đƣờng cong hồi quy:

XX180312

2

21

197210710eY

X180312Y

312180

15

126

15

40257a

180

126123215

4025712350551315a

).(.ˆ

..ˆln

.).(.

ln

.)()(

).().(ln

..