بهينه سازي پرس جو هاي سرويس هاي وب

28
وب س هاي ي رو س و هاي ج رس پ ي ه ساز ن ي ه ب ري هب ز ي عل

Upload: jean

Post on 14-Jan-2016

46 views

Category:

Documents


3 download

DESCRIPTION

بهينه سازي پرس جو هاي سرويس هاي وب. علي رهبري. سرويس هاي وب. روشي استاندارد براي به اشتراک گذاري اطلاعات و قابليت ها. توصيف و پيدا کردن. ارتباطات. Data, کاربرد. WSDL,UDDI. سرويس وب. کاربران / کلاينت ها. SOAP. مثال سرويس وب. سمبول بورس. WS 1. اطلاعات شرکت. Reuters. - PowerPoint PPT Presentation

TRANSCRIPT

Page 1: بهينه سازي  پرس جو  هاي سرويس هاي  وب

بهينه سازي پرس جو هاي سرويس هاي وب

علي رهبري

Page 2: بهينه سازي  پرس جو  هاي سرويس هاي  وب

سرويس هاي وب

قابليت هاروشي استاندارد براي به اشتراک گذاري اطالعات و•

2

Data,کاربرد

توصيف و پيدا کردن•

WSDL,UDDIکاربران/کالينت ها SOAP

ارتباطات •

سرويس وب

Page 3: بهينه سازي  پرس جو  هاي سرويس هاي  وب

مثال سرويس وب

3

Reuters

WS1

سمبول بورس

NASDAQ

اطالعات شرکت

WS2

سمبول بورسفعاليت بورس

Page 4: بهينه سازي  پرس جو  هاي سرويس هاي  وب

پرس و جوهاي وب سرويس ها

4

WS1

سمبول بورس

NASDAQ

اطالعات شرکت

WS2

سمبول بورسفعاليت بورس

دريافت اطالعت ازهمه شرکت هاي با

تبادل با

/کاربرانکالينت ها

پرس و جو

نتايج

Reuters

ساده•شفاف•کارا•

Page 5: بهينه سازي  پرس جو  هاي سرويس هاي  وب

DBSMبرخي از اهداف ابتدايي به عنوانهاي مرسوم

5

دادهسيستم مديريت پايگاه داده

پرس و جو

نتايج

/کاربرانکالينت ها

واسط توصيفي

ساده•شفاف•کارا•

Page 6: بهينه سازي  پرس جو  هاي سرويس هاي  وب

WSMSسيستم مديريت وب سرويس

6

سيستم مديريت وبسرويس

پرس و /کاربرانجو

کالينت هانتايج

WS1

NASDAQ

WS2

Reutersروترها

ساده•شفاف•کارا•

Page 7: بهينه سازي  پرس جو  هاي سرويس هاي  وب

WSMSمعماري

7

کالينت

WS1

WS2

WSn

+پرس و جوداده ورودي

خروجي

واسط توصيفي WS Invocations

مولفه ابر داده

ثبت وب سرويس نگاشت شما

مولفه پردازش پرس و جو

اجراي طرح

پروفايلر زمان پاسخ ترکر آماري

مولفه آماري

WSMS

انتخاب طرح

Page 8: بهينه سازي  پرس جو  هاي سرويس هاي  وب

مثال

يک شرکت کارت اعتباري مي خواهد پيشنهادي براي مشترياني با مشخصات •

زير ارسال کند:

a) credit rating > 600

b) payment history = “good”

شرکت موارد زير را در اختيار دارد:•

L : List of potential recipients (identified by SSN)

WS1 : SSN credit rating

WS2 : SSN cc number(s)

WS3 : cc number payment history

8

Page 9: بهينه سازي  پرس جو  هاي سرويس هاي  وب

1طرح

9

کالينت

WS1

WS2

WS3

WSMS

L(SSN)

SSNcr

SSNccn

ccnph

Filter on cr, keep SSN

SSN

SSN,cr

SSN,ccn

SSN,ccn,ph

Filter on ph, keep SSN

توجه: پردازش پايپاليني

SSN cr1 5002 700

SSN ccn2 1232 456

ccn ph123 bad

456 good

SSN12

SSN2

طرح پرس و

جو

Page 10: بهينه سازي  پرس جو  هاي سرويس هاي  وب

1بيان ساده طرح

10

L نتايجWS

1

WS3

WS2

SSNcr SSNccn ccnph

Page 11: بهينه سازي  پرس جو  هاي سرويس هاي  وب

2طرح

11

کالينت

WS1

WS2

WS3

WSMS

L(SSN)

SSNcr

SSNccn

ccnph

Filter on cr, keep SSN

SSN SSN,cr

SSN,ccn

SSN,ccn,ph

Filter on ph, keep SSN

SSN cr1 5002 700

SSN ccn2 1232 456

ccn ph123 bad

456 good

SSN12

SSN2

Join

SSN

SSN

SSN

Page 12: بهينه سازي  پرس جو  هاي سرويس هاي  وب

2بيان ساده طرح

12

L نتايج

WS1

WS2

WS3

SSNcr

SSNccn ccnph

Page 13: بهينه سازي  پرس جو  هاي سرويس هاي  وب

کدام طرح بهتر است؟

13

L نتايج

WS1

WS2

WS3

L نتايجWS

1

WS3

WS2

2طرح

1طرح

! هيچگاه بدتر نيست1طرح

Page 14: بهينه سازي  پرس جو  هاي سرويس هاي  وب

بهينه سازي پرس و جو

P1, …, Pnطرح هاي پرس و جوي ممکن: •

Sآمار دسترسي به داده: •

cost(Pi, S) معيار هزينه اجرا:•

هدف پيدا کردن طرحي با کمترين هزينه است.•

14

Page 15: بهينه سازي  پرس جو  هاي سرويس هاي  وب

آمار

زمان پاسخ دهي سرويس هاي وب1)

انتخاب هاي وب سرويس ها2)

15

Page 16: بهينه سازي  پرس جو  هاي سرويس هاي  وب

آمار: زمان پاسخ•ri براي زمان پاسخ هر تاپل از وب سرويس :I

ام

16

WS1

SSNcrکالينتSSN

cr r1

• ri ≈ 1/throughput, can be reduced by batching, parallel calls

batching(see paper)

فرض انتخاب مستقل در طرح هاي پرس و جو•

Page 17: بهينه سازي  پرس جو  هاي سرويس هاي  وب

آمار: انتخاب ها

• si: selectivity of WSi• Average # output tuples per input tuple to WSi• including post-filtering in query plan

WS1: SSN cr, filter cr > 600If 90% of SSNs have cr > 600 then s1 = 0.9

WS2: SSN ccnIf on average each SSN has 2 credit cards then s2 = 2.0

17

فرض انتخاب مستقل در طرح هاي پرس و جو•

Page 18: بهينه سازي  پرس جو  هاي سرويس هاي  وب

معيار هزينه تنگنا

18

Conference Lunch Buffet

Dish 1 Dish 2 Dish 3 Dish 4

Average per-tuple processing time =response time of slowest (bottleneck) stage in pipeline

Note: selectivities=1 in this example

Page 19: بهينه سازي  پرس جو  هاي سرويس هاي  وب

Pمعادله هزينه براي طرح • Ri(P): Predecessors of WSi in plan P

19

• Fraction of input tuples seen by WSi =

• WSi response time per input tuple =

(assumes WSMS processing is not the bottleneck)

• Bottleneck cost metric:

Πj∈Ri(P) sj

(Πj∈Ri(P) sj)•ri

cost(P) = max1≤i≤n( (Πj∈Ri(P) sj)•ri )

Page 20: بهينه سازي  پرس جو  هاي سرويس هاي  وب

مقايسه با معيار هزينه کل

20

Dish 1 Dish 2 Dish 3 Dish 4

• Stream filter ordering• Expensive predicate placement

“Polite” Lunch Buffet

cost(P) = ∑1≤i≤n( (Πj∈Ri(P) sj)•ri )

Page 21: بهينه سازي  پرس جو  هاي سرويس هاي  وب

بيان مسئله

• :ورودي– Web services WS1, …, WSn

– Response times r1, …, rn

– Selectivities s1, …, sn

– Precedence constraints among web services• :خروجي– Web services arranged into a plan P – P respects all precedence constraints– cost(P) is minimized

21

Page 22: بهينه سازي  پرس جو  هاي سرويس هاي  وب

بدون قيد اولويت• All selectivities ≤ 1• Theorem: Optimal to order linearly by ri• (selectivities irrelevant)

• General case• (optimal):

22

… join at WSMS

“selective” web services ordered by response-time

“proliferative” web services

Results

Page 23: بهينه سازي  پرس جو  هاي سرويس هاي  وب

با قيود اولويت

23

cost(P) = max1≤i≤n( (Πj∈Ri(P) sj)•ri )

Page 24: بهينه سازي  پرس جو  هاي سرويس هاي  وب

با قيود اولويت

•Sum cost metric– Hard to even obtain a factor O(n) of optimal

24

cost(P) = ∑1≤i≤n( (Πj∈Ri(P) sj)•ri )

Page 25: بهينه سازي  پرس جو  هاي سرويس هاي  وب

با قيود اولويت

•Bottleneck (max) cost metric– Surprisingly, optimal solution in polynomial time– O(n5) algorithm in paper• Add one WS at a time to the plan• WS chosen by solving a linear program

25

cost(P) = max1≤i≤n( (Πj∈Ri(P) sj)•ri )

Page 26: بهينه سازي  پرس جو  هاي سرويس هاي  وب

بررسي دوباره مثال

26

L Results

WS1

WS2

WS3

L ResultsWS

1

WS3

WS2

2طرح

1طرح SSNcr

SSNcr

SSNccn

SSNccn

ccnph

ccnph

WS2

WS1

WS3

WS1

WS2

WS3

Selective

Proliferative

WS2

WS3

Precedence constraint

max1≤i≤n( (Πj∈Ri(P) sj)•ri )

Page 27: بهينه سازي  پرس جو  هاي سرويس هاي  وب

پياده سازي

• Built prototype WSMS query processor– Optimizer and execution engine– Assumes schema issues resolved, statistics

provided– Written in Java and uses Apache Axis

(open-source SOAP implementation)– Experiments (see paper) validate analytical results

27

Page 28: بهينه سازي  پرس جو  هاي سرويس هاي  وب

مراجع

[1] S. Abiteboul et al. Lazy query evaluation for active XML. In Proc. of the 2004 ACM SIGMOD Intl. Conf.

on Management of Data, pages 227–238, 2004.

[2] Apache Axis. http://ws.apache.org/axis/.

[3] S. Babu et al. Adaptive ordering of pipelined stream filters. In Proc. of the 2004 ACM SIGMOD Intl.

Conf. on Management of Data, pages 407–418, 2004.

[4] Business Process Execution Language for Web Services.

ftp://www6.software.ibm.com/software/developer/library/ws-bpel.pdf

[5] N. Bruno, S. Chaudhuri, and L. Gravano. STHoles: A multidimensional workload-aware histogram. In

Proc. of the2001 ACM SIGMOD Intl. Conf. on Management of Data, pages 211–222, 2001.

[6] J. Burge, K. Munagala, and U. Srivastava. Ordering pipelined operators with precedence constraints.

Available at http://dbpubs.stanford.edu/pub/2005-40.

28