بهينه سازي پرس جو هاي سرويس هاي وب

Post on 14-Jan-2016

46 Views

Category:

Documents

3 Downloads

Preview:

Click to see full reader

DESCRIPTION

بهينه سازي پرس جو هاي سرويس هاي وب. علي رهبري. سرويس هاي وب. روشي استاندارد براي به اشتراک گذاري اطلاعات و قابليت ها. توصيف و پيدا کردن. ارتباطات. Data, کاربرد. WSDL,UDDI. سرويس وب. کاربران / کلاينت ها. SOAP. مثال سرويس وب. سمبول بورس. WS 1. اطلاعات شرکت. Reuters. - PowerPoint PPT Presentation

TRANSCRIPT

بهينه سازي پرس جو هاي سرويس هاي وب

علي رهبري

سرويس هاي وب

قابليت هاروشي استاندارد براي به اشتراک گذاري اطالعات و•

2

Data,کاربرد

توصيف و پيدا کردن•

WSDL,UDDIکاربران/کالينت ها SOAP

ارتباطات •

سرويس وب

مثال سرويس وب

3

Reuters

WS1

سمبول بورس

NASDAQ

اطالعات شرکت

WS2

سمبول بورسفعاليت بورس

پرس و جوهاي وب سرويس ها

4

WS1

سمبول بورس

NASDAQ

اطالعات شرکت

WS2

سمبول بورسفعاليت بورس

دريافت اطالعت ازهمه شرکت هاي با

تبادل با

/کاربرانکالينت ها

پرس و جو

نتايج

Reuters

ساده•شفاف•کارا•

DBSMبرخي از اهداف ابتدايي به عنوانهاي مرسوم

5

دادهسيستم مديريت پايگاه داده

پرس و جو

نتايج

/کاربرانکالينت ها

واسط توصيفي

ساده•شفاف•کارا•

WSMSسيستم مديريت وب سرويس

6

سيستم مديريت وبسرويس

پرس و /کاربرانجو

کالينت هانتايج

WS1

NASDAQ

WS2

Reutersروترها

ساده•شفاف•کارا•

WSMSمعماري

7

کالينت

WS1

WS2

WSn

+پرس و جوداده ورودي

خروجي

واسط توصيفي WS Invocations

مولفه ابر داده

ثبت وب سرويس نگاشت شما

مولفه پردازش پرس و جو

اجراي طرح

پروفايلر زمان پاسخ ترکر آماري

مولفه آماري

WSMS

انتخاب طرح

مثال

يک شرکت کارت اعتباري مي خواهد پيشنهادي براي مشترياني با مشخصات •

زير ارسال کند:

a) credit rating > 600

b) payment history = “good”

شرکت موارد زير را در اختيار دارد:•

L : List of potential recipients (identified by SSN)

WS1 : SSN credit rating

WS2 : SSN cc number(s)

WS3 : cc number payment history

8

1طرح

9

کالينت

WS1

WS2

WS3

WSMS

L(SSN)

SSNcr

SSNccn

ccnph

Filter on cr, keep SSN

SSN

SSN,cr

SSN,ccn

SSN,ccn,ph

Filter on ph, keep SSN

توجه: پردازش پايپاليني

SSN cr1 5002 700

SSN ccn2 1232 456

ccn ph123 bad

456 good

SSN12

SSN2

طرح پرس و

جو

1بيان ساده طرح

10

L نتايجWS

1

WS3

WS2

SSNcr SSNccn ccnph

2طرح

11

کالينت

WS1

WS2

WS3

WSMS

L(SSN)

SSNcr

SSNccn

ccnph

Filter on cr, keep SSN

SSN SSN,cr

SSN,ccn

SSN,ccn,ph

Filter on ph, keep SSN

SSN cr1 5002 700

SSN ccn2 1232 456

ccn ph123 bad

456 good

SSN12

SSN2

Join

SSN

SSN

SSN

2بيان ساده طرح

12

L نتايج

WS1

WS2

WS3

SSNcr

SSNccn ccnph

کدام طرح بهتر است؟

13

L نتايج

WS1

WS2

WS3

L نتايجWS

1

WS3

WS2

2طرح

1طرح

! هيچگاه بدتر نيست1طرح

بهينه سازي پرس و جو

P1, …, Pnطرح هاي پرس و جوي ممکن: •

Sآمار دسترسي به داده: •

cost(Pi, S) معيار هزينه اجرا:•

هدف پيدا کردن طرحي با کمترين هزينه است.•

14

آمار

زمان پاسخ دهي سرويس هاي وب1)

انتخاب هاي وب سرويس ها2)

15

آمار: زمان پاسخ•ri براي زمان پاسخ هر تاپل از وب سرويس :I

ام

16

WS1

SSNcrکالينتSSN

cr r1

• ri ≈ 1/throughput, can be reduced by batching, parallel calls

batching(see paper)

فرض انتخاب مستقل در طرح هاي پرس و جو•

آمار: انتخاب ها

• si: selectivity of WSi• Average # output tuples per input tuple to WSi• including post-filtering in query plan

WS1: SSN cr, filter cr > 600If 90% of SSNs have cr > 600 then s1 = 0.9

WS2: SSN ccnIf on average each SSN has 2 credit cards then s2 = 2.0

17

فرض انتخاب مستقل در طرح هاي پرس و جو•

معيار هزينه تنگنا

18

Conference Lunch Buffet

Dish 1 Dish 2 Dish 3 Dish 4

Average per-tuple processing time =response time of slowest (bottleneck) stage in pipeline

Note: selectivities=1 in this example

Pمعادله هزينه براي طرح • Ri(P): Predecessors of WSi in plan P

19

• Fraction of input tuples seen by WSi =

• WSi response time per input tuple =

(assumes WSMS processing is not the bottleneck)

• Bottleneck cost metric:

Πj∈Ri(P) sj

(Πj∈Ri(P) sj)•ri

cost(P) = max1≤i≤n( (Πj∈Ri(P) sj)•ri )

مقايسه با معيار هزينه کل

20

Dish 1 Dish 2 Dish 3 Dish 4

• Stream filter ordering• Expensive predicate placement

“Polite” Lunch Buffet

cost(P) = ∑1≤i≤n( (Πj∈Ri(P) sj)•ri )

بيان مسئله

• :ورودي– Web services WS1, …, WSn

– Response times r1, …, rn

– Selectivities s1, …, sn

– Precedence constraints among web services• :خروجي– Web services arranged into a plan P – P respects all precedence constraints– cost(P) is minimized

21

بدون قيد اولويت• All selectivities ≤ 1• Theorem: Optimal to order linearly by ri• (selectivities irrelevant)

• General case• (optimal):

22

… join at WSMS

“selective” web services ordered by response-time

“proliferative” web services

Results

با قيود اولويت

23

cost(P) = max1≤i≤n( (Πj∈Ri(P) sj)•ri )

با قيود اولويت

•Sum cost metric– Hard to even obtain a factor O(n) of optimal

24

cost(P) = ∑1≤i≤n( (Πj∈Ri(P) sj)•ri )

با قيود اولويت

•Bottleneck (max) cost metric– Surprisingly, optimal solution in polynomial time– O(n5) algorithm in paper• Add one WS at a time to the plan• WS chosen by solving a linear program

25

cost(P) = max1≤i≤n( (Πj∈Ri(P) sj)•ri )

بررسي دوباره مثال

26

L Results

WS1

WS2

WS3

L ResultsWS

1

WS3

WS2

2طرح

1طرح SSNcr

SSNcr

SSNccn

SSNccn

ccnph

ccnph

WS2

WS1

WS3

WS1

WS2

WS3

Selective

Proliferative

WS2

WS3

Precedence constraint

max1≤i≤n( (Πj∈Ri(P) sj)•ri )

پياده سازي

• Built prototype WSMS query processor– Optimizer and execution engine– Assumes schema issues resolved, statistics

provided– Written in Java and uses Apache Axis

(open-source SOAP implementation)– Experiments (see paper) validate analytical results

27

مراجع

[1] S. Abiteboul et al. Lazy query evaluation for active XML. In Proc. of the 2004 ACM SIGMOD Intl. Conf.

on Management of Data, pages 227–238, 2004.

[2] Apache Axis. http://ws.apache.org/axis/.

[3] S. Babu et al. Adaptive ordering of pipelined stream filters. In Proc. of the 2004 ACM SIGMOD Intl.

Conf. on Management of Data, pages 407–418, 2004.

[4] Business Process Execution Language for Web Services.

ftp://www6.software.ibm.com/software/developer/library/ws-bpel.pdf

[5] N. Bruno, S. Chaudhuri, and L. Gravano. STHoles: A multidimensional workload-aware histogram. In

Proc. of the2001 ACM SIGMOD Intl. Conf. on Management of Data, pages 211–222, 2001.

[6] J. Burge, K. Munagala, and U. Srivastava. Ordering pipelined operators with precedence constraints.

Available at http://dbpubs.stanford.edu/pub/2005-40.

28

top related