بهينه سازي پرس جو هاي سرويس هاي وب
DESCRIPTION
بهينه سازي پرس جو هاي سرويس هاي وب. علي رهبري. سرويس هاي وب. روشي استاندارد براي به اشتراک گذاري اطلاعات و قابليت ها. توصيف و پيدا کردن. ارتباطات. Data, کاربرد. WSDL,UDDI. سرويس وب. کاربران / کلاينت ها. SOAP. مثال سرويس وب. سمبول بورس. WS 1. اطلاعات شرکت. Reuters. - PowerPoint PPT PresentationTRANSCRIPT
بهينه سازي پرس جو هاي سرويس هاي وب
علي رهبري
سرويس هاي وب
قابليت هاروشي استاندارد براي به اشتراک گذاري اطالعات و•
2
Data,کاربرد
توصيف و پيدا کردن•
WSDL,UDDIکاربران/کالينت ها SOAP
ارتباطات •
سرويس وب
مثال سرويس وب
3
Reuters
WS1
سمبول بورس
NASDAQ
اطالعات شرکت
WS2
سمبول بورسفعاليت بورس
پرس و جوهاي وب سرويس ها
4
WS1
سمبول بورس
NASDAQ
اطالعات شرکت
WS2
سمبول بورسفعاليت بورس
دريافت اطالعت ازهمه شرکت هاي با
تبادل با
/کاربرانکالينت ها
پرس و جو
نتايج
Reuters
ساده•شفاف•کارا•
DBSMبرخي از اهداف ابتدايي به عنوانهاي مرسوم
5
دادهسيستم مديريت پايگاه داده
پرس و جو
نتايج
/کاربرانکالينت ها
واسط توصيفي
ساده•شفاف•کارا•
WSMSسيستم مديريت وب سرويس
6
سيستم مديريت وبسرويس
پرس و /کاربرانجو
کالينت هانتايج
WS1
NASDAQ
WS2
Reutersروترها
ساده•شفاف•کارا•
WSMSمعماري
7
کالينت
WS1
WS2
WSn
+پرس و جوداده ورودي
خروجي
واسط توصيفي WS Invocations
مولفه ابر داده
ثبت وب سرويس نگاشت شما
مولفه پردازش پرس و جو
اجراي طرح
پروفايلر زمان پاسخ ترکر آماري
مولفه آماري
WSMS
انتخاب طرح
مثال
يک شرکت کارت اعتباري مي خواهد پيشنهادي براي مشترياني با مشخصات •
زير ارسال کند:
a) credit rating > 600
b) payment history = “good”
شرکت موارد زير را در اختيار دارد:•
L : List of potential recipients (identified by SSN)
WS1 : SSN credit rating
WS2 : SSN cc number(s)
WS3 : cc number payment history
8
1طرح
9
کالينت
WS1
WS2
WS3
WSMS
L(SSN)
SSNcr
SSNccn
ccnph
Filter on cr, keep SSN
SSN
SSN,cr
SSN,ccn
SSN,ccn,ph
Filter on ph, keep SSN
توجه: پردازش پايپاليني
SSN cr1 5002 700
SSN ccn2 1232 456
ccn ph123 bad
456 good
SSN12
SSN2
طرح پرس و
جو
1بيان ساده طرح
10
L نتايجWS
1
WS3
WS2
SSNcr SSNccn ccnph
2طرح
11
کالينت
WS1
WS2
WS3
WSMS
L(SSN)
SSNcr
SSNccn
ccnph
Filter on cr, keep SSN
SSN SSN,cr
SSN,ccn
SSN,ccn,ph
Filter on ph, keep SSN
SSN cr1 5002 700
SSN ccn2 1232 456
ccn ph123 bad
456 good
SSN12
SSN2
Join
SSN
SSN
SSN
2بيان ساده طرح
12
L نتايج
WS1
WS2
WS3
SSNcr
SSNccn ccnph
کدام طرح بهتر است؟
13
L نتايج
WS1
WS2
WS3
L نتايجWS
1
WS3
WS2
2طرح
1طرح
! هيچگاه بدتر نيست1طرح
بهينه سازي پرس و جو
P1, …, Pnطرح هاي پرس و جوي ممکن: •
Sآمار دسترسي به داده: •
cost(Pi, S) معيار هزينه اجرا:•
هدف پيدا کردن طرحي با کمترين هزينه است.•
14
آمار
زمان پاسخ دهي سرويس هاي وب1)
انتخاب هاي وب سرويس ها2)
15
آمار: زمان پاسخ•ri براي زمان پاسخ هر تاپل از وب سرويس :I
ام
16
WS1
SSNcrکالينتSSN
cr r1
• ri ≈ 1/throughput, can be reduced by batching, parallel calls
batching(see paper)
فرض انتخاب مستقل در طرح هاي پرس و جو•
آمار: انتخاب ها
• si: selectivity of WSi• Average # output tuples per input tuple to WSi• including post-filtering in query plan
WS1: SSN cr, filter cr > 600If 90% of SSNs have cr > 600 then s1 = 0.9
WS2: SSN ccnIf on average each SSN has 2 credit cards then s2 = 2.0
17
فرض انتخاب مستقل در طرح هاي پرس و جو•
معيار هزينه تنگنا
18
Conference Lunch Buffet
Dish 1 Dish 2 Dish 3 Dish 4
Average per-tuple processing time =response time of slowest (bottleneck) stage in pipeline
Note: selectivities=1 in this example
Pمعادله هزينه براي طرح • Ri(P): Predecessors of WSi in plan P
19
• Fraction of input tuples seen by WSi =
• WSi response time per input tuple =
(assumes WSMS processing is not the bottleneck)
• Bottleneck cost metric:
Πj∈Ri(P) sj
(Πj∈Ri(P) sj)•ri
cost(P) = max1≤i≤n( (Πj∈Ri(P) sj)•ri )
مقايسه با معيار هزينه کل
20
Dish 1 Dish 2 Dish 3 Dish 4
• Stream filter ordering• Expensive predicate placement
“Polite” Lunch Buffet
cost(P) = ∑1≤i≤n( (Πj∈Ri(P) sj)•ri )
بيان مسئله
• :ورودي– Web services WS1, …, WSn
– Response times r1, …, rn
– Selectivities s1, …, sn
– Precedence constraints among web services• :خروجي– Web services arranged into a plan P – P respects all precedence constraints– cost(P) is minimized
21
بدون قيد اولويت• All selectivities ≤ 1• Theorem: Optimal to order linearly by ri• (selectivities irrelevant)
• General case• (optimal):
22
… join at WSMS
“selective” web services ordered by response-time
“proliferative” web services
Results
با قيود اولويت
23
cost(P) = max1≤i≤n( (Πj∈Ri(P) sj)•ri )
با قيود اولويت
•Sum cost metric– Hard to even obtain a factor O(n) of optimal
24
cost(P) = ∑1≤i≤n( (Πj∈Ri(P) sj)•ri )
با قيود اولويت
•Bottleneck (max) cost metric– Surprisingly, optimal solution in polynomial time– O(n5) algorithm in paper• Add one WS at a time to the plan• WS chosen by solving a linear program
25
cost(P) = max1≤i≤n( (Πj∈Ri(P) sj)•ri )
بررسي دوباره مثال
26
L Results
WS1
WS2
WS3
L ResultsWS
1
WS3
WS2
2طرح
1طرح SSNcr
SSNcr
SSNccn
SSNccn
ccnph
ccnph
WS2
WS1
WS3
WS1
WS2
WS3
Selective
Proliferative
WS2
WS3
Precedence constraint
max1≤i≤n( (Πj∈Ri(P) sj)•ri )
پياده سازي
• Built prototype WSMS query processor– Optimizer and execution engine– Assumes schema issues resolved, statistics
provided– Written in Java and uses Apache Axis
(open-source SOAP implementation)– Experiments (see paper) validate analytical results
27
مراجع
[1] S. Abiteboul et al. Lazy query evaluation for active XML. In Proc. of the 2004 ACM SIGMOD Intl. Conf.
on Management of Data, pages 227–238, 2004.
[2] Apache Axis. http://ws.apache.org/axis/.
[3] S. Babu et al. Adaptive ordering of pipelined stream filters. In Proc. of the 2004 ACM SIGMOD Intl.
Conf. on Management of Data, pages 407–418, 2004.
[4] Business Process Execution Language for Web Services.
ftp://www6.software.ibm.com/software/developer/library/ws-bpel.pdf
[5] N. Bruno, S. Chaudhuri, and L. Gravano. STHoles: A multidimensional workload-aware histogram. In
Proc. of the2001 ACM SIGMOD Intl. Conf. on Management of Data, pages 211–222, 2001.
[6] J. Burge, K. Munagala, and U. Srivastava. Ordering pipelined operators with precedence constraints.
Available at http://dbpubs.stanford.edu/pub/2005-40.
28