٢٩/١ ١٣٩٧نﺎﺑآ٢٣ ﻮﯾ ﯽﭘ...

29
. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . ٢٩ / ١ ١٣٩٧ آﺑﺎن٢٣ ﮏ ﺑﺎ ﭘﺮدازش ﻣﻮازی روی ﺟﯽﭘﯽﯾﻮُُ اﻓﺰاﯾﺶ ﺳﺮﻋﺖ ﺑﻬﯿﻨﻪﺳﺎزی ﺗ(داﻧﺸﮕﺎه ﺣﮑﯿﻢ ﺳﺒﺰواری) ﺑﺎﺑﮏ ﺧﻮشﻧﻮﯾﺲ

Upload: others

Post on 07-Feb-2020

0 views

Category:

Documents


0 download

TRANSCRIPT

Page 1: ٢٩/١ ١٣٩٧نﺎﺑآ٢٣ ﻮﯾ ﯽﭘ …mamintoosi.ir/dl/pubs/1397-sco2-parallel-sparse-Khoshnevis-presentation.pdfافزایش سرعت بهینهسازی تُنُک با

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

٢٩ / ١ ١٣٩٧ آبان ٢٣ جی پی یو روی موازی پردازش با تنک بهینه سازی سرعت افزایش سبزواری) حکیم (دانشگاه خوش نویس بابک

Page 2: ٢٩/١ ١٣٩٧نﺎﺑآ٢٣ ﻮﯾ ﯽﭘ …mamintoosi.ir/dl/pubs/1397-sco2-parallel-sparse-Khoshnevis-presentation.pdfافزایش سرعت بهینهسازی تُنُک با

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

جی پی یو روی موازی پردازش با تنک بهینه سازی سرعت افزایش

بهینه سازی و کنترل سمینار دومین

دهنده) (ارائه خوش نویس بابک طوسی، امین محمود دکترکارشناسی ارشد دانشجو استادیار،

١٣٩٧ آبان ٢٣

٢٩ / ٢ ١٣٩٧ آبان ٢٣ جی پی یو روی موازی پردازش با تنک بهینه سازی سرعت افزایش سبزواری) حکیم (دانشگاه خوش نویس بابک

Page 3: ٢٩/١ ١٣٩٧نﺎﺑآ٢٣ ﻮﯾ ﯽﭘ …mamintoosi.ir/dl/pubs/1397-sco2-parallel-sparse-Khoshnevis-presentation.pdfافزایش سرعت بهینهسازی تُنُک با

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

قد٢٩ / ٣ ١٣٩٧ آبان ٢٣ جی پی یو روی موازی پردازش با تنک بهینه سازی سرعت افزایش سبزواری) حکیم (دانشگاه خوش نویس بابک

Page 4: ٢٩/١ ١٣٩٧نﺎﺑآ٢٣ ﻮﯾ ﯽﭘ …mamintoosi.ir/dl/pubs/1397-sco2-parallel-sparse-Khoshnevis-presentation.pdfافزایش سرعت بهینهسازی تُنُک با

معرفی مقدمه

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

معرفی

روی آن پیاده سازی با مرکزی پردازنده روی تطابقی جستجوی الگوریتم پیاده سازی مقاله این در ◀

است. گرفته قرار مقایسه مورد گرافیکی پردازندهمی دهد. نشان را گرافیکی پردازنده فوق العاده عملکرد و باال محاسباتی توان مقایسه این ◀

٢٩ / ۴ ١٣٩٧ آبان ٢٣ جی پی یو روی موازی پردازش با تنک بهینه سازی سرعت افزایش سبزواری) حکیم (دانشگاه خوش نویس بابک

Page 5: ٢٩/١ ١٣٩٧نﺎﺑآ٢٣ ﻮﯾ ﯽﭘ …mamintoosi.ir/dl/pubs/1397-sco2-parallel-sparse-Khoshnevis-presentation.pdfافزایش سرعت بهینهسازی تُنُک با

اجمالی نگاه مقدمه

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

اجمالی نگاه

٢٩ / ۵ ١٣٩٧ آبان ٢٣ جی پی یو روی موازی پردازش با تنک بهینه سازی سرعت افزایش سبزواری) حکیم (دانشگاه خوش نویس بابک

Page 6: ٢٩/١ ١٣٩٧نﺎﺑآ٢٣ ﻮﯾ ﯽﭘ …mamintoosi.ir/dl/pubs/1397-sco2-parallel-sparse-Khoshnevis-presentation.pdfافزایش سرعت بهینهسازی تُنُک با

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

نک ه سازی٢٩ / ۶ ١٣٩٧ آبان ٢٣ جی پی یو روی موازی پردازش با تنک بهینه سازی سرعت افزایش سبزواری) حکیم (دانشگاه خوش نویس بابک

Page 7: ٢٩/١ ١٣٩٧نﺎﺑآ٢٣ ﻮﯾ ﯽﭘ …mamintoosi.ir/dl/pubs/1397-sco2-parallel-sparse-Khoshnevis-presentation.pdfافزایش سرعت بهینهسازی تُنُک با

کلی نگاه تنک بهینه سازی

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

کلی نگاه

٢٩ / ٧ ١٣٩٧ آبان ٢٣ جی پی یو روی موازی پردازش با تنک بهینه سازی سرعت افزایش سبزواری) حکیم (دانشگاه خوش نویس بابک

Page 8: ٢٩/١ ١٣٩٧نﺎﺑآ٢٣ ﻮﯾ ﯽﭘ …mamintoosi.ir/dl/pubs/1397-sco2-parallel-sparse-Khoshnevis-presentation.pdfافزایش سرعت بهینهسازی تُنُک با

تنک نمایش تنک بهینه سازی

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

داده مدل سازی

٢٩ / ٨ ١٣٩٧ آبان ٢٣ جی پی یو روی موازی پردازش با تنک بهینه سازی سرعت افزایش سبزواری) حکیم (دانشگاه خوش نویس بابک

Page 9: ٢٩/١ ١٣٩٧نﺎﺑآ٢٣ ﻮﯾ ﯽﭘ …mamintoosi.ir/dl/pubs/1397-sco2-parallel-sparse-Khoshnevis-presentation.pdfافزایش سرعت بهینهسازی تُنُک با

تنک نمایش تنک بهینه سازی

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

مثال

٢٩ / ٩ ١٣٩٧ آبان ٢٣ جی پی یو روی موازی پردازش با تنک بهینه سازی سرعت افزایش سبزواری) حکیم (دانشگاه خوش نویس بابک

Page 10: ٢٩/١ ١٣٩٧نﺎﺑآ٢٣ ﻮﯾ ﯽﭘ …mamintoosi.ir/dl/pubs/1397-sco2-parallel-sparse-Khoshnevis-presentation.pdfافزایش سرعت بهینهسازی تُنُک با

تنک نمایش تنک بهینه سازی

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

منظم سازی

٢٩ / ١٠ ١٣٩٧ آبان ٢٣ جی پی یو روی موازی پردازش با تنک بهینه سازی سرعت افزایش سبزواری) حکیم (دانشگاه خوش نویس بابک

Page 11: ٢٩/١ ١٣٩٧نﺎﺑآ٢٣ ﻮﯾ ﯽﭘ …mamintoosi.ir/dl/pubs/1397-sco2-parallel-sparse-Khoshnevis-presentation.pdfافزایش سرعت بهینهسازی تُنُک با

منظم سازی تنک بهینه سازی

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

P١ مسئله

می باشد. Lp نرم خانواده هستند، محدب که توابع مجموعه یک ◀

(Lp (نرم تعریف

Lp : ∥x∥p =

(∑k

∣∣xpk∣∣) ١

p

for p ∈ [١,∞)

می شود. تنک جواب های به منجر L١ نرم از استفاده ◀

(P١ (مسئله تعریف

(P١) minx

∥x∥١ s.t. Ax = b

٢٩ / ١١ ١٣٩٧ آبان ٢٣ جی پی یو روی موازی پردازش با تنک بهینه سازی سرعت افزایش سبزواری) حکیم (دانشگاه خوش نویس بابک

Page 12: ٢٩/١ ١٣٩٧نﺎﺑآ٢٣ ﻮﯾ ﯽﭘ …mamintoosi.ir/dl/pubs/1397-sco2-parallel-sparse-Khoshnevis-presentation.pdfافزایش سرعت بهینهسازی تُنُک با

منظم سازی تنک بهینه سازی

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

P٢ و P١ مقایسه

دارد. تنک جواب های خطی مسائل حل P١ مسئله ◀

مثال

جواب به رسیدن در خطی محدودیت با L٢ و L١ مقایسه شکل:

٢٩ / ١٢ ١٣٩٧ آبان ٢٣ جی پی یو روی موازی پردازش با تنک بهینه سازی سرعت افزایش سبزواری) حکیم (دانشگاه خوش نویس بابک

Page 13: ٢٩/١ ١٣٩٧نﺎﺑآ٢٣ ﻮﯾ ﯽﭘ …mamintoosi.ir/dl/pubs/1397-sco2-parallel-sparse-Khoshnevis-presentation.pdfافزایش سرعت بهینهسازی تُنُک با

منظم سازی تنک بهینه سازی

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

P٠ مسئله

(L٠ (نرم تعریف

برمی گرداند. را x بردار در غیرصفر عناصر تعداد ،(∥x∥٠) L٠ نرم ساده، بیان به

(P٠ (مسئله تعریف

(P٠) minx

∥x∥٠ s.t. Ax = b

قضیهمی باشد Ax = b نامعین خطی سیستم با معادالت جواب های تنک ترین دنبال به P٠ مسئله

٢٩ / ١٣ ١٣٩٧ آبان ٢٣ جی پی یو روی موازی پردازش با تنک بهینه سازی سرعت افزایش سبزواری) حکیم (دانشگاه خوش نویس بابک

Page 14: ٢٩/١ ١٣٩٧نﺎﺑآ٢٣ ﻮﯾ ﯽﭘ …mamintoosi.ir/dl/pubs/1397-sco2-parallel-sparse-Khoshnevis-presentation.pdfافزایش سرعت بهینهسازی تُنُک با

جستجو الگوریتم های تنک بهینه سازی

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

تطابقی جستجوی

٢٩ / ١۴ ١٣٩٧ آبان ٢٣ جی پی یو روی موازی پردازش با تنک بهینه سازی سرعت افزایش سبزواری) حکیم (دانشگاه خوش نویس بابک

Page 15: ٢٩/١ ١٣٩٧نﺎﺑآ٢٣ ﻮﯾ ﯽﭘ …mamintoosi.ir/dl/pubs/1397-sco2-parallel-sparse-Khoshnevis-presentation.pdfافزایش سرعت بهینهسازی تُنُک با

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

وازی سازی٢٩ / ١۵ ١٣٩٧ آبان ٢٣ جی پی یو روی موازی پردازش با تنک بهینه سازی سرعت افزایش سبزواری) حکیم (دانشگاه خوش نویس بابک

Page 16: ٢٩/١ ١٣٩٧نﺎﺑآ٢٣ ﻮﯾ ﯽﭘ …mamintoosi.ir/dl/pubs/1397-sco2-parallel-sparse-Khoshnevis-presentation.pdfافزایش سرعت بهینهسازی تُنُک با

ناهمگون موازی محاسبات موازی سازی

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

CPU vs. GPU

٢٩ / ١۶ ١٣٩٧ آبان ٢٣ جی پی یو روی موازی پردازش با تنک بهینه سازی سرعت افزایش سبزواری) حکیم (دانشگاه خوش نویس بابک

Page 17: ٢٩/١ ١٣٩٧نﺎﺑآ٢٣ ﻮﯾ ﯽﭘ …mamintoosi.ir/dl/pubs/1397-sco2-parallel-sparse-Khoshnevis-presentation.pdfافزایش سرعت بهینهسازی تُنُک با

ناهمگون موازی محاسبات موازی سازی

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

ناهمگون موازی محاسبات

٢٩ / ١٧ ١٣٩٧ آبان ٢٣ جی پی یو روی موازی پردازش با تنک بهینه سازی سرعت افزایش سبزواری) حکیم (دانشگاه خوش نویس بابک

Page 18: ٢٩/١ ١٣٩٧نﺎﺑآ٢٣ ﻮﯾ ﯽﭘ …mamintoosi.ir/dl/pubs/1397-sco2-parallel-sparse-Khoshnevis-presentation.pdfافزایش سرعت بهینهسازی تُنُک با

کودا برنامه نویسی موازی سازی

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

کودا معماری

٢٩ / ١٨ ١٣٩٧ آبان ٢٣ جی پی یو روی موازی پردازش با تنک بهینه سازی سرعت افزایش سبزواری) حکیم (دانشگاه خوش نویس بابک

Page 19: ٢٩/١ ١٣٩٧نﺎﺑآ٢٣ ﻮﯾ ﯽﭘ …mamintoosi.ir/dl/pubs/1397-sco2-parallel-sparse-Khoshnevis-presentation.pdfافزایش سرعت بهینهسازی تُنُک با

کودا برنامه نویسی موازی سازی

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

کودا معماری

٢٩ / ١٩ ١٣٩٧ آبان ٢٣ جی پی یو روی موازی پردازش با تنک بهینه سازی سرعت افزایش سبزواری) حکیم (دانشگاه خوش نویس بابک

Page 20: ٢٩/١ ١٣٩٧نﺎﺑآ٢٣ ﻮﯾ ﯽﭘ …mamintoosi.ir/dl/pubs/1397-sco2-parallel-sparse-Khoshnevis-presentation.pdfافزایش سرعت بهینهسازی تُنُک با

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

ده سازی٢٩ / ٢٠ ١٣٩٧ آبان ٢٣ جی پی یو روی موازی پردازش با تنک بهینه سازی سرعت افزایش سبزواری) حکیم (دانشگاه خوش نویس بابک

Page 21: ٢٩/١ ١٣٩٧نﺎﺑآ٢٣ ﻮﯾ ﯽﭘ …mamintoosi.ir/dl/pubs/1397-sco2-parallel-sparse-Khoshnevis-presentation.pdfافزایش سرعت بهینهسازی تُنُک با

کلی نگاه پیاده سازی

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

کلی نگاه

جی پی یو برتری نمایش و تنک بهینه سازی در جی پی یو و سی پی یو عملکرد مقایسه اصلی هدف ◀

است. عمل در سی پی یو به نسبتروی تصادفی صورت به شده تولید داده های روی تطابقی جستجوی الگوریتم تحلیل و اجرا ◀

گرفته است. صورت جی پی یو و سی پی یوانجام BLAS کتابخانه توابع از استفاده با (میزبان)، سی پی یو روی الگوریتم این پیاده سازی ◀

می شود.شده است. استفاده cuBLAS کتابخانه از جی پی یو، روی پیاده سازی برای ◀

٢٩ / ٢١ ١٣٩٧ آبان ٢٣ جی پی یو روی موازی پردازش با تنک بهینه سازی سرعت افزایش سبزواری) حکیم (دانشگاه خوش نویس بابک

Page 22: ٢٩/١ ١٣٩٧نﺎﺑآ٢٣ ﻮﯾ ﯽﭘ …mamintoosi.ir/dl/pubs/1397-sco2-parallel-sparse-Khoshnevis-presentation.pdfافزایش سرعت بهینهسازی تُنُک با

معرفی پیاده سازی

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

cuBLAS کتابخانه

تحت خطی) جبر (زیربرنامه های BLAS کتابخانه پیاده سازی کتابخانه این ◀

است. NVIDIA®CUDA™ runtimeمی سازد. فراهم کاربر برای را ان ویدیا (جی پی یو) گرافیکی پردازنده منابع به دسترسی امکان ◀

بردارهای و ماتریس ها باید برنامه ،cuBLAS کاربردی برنامه نویسی رابط از استفاده جهت ◀

توابع توالی دهد، قرار آن ها در را داده ها دهد، تخصیص جی پی یو حافظه فضای به را الزممیزبان به جی پی یو حافظه از را نتایج سپس و نماید فراخوانی را نظر مورد cuBLAS

بازگرداند.

٢٩ / ٢٢ ١٣٩٧ آبان ٢٣ جی پی یو روی موازی پردازش با تنک بهینه سازی سرعت افزایش سبزواری) حکیم (دانشگاه خوش نویس بابک

Page 23: ٢٩/١ ١٣٩٧نﺎﺑآ٢٣ ﻮﯾ ﯽﭘ …mamintoosi.ir/dl/pubs/1397-sco2-parallel-sparse-Khoshnevis-presentation.pdfافزایش سرعت بهینهسازی تُنُک با

معرفی پیاده سازی

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

BLAS کتابخانه

اجرای برای استاندارد بلوکی ساختمان ساختن فراهم برای است امکاناتی ،BLAS کتابخانه ◀

ماتریسی. و برداری ابتدایی عملیات٢ سطح BLAS می دهد، انجام را بردار-بردار و برداری اسکالر، عملیات ١ سطح BLAS ◀

می کند. اجرا را ماتریس-ماتریس عملیات ٣ سطح BLAS و ماتریس-برداری عملیات

در معموال BLAS کتابخانه وسیع، بودن دسترس در و بودن حمل قابل کارآمدی، دلیل به ◀

می گیرد. قرار استفاده مورد خطی جبر کیفیت با برنامه های توسعهمانند باال کیفیت با خطی جبر افزار نرم توسعه در ای گسترده طور به BLAS مشخصات ◀

(GSL) گنو علمی کتابخانه و IMKL ،LAPACKشده است. استفاده GSL CBLAS از سی پی یو روی الگوریتم پیاده سازی برای اینجا در ◀

٢٩ / ٢٣ ١٣٩٧ آبان ٢٣ جی پی یو روی موازی پردازش با تنک بهینه سازی سرعت افزایش سبزواری) حکیم (دانشگاه خوش نویس بابک

Page 24: ٢٩/١ ١٣٩٧نﺎﺑآ٢٣ ﻮﯾ ﯽﭘ …mamintoosi.ir/dl/pubs/1397-sco2-parallel-sparse-Khoshnevis-presentation.pdfافزایش سرعت بهینهسازی تُنُک با

معرفی پیاده سازی

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

رویکردها

شده است: انجام کلی رویکرد دو با مقایسه این ◀

روی تطابقی جستجوی الگوریتم اجرای در جی پی یو با سی پی یو زمانی عملکرد تغییر مقایسه ◀

تنکی میزان کاهش با تصادفی داده هایروی تطابقی جستجوی الگوریتم اجرای در جی پی یو با سی پی یو زمانی عملکرد تغییر مقایسه ◀

دیکشنری. اتم های تعداد افزایش با تصادفی داده های

برای و Core i7 -7700HQ اینتل مرکزی پردازنده یک از سی پی یو روی برنامه اجرای برای ◀

استفاده NVIDIA GeForce GTX 1050 گرافیکی پردازنده یک از جی پی یو، روی اجراشده است.

٢٩ / ٢۴ ١٣٩٧ آبان ٢٣ جی پی یو روی موازی پردازش با تنک بهینه سازی سرعت افزایش سبزواری) حکیم (دانشگاه خوش نویس بابک

Page 25: ٢٩/١ ١٣٩٧نﺎﺑآ٢٣ ﻮﯾ ﯽﭘ …mamintoosi.ir/dl/pubs/1397-sco2-parallel-sparse-Khoshnevis-presentation.pdfافزایش سرعت بهینهسازی تُنُک با

اجرا گام های پیاده سازی

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

برنامه اجرای گام های

کتابخانه ها فراخوانی ◀

اولیه مقداردهی ◀

تصادفی صورت به دیکشنری تولید ◀

تصادفی صورت به تنک (نمایش) بردار یک تولید ◀

حافظه تخصیص ◀

داده ها انتقال ◀

کدگذاری) (عملیات تنک بردار از استفاده با آزمون سیگنال تولید ◀

کدگشایی) (عملیات آزمون سیگنال تخمین و تطابقی جستجوی الگوریتم اجرای ◀

اجرا زمان و خطا محاسبه ◀

٢٩ / ٢۵ ١٣٩٧ آبان ٢٣ جی پی یو روی موازی پردازش با تنک بهینه سازی سرعت افزایش سبزواری) حکیم (دانشگاه خوش نویس بابک

Page 26: ٢٩/١ ١٣٩٧نﺎﺑآ٢٣ ﻮﯾ ﯽﭘ …mamintoosi.ir/dl/pubs/1397-sco2-parallel-sparse-Khoshnevis-presentation.pdfافزایش سرعت بهینهسازی تُنُک با

شده استفاده توابع پیاده سازی

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

شده استفاده توابع

ماتریس-برداری نوع جمع و ضرب محاسبه ◀

y = αAx+ β or y = αATx+ βy

gsl_blas_sgemv, gsl_blas_dgemv : CBLAS کتابخانه ◀

cublasSgemv, cublasDgemv : cuBLAS کتابخانه ◀

بردار یک ماکزیمم عضو اندیس کوچک ترین برگرداندن ◀

m = argmaxm

|xm|

gsl_blas_isamax, gsl_blas_idamax : CBLAS کتابخانه ◀

cublasIsamax, cublasIdamax : cuBLAS کتابخانه ◀

٢٩ / ٢۶ ١٣٩٧ آبان ٢٣ جی پی یو روی موازی پردازش با تنک بهینه سازی سرعت افزایش سبزواری) حکیم (دانشگاه خوش نویس بابک

Page 27: ٢٩/١ ١٣٩٧نﺎﺑآ٢٣ ﻮﯾ ﯽﭘ …mamintoosi.ir/dl/pubs/1397-sco2-parallel-sparse-Khoshnevis-presentation.pdfافزایش سرعت بهینهسازی تُنُک با

شده استفاده توابع پیاده سازی

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

شده استفاده توابع

جمع محاسبه ◀

y = αx+ y

gsl_blas_saxpy, gsl_blas_daxpy : CBLAS کتابخانه ◀

cublasSaxpy, cublasDaxpy : cuBLAS کتابخانه ◀

بردار یک اقلیدسی نرم محاسبه ◀

∥x∥٢ =

√√√√ M∑m=٠

xm٢

gsl_blas_snrm2, gsl_blas_dnrm2 : CBLAS کتابخانه ◀

cublasSnrm2, cublasDnrm2 : cuBLAS کتابخانه ◀

٢٩ / ٢٧ ١٣٩٧ آبان ٢٣ جی پی یو روی موازی پردازش با تنک بهینه سازی سرعت افزایش سبزواری) حکیم (دانشگاه خوش نویس بابک

Page 28: ٢٩/١ ١٣٩٧نﺎﺑآ٢٣ ﻮﯾ ﯽﭘ …mamintoosi.ir/dl/pubs/1397-sco2-parallel-sparse-Khoshnevis-presentation.pdfافزایش سرعت بهینهسازی تُنُک با

نتایج پیاده سازی

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

نتایج

٢,٠٠٠ ۴,٠٠٠ ۶,٠٠٠ ٨,٠٠٠

٠

٢٠٠

۴٠٠

۶٠٠

Atoms

Dec

odin

gTi

me

(sec

onds

)

CPUGPU

اتم ها تعداد تغییر با مقایسه شکل:

۵٠ ١٠٠ ١۵٠

٠

۵٠

١٠٠

SparsityD

ecod

ing

Tim

e(s

econ

ds)

CPUGPU

تنکی میزان تغییر با مقایسه شکل:

٢٩ / ٢٨ ١٣٩٧ آبان ٢٣ جی پی یو روی موازی پردازش با تنک بهینه سازی سرعت افزایش سبزواری) حکیم (دانشگاه خوش نویس بابک

Page 29: ٢٩/١ ١٣٩٧نﺎﺑآ٢٣ ﻮﯾ ﯽﭘ …mamintoosi.ir/dl/pubs/1397-sco2-parallel-sparse-Khoshnevis-presentation.pdfافزایش سرعت بهینهسازی تُنُک با

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

ما و از پاس٢٩ / ٢٩ ١٣٩٧ آبان ٢٣ جی پی یو روی موازی پردازش با تنک بهینه سازی سرعت افزایش سبزواری) حکیم (دانشگاه خوش نویس بابک