Сравнение возможностей инструментария разработки...
DESCRIPTION
Сравнение возможностей инструментария разработки программного обеспечения графических процессоров. GPU – мультиядерные чипы, предназначенные для параллельных вычислений Сотни скалярных процессоров Десятки тысяч одновременно выполняемых потоков Пиковая производительность 1 TFLOPS (единичная - PowerPoint PPT PresentationTRANSCRIPT
![Page 1: Сравнение возможностей инструментария разработки программного обеспечения графических процессоров](https://reader036.vdocuments.pub/reader036/viewer/2022082407/56812aa0550346895d8e62e7/html5/thumbnails/1.jpg)
Сравнение возможностей инструментария разработки программного обеспечения
графических процессоров
![Page 2: Сравнение возможностей инструментария разработки программного обеспечения графических процессоров](https://reader036.vdocuments.pub/reader036/viewer/2022082407/56812aa0550346895d8e62e7/html5/thumbnails/2.jpg)
• GPU – мультиядерные чипы, предназначенные дляпараллельных вычислений
• Сотни скалярных процессоров• Десятки тысяч одновременно выполняемых
потоков• Пиковая производительность 1 TFLOPS (единичнаяточность), 0.5 TFLOPS (двойная точность)• Вычисления с параллелизмом данных
![Page 3: Сравнение возможностей инструментария разработки программного обеспечения графических процессоров](https://reader036.vdocuments.pub/reader036/viewer/2022082407/56812aa0550346895d8e62e7/html5/thumbnails/3.jpg)
• В отличие от CPU, большая часть транзисторов отведена под арифметику/логику, а не под инструкции/кэш
![Page 4: Сравнение возможностей инструментария разработки программного обеспечения графических процессоров](https://reader036.vdocuments.pub/reader036/viewer/2022082407/56812aa0550346895d8e62e7/html5/thumbnails/4.jpg)
Массивно-параллельные части кодавыполняются на GPU как ядра (kernels)• В каждый момент времени выполняется одно ядро• Каждое ядро обрабатывается множеством потоков• Каждый поток выполняет один и тот же код• Каждый поток имеет идентификатор, который позволяетвычислить позицию в памяти и осуществлять ветвления
![Page 5: Сравнение возможностей инструментария разработки программного обеспечения графических процессоров](https://reader036.vdocuments.pub/reader036/viewer/2022082407/56812aa0550346895d8e62e7/html5/thumbnails/5.jpg)
Задача Дирихле для уравнения Пуассона
![Page 6: Сравнение возможностей инструментария разработки программного обеспечения графических процессоров](https://reader036.vdocuments.pub/reader036/viewer/2022082407/56812aa0550346895d8e62e7/html5/thumbnails/6.jpg)
Пятиточечный шаблон
Метод Гаусса-Зейделя
![Page 7: Сравнение возможностей инструментария разработки программного обеспечения графических процессоров](https://reader036.vdocuments.pub/reader036/viewer/2022082407/56812aa0550346895d8e62e7/html5/thumbnails/7.jpg)
![Page 8: Сравнение возможностей инструментария разработки программного обеспечения графических процессоров](https://reader036.vdocuments.pub/reader036/viewer/2022082407/56812aa0550346895d8e62e7/html5/thumbnails/8.jpg)
.1,200100
,1,200100
,0,200100
,0,200100
,),(,0),(
xx
yx
xx
yx
Dyxyxf
1,0:),( yxDyxD
![Page 9: Сравнение возможностей инструментария разработки программного обеспечения графических процессоров](https://reader036.vdocuments.pub/reader036/viewer/2022082407/56812aa0550346895d8e62e7/html5/thumbnails/9.jpg)
Размер сетки 256x256
Устройство Время решения Ускорение
Последовательный алгоритм
CPU Core 2 Duo P8600 2387 -
CPU Core 2 Duo E6600 2619 -
CUDA реализация
GPU nVidia GeForce 450 GTS 1223 2,1
Размер сетки 512x512Устройство Время решения Ускорение
Последовательный алгоритм
CPU Core 2 Duo P8600 9735 -
CPU Core 2 Duo E6600 11176 -
CUDA реализация
GPU nVidia GeForce 450 GTS 2656 4,2
![Page 10: Сравнение возможностей инструментария разработки программного обеспечения графических процессоров](https://reader036.vdocuments.pub/reader036/viewer/2022082407/56812aa0550346895d8e62e7/html5/thumbnails/10.jpg)
Размер сетки 1024x1024Устройство Время решения, мс Ускорение
Последовательный алгоритм
CPU Core 2 Duo P8600 40482 -
CPU Core 2 Duo E6600 42541 -
CUDA реализация
GPU nVidia GeForce 450 GTS 8011 5,3
Размер сетки 2048x2048Устройство Время решения Ускорение
Последовательный алгоритм
CPU Core 2 Duo P8600 157716 -
CPU Core 2 Duo E6600 171726 -
CUDA реализация
GPU nVidia GeForce 450 GTS 29551 5,8