Сравнение возможностей инструментария разработки...

10
Сравнение возможностей инструментария разработки программного обеспечения графических процессоров

Upload: elijah-wolfe

Post on 30-Dec-2015

52 views

Category:

Documents


0 download

DESCRIPTION

Сравнение возможностей инструментария разработки программного обеспечения графических процессоров. GPU – мультиядерные чипы, предназначенные для параллельных вычислений Сотни скалярных процессоров Десятки тысяч одновременно выполняемых потоков Пиковая производительность 1 TFLOPS (единичная - PowerPoint PPT Presentation

TRANSCRIPT

Page 1: Сравнение возможностей инструментария разработки программного обеспечения графических процессоров

Сравнение возможностей инструментария разработки программного обеспечения

графических процессоров

Page 2: Сравнение возможностей инструментария разработки программного обеспечения графических процессоров

• GPU – мультиядерные чипы, предназначенные дляпараллельных вычислений

• Сотни скалярных процессоров• Десятки тысяч одновременно выполняемых

потоков• Пиковая производительность 1 TFLOPS (единичнаяточность), 0.5 TFLOPS (двойная точность)• Вычисления с параллелизмом данных

Page 3: Сравнение возможностей инструментария разработки программного обеспечения графических процессоров

• В отличие от CPU, большая часть транзисторов отведена под арифметику/логику, а не под инструкции/кэш

Page 4: Сравнение возможностей инструментария разработки программного обеспечения графических процессоров

Массивно-параллельные части кодавыполняются на GPU как ядра (kernels)• В каждый момент времени выполняется одно ядро• Каждое ядро обрабатывается множеством потоков• Каждый поток выполняет один и тот же код• Каждый поток имеет идентификатор, который позволяетвычислить позицию в памяти и осуществлять ветвления

Page 5: Сравнение возможностей инструментария разработки программного обеспечения графических процессоров

Задача Дирихле для уравнения Пуассона

Page 6: Сравнение возможностей инструментария разработки программного обеспечения графических процессоров

Пятиточечный шаблон

Метод Гаусса-Зейделя

Page 7: Сравнение возможностей инструментария разработки программного обеспечения графических процессоров
Page 8: Сравнение возможностей инструментария разработки программного обеспечения графических процессоров

.1,200100

,1,200100

,0,200100

,0,200100

,),(,0),(

xx

yx

xx

yx

Dyxyxf

1,0:),( yxDyxD

Page 9: Сравнение возможностей инструментария разработки программного обеспечения графических процессоров

Размер сетки 256x256

Устройство Время решения Ускорение

Последовательный алгоритм

CPU Core 2 Duo P8600 2387 -

CPU Core 2 Duo E6600 2619 -

CUDA реализация

GPU nVidia GeForce 450 GTS 1223 2,1

Размер сетки 512x512Устройство Время решения Ускорение

Последовательный алгоритм

CPU Core 2 Duo P8600 9735 -

CPU Core 2 Duo E6600 11176 -

CUDA реализация

GPU nVidia GeForce 450 GTS 2656 4,2

Page 10: Сравнение возможностей инструментария разработки программного обеспечения графических процессоров

Размер сетки 1024x1024Устройство Время решения, мс Ускорение

Последовательный алгоритм

CPU Core 2 Duo P8600 40482 -

CPU Core 2 Duo E6600 42541 -

CUDA реализация

GPU nVidia GeForce 450 GTS 8011 5,3

Размер сетки 2048x2048Устройство Время решения Ускорение

Последовательный алгоритм

CPU Core 2 Duo P8600 157716 -

CPU Core 2 Duo E6600 171726 -

CUDA реализация

GPU nVidia GeForce 450 GTS 29551 5,8