http:// higher education program Многоядерные микропроцессоры:...

46
ttp://www.intel.com/education Intel® Higher Education Progra Многоядерные микропроцессоры: прогресс и последствия Задачи образования Форум Форум «Новые горизонты образования» «Новые горизонты образования» Секция: Прогресс индустрии многоядерных вычислительных Секция: Прогресс индустрии многоядерных вычислительных систем и преподавание инструментов и технологий систем и преподавание инструментов и технологий параллельного программирования параллельного программирования В.Ф.Курякин В.Ф.Курякин Intel NN Intel NN Москва, 29 марта Москва, 29 марта 200 200 6 6

Post on 19-Dec-2015

218 views

Category:

Documents


2 download

TRANSCRIPT

Page 1: Http:// Higher Education Program Многоядерные микропроцессоры: прогресс и последствия Задачи образования Форум

http://www.intel.com/education Intel® Higher Education Program

Многоядерные микропроцессоры: прогресс и

последствия Задачи образования

Многоядерные микропроцессоры: прогресс и

последствия Задачи образования

ФорумФорум«Новые горизонты образования»«Новые горизонты образования»

Секция: Прогресс индустрии многоядерных вычислительных Секция: Прогресс индустрии многоядерных вычислительных систем и преподавание инструментов и технологий систем и преподавание инструментов и технологий

параллельного программированияпараллельного программирования

В.Ф.КурякинВ.Ф.КурякинIntel NNIntel NN

Москва, 29 мартаМосква, 29 марта 200 20066

Page 2: Http:// Higher Education Program Многоядерные микропроцессоры: прогресс и последствия Задачи образования Форум

2

http://www.intel.com/education Intel® Higher Education Program

СодержаниеСодержание ВведениеВведение

Обзор многоядерных архитектур и Обзор многоядерных архитектур и технологийтехнологий Закон МураЗакон Мура Методы повышения производительностиМетоды повышения производительности Многоядерность: всюду и навсегдаМногоядерность: всюду и навсегда Обеспечение эффективности новых архитектурОбеспечение эффективности новых архитектур Что отсюда следует?Что отсюда следует?

Программы Интел в области образованияПрограммы Интел в области образования В частности, параллельного программированияВ частности, параллельного программирования

ДискуссияДискуссия

Page 3: Http:// Higher Education Program Многоядерные микропроцессоры: прогресс и последствия Задачи образования Форум

3

http://www.intel.com/education Intel® Higher Education Program

ВведениеВведение

Корпорация Корпорация Intel Intel и компьютерная индустрия и компьютерная индустрия переходят на многоядерные архитектурыпереходят на многоядерные архитектуры

Эффективное использование вычислительных Эффективное использование вычислительных возможностей многоядерных архитектур для возможностей многоядерных архитектур для повышения производительности требуют повышения производительности требуют разработки новых параллельных приложенийразработки новых параллельных приложений

Корпорация Корпорация Intel Intel стремится к поддержке стремится к поддержке лидирующих образовательных и научных центров лидирующих образовательных и научных центров в подготовке нового поколения специалистов и в подготовке нового поколения специалистов и разработчиков в области архитектурно-разработчиков в области архитектурно-зависимого программирования и многопоточных зависимого программирования и многопоточных приложений для многоядерных архитектурприложений для многоядерных архитектур

Page 4: Http:// Higher Education Program Многоядерные микропроцессоры: прогресс и последствия Задачи образования Форум

4

http://www.intel.com/education Intel® Higher Education Program

Обзор многоядерных архитектур и

технологий

Обзор многоядерных архитектур и

технологий

информация заимствована из презентации John H. Crawford (2003, закон Мура), презентаций с IDF’Spring2006, с сайтов упомянутых компаний

Page 5: Http:// Higher Education Program Многоядерные микропроцессоры: прогресс и последствия Задачи образования Форум

5

http://www.intel.com/education Intel® Higher Education Program

Закон Муракак основа планирования компьютерной

индустрии

Закон Муракак основа планирования компьютерной

индустрии

Page 6: Http:// Higher Education Program Многоядерные микропроцессоры: прогресс и последствия Задачи образования Форум

6

http://www.intel.com/education Intel® Higher Education Program

Закон Мура - первоначальноЗакон Мура - первоначально

В В 19651965 году Гордон Мур нарисовал графики году Гордон Мур нарисовал графики изменений числа транзисторов в интегральных изменений числа транзисторов в интегральных схемах с минимальной стоимостью на один схемах с минимальной стоимостью на один транзистортранзистор,, и обнаружил, что и обнаружил, что Приведенная к транзистору цена быстро падалаПриведенная к транзистору цена быстро падала Число транзисторов на одну схему удваивалось каждый Число транзисторов на одну схему удваивалось каждый

годгод

Page 7: Http:// Higher Education Program Многоядерные микропроцессоры: прогресс и последствия Задачи образования Форум

7

http://www.intel.com/education Intel® Higher Education Program

Закон Мура: производительность зависит от числа транзисторовЗакон Мура: производительность зависит от числа транзисторов

Закон Мура описывает рост производительности. Производительность, измеренная в миллионах инструкций в секунду (MIPS), растет вследствие увеличения числа транзисторов.

Page 8: Http:// Higher Education Program Многоядерные микропроцессоры: прогресс и последствия Задачи образования Форум

8

http://www.intel.com/education Intel® Higher Education Program

Закон Мура – современная формулировкаЗакон Мура – современная формулировка

В В ’70’70х тренд изменилсях тренд изменился Удвоение – каждые 18-24 месяцаУдвоение – каждые 18-24 месяца

Это выражение применяется теперь к любым Это выражение применяется теперь к любым трендам составного роста в полупроводниковой трендам составного роста в полупроводниковой промышленностипромышленности Производительность, частота, мощностьПроизводительность, частота, мощность, …, … Стоимость производства кремниевых пластинСтоимость производства кремниевых пластин

Закон Мура – программа непрерывных улучшенийЗакон Мура – программа непрерывных улучшений

Основа для пошагового планирования изменений в технологиях каждые Основа для пошагового планирования изменений в технологиях каждые 2-3 2-3 года:года: Сжать размеры на 0.7 в каждом поколенииСжать размеры на 0.7 в каждом поколении Уменьшить задержки на 0.7 в каждом поколенииУменьшить задержки на 0.7 в каждом поколении Увеличить диаметр кремниевой пластиныУвеличить диаметр кремниевой пластины Увеличить размер кристаллаУвеличить размер кристалла

Page 9: Http:// Higher Education Program Многоядерные микропроцессоры: прогресс и последствия Задачи образования Форум

9

http://www.intel.com/education Intel® Higher Education Program

Закон Мура - результатыЗакон Мура - результаты Число транзисторов на кристалл удваивается каждые 18-Число транзисторов на кристалл удваивается каждые 18-

24 месяца24 месяца Производительность процессоров удваивается каждые 18 Производительность процессоров удваивается каждые 18

месяцевмесяцев Вынужденный цикл – быстрее, дешевле, менее энергоемкоВынужденный цикл – быстрее, дешевле, менее энергоемко

Бескомпромиссное управление микропроцессорной революциейБескомпромиссное управление микропроцессорной революцией

““Если бы автомобильная промышленность Если бы автомобильная промышленность усовершенствовалась столь же быстро как усовершенствовалась столь же быстро как полупроводниковаяполупроводниковая, , то Ролс-Ройс пробегал бы то Ролс-Ройс пробегал бы 1/2 1/2 миллиона миль на галлон бензина, и было бы миллиона миль на галлон бензина, и было бы дешевле его выбрасывать, чем платить за парковкудешевле его выбрасывать, чем платить за парковку.”.”

Гордон МурГордон Мур

Page 10: Http:// Higher Education Program Многоядерные микропроцессоры: прогресс и последствия Задачи образования Форум

10

http://www.intel.com/education Intel® Higher Education Program

Методы повышенияпроизводительностиМетоды повышенияпроизводительности

Page 11: Http:// Higher Education Program Многоядерные микропроцессоры: прогресс и последствия Задачи образования Форум

11

http://www.intel.com/education Intel® Higher Education Program

Составляющие производительностиСоставляющие производительности

ВремяВремя = # = # инструкцийинструкций ( (длина путидлина пути))

* * ЦиклЦикл//ИнструкцияИнструкция ( (Arch…)Arch…)

* * СекундыСекунды//ЦиклЦикл (1/ (1/ЧастотаЧастота))

ПроизводительностьПроизводительность ~ 1/ ~ 1/ВремяВремя = benchmark = = benchmark =

Тест производительностиТест производительности / # / #инструкцийинструкций

* * ИнструкцийИнструкций//Цикл (Цикл (IPC)IPC)

* * ЦиклыЦиклы//СекундаСекунда ( (ЧастотаЧастота))

Посмотрим, из чего складывается производительностьПосмотрим, из чего складывается производительность……

Page 12: Http:// Higher Education Program Многоядерные микропроцессоры: прогресс и последствия Задачи образования Форум

12

http://www.intel.com/education Intel® Higher Education Program

Рост производительности: 1000x за 17 лет

Рост производительности: 1000x за 17 лет

1

10

100

1000

10000

Jan-85 Jan-87 Jan-89 Jan-91 Jan-93 Jan-95 Jan-97 Jan-99 Jan-01 Jan-03 Jan-05

Начало производства

SP

EC

int2

000

Page 13: Http:// Higher Education Program Многоядерные микропроцессоры: прогресс и последствия Задачи образования Форум

13

http://www.intel.com/education Intel® Higher Education Program

Рост частоты: 200x Ускорение транзисторов: 40хРост частоты: 200x Ускорение транзисторов: 40х

1

10

100

1000

10000

Jan-85 Jan-87 Jan-89 Jan-91 Jan-93 Jan-95 Jan-97 Jan-99 Jan-01 Jan-03 Jan-05

Introduction Date

Clo

ck F

req

uen

cy

1

10

100

1000

10000

Tra

nsi

sto

r S

pee

du

p F

acto

r

1 0.8

.35.25

.18.13

1.5

0.5 40x

2.6x

конвейеризация

1.7хУлучшения в процессе производства

Page 14: Http:// Higher Education Program Многоядерные микропроцессоры: прогресс и последствия Задачи образования Форум

14

http://www.intel.com/education Intel® Higher Education Program

Факторы роста производительностиФакторы роста производительности Увеличение частоты (200х)Увеличение частоты (200х)

Ускорение транзисторов (Ускорение транзисторов (~40x)~40x) Постоянные улучшения в процессах (Постоянные улучшения в процессах (~~1.71.7x)x) Конвейеризация (Конвейеризация (~~2.6х)2.6х)

SPECint2000/MHzSPECint2000/MHz ~~ IPCIPC (5x)(5x)

ProcessorProcessor ~IPC ~IPC factorfactor

386386 11

486486 2.52.5

486 DX2486 DX2 2.252.25

PentiumPentium 44

Pentium ProPentium Pro 55

Pentium IIIPentium III 5.75.7

Pentium 4Pentium 4 4.44.4

1000 ~= 70 (40*1.7) * 15 (2.6 * 5.7)

15х – прямой или косвенный вклад улучшений архитектуры в рост производительности

Итак – две главные компоненты повышения производительности - технологические улучшения (ускорение транзисторов) - усовершенствования в архитектуре процессоров и компьютеров ~15x

Page 15: Http:// Higher Education Program Многоядерные микропроцессоры: прогресс и последствия Задачи образования Форум

15

http://www.intel.com/education Intel® Higher Education Program

Улучшения uArch – GHz & IPC*Улучшения uArch – GHz & IPC* Обеспечены ростом числа транзисторовОбеспечены ростом числа транзисторов

Более глубокий конвейер обеспечивает рост частотыБолее глубокий конвейер обеспечивает рост частоты (GHz) (GHz) Более широкий конвейер обеспечивает увеличениеБолее широкий конвейер обеспечивает увеличение IPC IPC

Методы увеличенияМетоды увеличения IPC: IPC: Конвейеризация для повышения пропускной способности на 1 тактКонвейеризация для повышения пропускной способности на 1 такт

(486) (486) Параллельный выход инструкцийПараллельный выход инструкций (Pentium (Pentium®®)) Предсказание ветвленийПредсказание ветвлений (Pentium (Pentium®®) ) Изменение порядка выполнения Изменение порядка выполнения (Pentium Pro/II)(Pentium Pro/II) SIMD (MMX, SSE, SSE2, SSE3,…) (Pentium MMX/II,III,IV, …)SIMD (MMX, SSE, SSE2, SSE3,…) (Pentium MMX/II,III,IV, …) Кэш трейсовКэш трейсов (Pentium 4) (Pentium 4) HyperThreading (Pentium 4)HyperThreading (Pentium 4) Многоядерность (Многоядерность (Pentium D)Pentium D)

Преодоление задержек с доступом к главной памятиПреодоление задержек с доступом к главной памяти КэшКэш (486) (486) Разбиение кэшей и их увеличениеРазбиение кэшей и их увеличение (Pentium) (Pentium) Много-уровневые гигантские кэшиМного-уровневые гигантские кэши…… Рост частоты и пропускной способности Рост частоты и пропускной способности FSBFSB

*IPC is Instructions Per Clock

Page 16: Http:// Higher Education Program Многоядерные микропроцессоры: прогресс и последствия Задачи образования Форум

16

http://www.intel.com/education Intel® Higher Education Program

Производительность процессора увеличилась – но повысилась ли производительность приложений??

Производительность процессора увеличилась – но повысилась ли производительность приложений?? Главные пути повышения производительностиГлавные пути повышения производительности

технологические улучшения (ускорение транзисторов) технологические улучшения (ускорение транзисторов) усовершенствования в архитектуре процессоров и усовершенствования в архитектуре процессоров и

компьютеровкомпьютеров Производительность подсистемы памятиПроизводительность подсистемы памяти

Технологические улучшения дают прирост Технологические улучшения дают прирост производительности в чистом виде, формально они производительности в чистом виде, формально они не требуют изменений в программахне требуют изменений в программах

Улучшения в архитектуре Улучшения в архитектуре обязательнообязательно предполагают комплексные изменения как в предполагают комплексные изменения как в приложениях, так и в инструментарии приложениях, так и в инструментарии программирования, а также изменений во всех программирования, а также изменений во всех компонентах компьютеракомпонентах компьютера

Page 17: Http:// Higher Education Program Многоядерные микропроцессоры: прогресс и последствия Задачи образования Форум

17

http://www.intel.com/education Intel® Higher Education Program

Многоядерность: всюду и навсегдаМногоядерность: всюду и навсегда

Page 18: Http:// Higher Education Program Многоядерные микропроцессоры: прогресс и последствия Задачи образования Форум

18

http://www.intel.com/education Intel® Higher Education Program

Двух-ядерные процессоры IBMДвух-ядерные процессоры IBM Power4 – Power4 – самый первый 2-ядерный, 200самый первый 2-ядерный, 2001 (1 (на 180нм!)на 180нм!)

Power5 – Power5 – ядра те же самые, система кэшей/памяти ядра те же самые, система кэшей/памяти изменена радикально, 2004изменена радикально, 2004

8-way 8-way реализация, допускает построение 8реализация, допускает построение 8--ми ми процессорной процессорной SMPSMP системы прямо, 16, 32, 64 - системы прямо, 16, 32, 64 - блокамиблоками

Page 19: Http:// Higher Education Program Многоядерные микропроцессоры: прогресс и последствия Задачи образования Форум

19

http://www.intel.com/education Intel® Higher Education Program

Двух-ядерные процессоры AMDДвух-ядерные процессоры AMD

OpteronOpteron Dual-Core Dual-Core для серверов/рабочих станций, 2004для серверов/рабочих станций, 2004 Исполнения: 1-Исполнения: 1-way, 2-way, 8-wayway, 2-way, 8-way Первоначально – 130нм, теперь – 90нмПервоначально – 130нм, теперь – 90нм

Athlon Dual-Core X2 Athlon Dual-Core X2 для рынка для рынка PCPC Для ноутбуков - нетДля ноутбуков - нет

Page 20: Http:// Higher Education Program Многоядерные микропроцессоры: прогресс и последствия Задачи образования Форум

20

http://www.intel.com/education Intel® Higher Education Program

Двух-ядерные процессоры IntelДвух-ядерные процессоры Intel Процессоры, базирующиеся на Р4 ядре

Pentium D – 2004, начало (основан на двух ядрах Pentium 4 (Prescott) c HT) Кодовые имена (для разных сегментов рынка)

Smithfield, Presler, Cider Mill – для рынка РС, Dempsey (DP), Paxville (MP), Tulsa – для рынка серверов и рабочих станций

Выпускаются по 90нм технологии, с 2006 по 65нм

Процессоры, базирующиеся на ядрах Pentium M и его усовершенствованиях в uArch

Стартуют с 65нм технологии! Обеспечивают наилучшие в индустрии показатели как производительности, так и

производительность/ватт

Conroe: >40% рост производительности и >40% уменьшение энергопотребления По сравнению с сильнейшим на сегодня процессором Pentium® D processor 950 (кодовое имя

Pressler)

Woodcrest: >80% рост производительности и > 35% уменьшение энергопотребления

По сравнению с сильнейшим на сегодня процессором Dual-Core Intel® Xeon processor 2.8GHz (кодовое имя Paxville DP)

Merom: значительно улучшает большинство свойств предшественника, уже являющегося лидером среди мобильных устройств, >20% рост производительности (2х для мультимедиа)

По сравнению с сильнейшим в индустрии Intel® Core™ Duo processor (кодовое имя Yonah)

Массовое производство Conroe (для РС), Woodcrest (сервера/рабочие станции), Merom (мобильные) развертывается в конце 2006, начале 2007

Kentsfield – первый 4-х ядерный процессор (два Conroe) для РС – 1H’07

Page 21: Http:// Higher Education Program Многоядерные микропроцессоры: прогресс и последствия Задачи образования Форум

21

http://www.intel.com/education Intel® Higher Education Program

Page 22: Http:// Higher Education Program Многоядерные микропроцессоры: прогресс и последствия Задачи образования Форум

22

http://www.intel.com/education Intel® Higher Education Program

Page 23: Http:// Higher Education Program Многоядерные микропроцессоры: прогресс и последствия Задачи образования Форум

23

http://www.intel.com/education Intel® Higher Education Program

Данные по много-ядерным процессорамДанные по много-ядерным процессорам

2007 2009 20102005 2006 2008

Niagara-II 1.4 Ghz65 nm

Niagara 1.2 Ghz90 nm IBM

many coreAMD

many core

Sun Sun лидирует в разработке много-ядерных процессоровлидирует в разработке много-ядерных процессоров Двух-ядерный процессор – в 2004 годуДвух-ядерный процессор – в 2004 году Niagara-II Niagara-II обещаетобещает удвоение производительности по сравнению с удвоение производительности по сравнению с Niagara-INiagara-I

IBM IBM обладает большим потенциалом для разработки много-ядерных системобладает большим потенциалом для разработки много-ядерных систем Cell (Cell (процессор для процессор для Sony PlayStation – 8 Sony PlayStation – 8 упрощенных ядер под управлением упрощенных ядер под управлением

Power) Power) является первым опытом разработки многоядерных системявляется первым опытом разработки многоядерных систем Однако никакой конкретной информации от Однако никакой конкретной информации от IBM IBM по полным многоядерным по полным многоядерным

системам нетсистемам нет

AMD AMD способен на разработку много-ядерных системспособен на разработку много-ядерных систем Конкретной информации о много-ядерных проектах нетКонкретной информации о много-ядерных проектах нет AMD AMD будет трудно (финансово) поддерживать много проектовбудет трудно (финансово) поддерживать много проектов

Имеющиеся скалярные и двух-ядерные и много-ядерные Имеющиеся скалярные и двух-ядерные и много-ядерные

Интел однозначно участвует в многоядерной гонкеИнтел однозначно участвует в многоядерной гонке Интел представил первый четырех-ядерный процессор для серверов/рабочих Интел представил первый четырех-ядерный процессор для серверов/рабочих

станций и РС (станций и РС (IDF’Spring2006)IDF’Spring2006)

2009-2010 roadmap very speculative

SunNiagara-III

Page 24: Http:// Higher Education Program Многоядерные микропроцессоры: прогресс и последствия Задачи образования Форум

24

http://www.intel.com/education Intel® Higher Education Program

Сервера Sun Fire T1000/T2000 Сервера Sun Fire T1000/T2000 1U 1U ии 2U 2U модули в стойкимодули в стойки

1U T1000 8 DIMMs and 1 PCI Express slot1U T1000 8 DIMMs and 1 PCI Express slot 2U T2000 16 DIMMs and 3 PCI Express + 2 PCI-X slots2U T2000 16 DIMMs and 3 PCI Express + 2 PCI-X slots

1.0 1.0 илиили 1.2 Ghz UltraSPARC T1 (Niagara) 1.2 Ghz UltraSPARC T1 (Niagara) 8 ядер, до 8 ядер, до 32 32 потоковпотоков Только однопроцессорное исполнениеТолько однопроцессорное исполнение

Сильнейшее решение по пропускной Сильнейшее решение по пропускной способности на сетевых приложенияхспособности на сетевых приложениях

Продается с декабря Продается с декабря 20052005 T1000 T1000 нижняя ценанижняя цена $3495 $3495 T2000 T2000 нижняя ценанижняя цена $8295 $8295

Pictures from:Sun T1000/T2000 Web site

Page 25: Http:// Higher Education Program Многоядерные микропроцессоры: прогресс и последствия Задачи образования Форум

25

http://www.intel.com/education Intel® Higher Education Program

Niagara: резюмеNiagara: резюме Огромная пропускная способность Огромная пропускная способность

при низком отношении при низком отношении производительность/ваттпроизводительность/ватт

Дорогая Дорогая 2222-слойная-слойная платаплата

Высокая производительность для Высокая производительность для приложений, которыеприложений, которые Могут запускать все 32 потокаМогут запускать все 32 потока Требуют большой пропускной Требуют большой пропускной

способности памятиспособности памяти Согласуются с внутренними Согласуются с внутренними

кэшами для поддержки активности кэшами для поддержки активности всех ядер и нитейвсех ядер и нитей

Пока – только однопроцессорный Пока – только однопроцессорный дизайндизайн

2-ое поколение2-ое поколение Niagara-II Niagara-II – в – в разработке (разработке (20072007, , 65 nm 65 nm))

Niagara die plot from Spring Processor Forum 2005

• Q4’05 systems available• 8 ядер, 32 нитей, только UP • 4 DDR2-400 порта, 16 байт каждый• Полная реализация SPARC 64-bit ISA• Частота 1.2 Ghz• Реализация по 90 nm технологии на

фабрике T.I.• Пиковая мощность 79W, 75° C

From VendorSpeculation

Page 26: Http:// Higher Education Program Многоядерные микропроцессоры: прогресс и последствия Задачи образования Форум

26

http://www.intel.com/education Intel® Higher Education Program

Первый 4-ядерный процессор ИнтелПервый 4-ядерный процессор Интел

Clovertown – процессор семейства Zeon для рынка серверов/рабочих станций

Kentsfield – первый 4-х ядерный процессор (два Conroe) для РС – 1H’07

Page 27: Http:// Higher Education Program Многоядерные микропроцессоры: прогресс и последствия Задачи образования Форум

27

http://www.intel.com/education Intel® Higher Education Program

Обеспечение эффективности новых архитектур

Обеспечение эффективности новых архитектур

Page 28: Http:// Higher Education Program Многоядерные микропроцессоры: прогресс и последствия Задачи образования Форум

28

http://www.intel.com/education Intel® Higher Education Program

Сложнее архитектура – сложнее программирование??Сложнее архитектура – сложнее программирование??

Для обеспечения оптимального использования возможностей Для обеспечения оптимального использования возможностей процессоров необходимо при разработке алгоритмов и процессоров необходимо при разработке алгоритмов и программировании максимально учитывать эти возможностипрограммировании максимально учитывать эти возможности

Большая часть (но не вся!) возможностей повышения Большая часть (но не вся!) возможностей повышения производительности заложена в параллельном исполнении производительности заложена в параллельном исполнении инструкций, но способов распараллеливания много:инструкций, но способов распараллеливания много: КонвейеризацияКонвейеризация СуперскалярностьСуперскалярность SIMDSIMD HTHT Много-ядерность - многопоточностьМного-ядерность - многопоточность

Несмотря на прогресс в повышении производительности памяти, Несмотря на прогресс в повышении производительности памяти, она была, есть и будет главным препятствием повышения она была, есть и будет главным препятствием повышения производительностипроизводительности Иерархия огромных кэшейИерархия огромных кэшей FSB – FSB – частота уже 1333частота уже 1333MHzMHz Двойная независимая Двойная независимая FSBFSB Память Память FD-DIMM FD-DIMM

Page 29: Http:// Higher Education Program Многоядерные микропроцессоры: прогресс и последствия Задачи образования Форум

29

http://www.intel.com/education Intel® Higher Education Program

ПроблемыПроблемы Алгоритм не распараллеливается или плохо Алгоритм не распараллеливается или плохо

распараллеливаетсяраспараллеливается Новый алгоритм? Прямо по заказу?Новый алгоритм? Прямо по заказу?

Чем больше потоков, тем более жадным до памяти Чем больше потоков, тем более жадным до памяти становится процессорстановится процессор Но производительность памяти растет заметно медленнее, Но производительность памяти растет заметно медленнее,

чем производительность процессорачем производительность процессора Новые приложения работают с относительно большим Новые приложения работают с относительно большим

объемом данных (машинное зрение, распознавание, объемом данных (машинное зрение, распознавание, анализ данных – классификация /кластеризация)анализ данных – классификация /кластеризация)

СинхронизацияСинхронизация Ядра (потоки) могут ждать друг друга из-за малой Ядра (потоки) могут ждать друг друга из-за малой

пропускной способности шины и памятипропускной способности шины и памяти Меж-связи между ядрами? Локальная (на ядре) Меж-связи между ядрами? Локальная (на ядре)

буферизация? Процессоры еще сложнее???буферизация? Процессоры еще сложнее???

Page 30: Http:// Higher Education Program Многоядерные микропроцессоры: прогресс и последствия Задачи образования Форум

30

http://www.intel.com/education Intel® Higher Education Program

Программирование и эффективностьПрограммирование и эффективность В чем опасность для индустрии современного В чем опасность для индустрии современного

состояния программирования?состояния программирования? Как и ранее, использование архитектурных особенностей требует Как и ранее, использование архитектурных особенностей требует

квалификации и опыта, а их как всегда не хватаетквалификации и опыта, а их как всегда не хватает Однако много-ядерность эту ситуацию обостряет значительно: Однако много-ядерность эту ситуацию обостряет значительно:

неожиданно проблемы, с которыми имели дело только избранные, неожиданно проблемы, с которыми имели дело только избранные, встали перед массовым программистом и пользователем, а он к встали перед массовым программистом и пользователем, а он к этому во всех отношениях не готов (?)этому во всех отношениях не готов (?)

Как следствие заявленная производительность не будет Как следствие заявленная производительность не будет подтверждаться на практике, и индустрия может столкнуться с подтверждаться на практике, и индустрия может столкнуться с проблемой невостребованности или задержки с продвижением проблемой невостребованности или задержки с продвижением новых технологийновых технологий

Значение эффективности инструментов и Значение эффективности инструментов и технологий программирования значительно технологий программирования значительно возрастаетвозрастает

Что имеется? Формально все инструменты и Что имеется? Формально все инструменты и технологии естьтехнологии есть

Page 31: Http:// Higher Education Program Многоядерные микропроцессоры: прогресс и последствия Задачи образования Форум

31

http://www.intel.com/education Intel® Higher Education Program

Что распараллеливать и как?Что распараллеливать и как? Анализ производительностиАнализ производительности

Для определения узких мест (где потеря Для определения узких мест (где потеря производительности?)производительности?)

Дизайн (создание потоков)Дизайн (создание потоков) Нужны ли изменения в алгоритмах?Нужны ли изменения в алгоритмах? Какой подход в реализации выгоднее?Какой подход в реализации выгоднее?

OpenMPOpenMP Явные потоки (Явные потоки (pthreads, system calls,…)pthreads, system calls,…) Передача сообщений (Передача сообщений (MPI)MPI) DVM DVM или что-то еще… или что-то еще…

ОтладкаОтладка Потенциальная десинхронизация потоковПотенциальная десинхронизация потоков В каком потоке ошибка?В каком потоке ошибка?

Оптимизация кодаОптимизация кода Оптимизация как отдельного потока, так и много-поточного Оптимизация как отдельного потока, так и много-поточного

кодакода

Page 32: Http:// Higher Education Program Многоядерные микропроцессоры: прогресс и последствия Задачи образования Форум

32

http://www.intel.com/education Intel® Higher Education Program

Поддержка цикла разработки в инструментах ИнтелПоддержка цикла разработки в инструментах Интел

Автоматическое распараллеливание и оптимизация, организация потоков через прагмы

Использование предельно оптимизированных вычислительных ядер сокращают время разработки

Отладка в одном потоке и в много-поточном комплексе

Анализ производительности в одном потоке и эффективности многопоточного распараллеливания

Page 33: Http:// Higher Education Program Многоядерные микропроцессоры: прогресс и последствия Задачи образования Форум

33

http://www.intel.com/education Intel® Higher Education Program

Что отсюда следует?Что отсюда следует?

Page 34: Http:// Higher Education Program Многоядерные микропроцессоры: прогресс и последствия Задачи образования Форум

34

http://www.intel.com/education Intel® Higher Education Program

Образование и повышение квалификации – ключевой аспект

Образование и повышение квалификации – ключевой аспект Инструменты и технологии (параллельного) Инструменты и технологии (параллельного)

программирования в условиях массовости должны быть программирования в условиях массовости должны быть изменены или значительно усовершенствованны. Как? В изменены или значительно усовершенствованны. Как? В каком направлении?каком направлении?

Перед системой образования стоит задача качественного Перед системой образования стоит задача качественного изменения в подготовке и переподготовки кадров. Чему изменения в подготовке и переподготовки кадров. Чему учить?учить? Использованию конкретных инструментов (языков, отладчиков, Использованию конкретных инструментов (языков, отладчиков,

компиляторов, библиотек,…). Но они устаревают ежегодно!компиляторов, библиотек,…). Но они устаревают ежегодно! Фундаментальным понятиям, глубокой ориентации в Фундаментальным понятиям, глубокой ориентации в

архитектурах и алгоритмах. Но тогда выпускники могут оказаться архитектурах и алгоритмах. Но тогда выпускники могут оказаться совершенно несостоятельными практически, не обладая совершенно несостоятельными практически, не обладая твердыми техническими навыкамитвердыми техническими навыками

Кого учить?? Кого учить?? Системных программистов (они разработают эффективные Системных программистов (они разработают эффективные

инструменты для остальных программистов)? инструменты для остальных программистов)? Всех программистов?? Но когда они выучат все остальное??Всех программистов?? Но когда они выучат все остальное?? Всех инженеров?? Но ведь для них компьютер только Всех инженеров?? Но ведь для них компьютер только

вспомогательный инструмент…вспомогательный инструмент…

Page 35: Http:// Higher Education Program Многоядерные микропроцессоры: прогресс и последствия Задачи образования Форум

35

http://www.intel.com/education Intel® Higher Education Program

Программы Интел в области образования

Программы Интел в области образования

Page 36: Http:// Higher Education Program Многоядерные микропроцессоры: прогресс и последствия Задачи образования Форум

36

http://www.intel.com/education Intel® Higher Education Program

Модель внедренияМодель внедрения

Унив n

Унив 1

Ключевые Университеты

Дополнительные Университеты

Гранты Intel на создание

учебных курсов

Семинар по учебным

программамУнив 15

Унив 1

Унив 15

Унив 1

Intel® Higher Education Curriculum

Forum

Семинар по учебным

программам

Page 37: Http:// Higher Education Program Многоядерные микропроцессоры: прогресс и последствия Задачи образования Форум

37

http://www.intel.com/education Intel® Higher Education Program

Разработка учебных программРазработка учебных программ ГрантыГранты:: будут выделены творческим коллективам из ведущих будут выделены творческим коллективам из ведущих

образовательных и научных центровобразовательных и научных центров В рамках конкурса проектов творческие коллективы подготовят В рамках конкурса проектов творческие коллективы подготовят

предложения по разработке учебных курсовпредложения по разработке учебных курсов В предложение должны включаться запросы на оборудование для учебных В предложение должны включаться запросы на оборудование для учебных

компьютерных классовкомпьютерных классов

СеминарСеминар:: запланирован на 2 квартал 2006 года в США, даст запланирован на 2 квартал 2006 года в США, даст возможность участвующим в программе профессорам из разных стран возможность участвующим в программе профессорам из разных стран обменяться идеями и опытом по разработке учебных программ обменяться идеями и опытом по разработке учебных программ

Intel® Higher Education Curriculum Forum:Intel® Higher Education Curriculum Forum: будет создана будет создана on-line on-line страница страница в Интернет для обмена информацией о разработке учебного плана в Интернет для обмена информацией о разработке учебного плана между участниками программы со всего мирамежду участниками программы со всего мира

ОбучениеОбучение:: Intel® Software College Classes Intel® Software College Classes будут проводится в будут проводится в различных странах для обучения преподавателей инструментам и различных странах для обучения преподавателей инструментам и технологиям технологиям Intel Intel для разработки программного обеспечениядля разработки программного обеспечения

ПоддержкаПоддержка:: Всех участников будет поддерживать программа «раннего Всех участников будет поддерживать программа «раннего доступа», содержащая информацию о новейших инструментах и доступа», содержащая информацию о новейших инструментах и технологияхтехнологиях

Page 38: Http:// Higher Education Program Многоядерные микропроцессоры: прогресс и последствия Задачи образования Форум

38

http://www.intel.com/education Intel® Higher Education Program

Внедрение образовательных курсовВнедрение образовательных курсов Intel® Higher Education Curriculum ForumIntel® Higher Education Curriculum Forum

Отобранные курсы будут доступны на веб-сайтеОтобранные курсы будут доступны на веб-сайте Online Online форумфорум будет поддерживать внедрение и будет поддерживать внедрение и

развитие курсовразвитие курсов

Семинары по разработке учебного планаСеминары по разработке учебного плана Семинары планируются в разных странах для Семинары планируются в разных странах для

демонстрации достижений и обмена опытом демонстрации достижений и обмена опытом между университетами по разработке и между университетами по разработке и внедрению курсов внедрению курсов

В каждом двухдневном семинаре примут участие В каждом двухдневном семинаре примут участие около 15 университетовоколо 15 университетов

Корпорация Корпорация Intel Intel берет на себя расходы по берет на себя расходы по проведению семинарапроведению семинара

Page 39: Http:// Higher Education Program Многоядерные микропроцессоры: прогресс и последствия Задачи образования Форум

39

http://www.intel.com/education Intel® Higher Education Program

ДискуссияДискуссия

Page 40: Http:// Higher Education Program Многоядерные микропроцессоры: прогресс и последствия Задачи образования Форум

40

http://www.intel.com/education Intel® Higher Education Program

Возможные темыВозможные темы Какие инструменты и технологии Какие инструменты и технологии

(параллельного) программирования (параллельного) программирования наиболее предпочтительны, или наиболее предпочтительны, или эффективны?эффективны?

Какие области приложений наиболее Какие области приложений наиболее актуальны, где много-ядерные актуальны, где много-ядерные процессоры окажутся наиболее процессоры окажутся наиболее эффективными?эффективными?

Как и где следует обучать?Как и где следует обучать?

Page 41: Http:// Higher Education Program Многоядерные микропроцессоры: прогресс и последствия Задачи образования Форум

41

http://www.intel.com/education Intel® Higher Education Program

BackupBackup

Page 42: Http:// Higher Education Program Многоядерные микропроцессоры: прогресс и последствия Задачи образования Форум

42

http://www.intel.com/education Intel® Higher Education Program

Itanium Dual-core RoadmapItanium Dual-core RoadmapIntel Itanium Processor Roadmap

ProcessorBrand

ProcessorNo.

Core / FSB

CacheLaunch

Date

Price @Launch

Itanium 2 (Dual Core)(Montecito)

90501.60GHz /

533MHz24MB Q2'06 $3,690

Itanium 2 (Dual Core)(Montecito)

90401.60GHz /

533MHz18MB Q2'06 $1,980

Itanium 2 (Dual Core)(Montecito)

90301.60GHz /

533MHz2MB Q2'06 $1,550

Itanium 2 (Dual Core)(Montecito)

90201.42GHz /

533MHz12MB Q2'06 $910

Itanium 2 (Single Core)(Montecito)

90101.60GHz /

533MHz6MB Q2'06 $700

Page 43: Http:// Higher Education Program Многоядерные микропроцессоры: прогресс и последствия Задачи образования Форум

43

http://www.intel.com/education Intel® Higher Education Program

IA Dual-Core RoadmapIA Dual-Core RoadmapIntel Xeon Processor Roadmap

Processor Brand

ProcessorNo.

Core /FSB

CacheLaunchDate

Price @Launch

Xeon Processor DP(Woodcrest Bin-0)

51603.0GHz /1333MHz

4MB Q3'06 $850

Xeon Processor DP(Woodcrest Bin-1)

51502.66GHz /1333MHz

4MB Q3'06 $690

Xeon Processor DP(Woodcrest Bin-2)

51402.33GHz /1333MHz

4MB Q3'06 $455

Xeon Processor DP(Woodcrest Bin-3)

51302.0GHz /1333MHz

4MB Q3'06 $320

Xeon Processor DP(Woodcrest Bin-4)

51201.86GHz /106MHz

4MB Q3'06 $260

Xeon Processor DP(Woodcrest Bin-5)

51101.60GHz /1066MHz

4MB Q3'06 $210

Xeon Processor DP(Dempsey Bin-0)

50803.73GHz /1066MHz

2x2MB

Q2'06 $850

Xeon Processor DP(Dempsey Bin-??)

50703.46GHz / 1066MHz

2x2MB

Q2'06 $690

Xeon Processor DP(Dempsey Bin-3)

50603.2GHz /1066MHz

2x2MB

Q2'06 $455

Xeon Processor DP(Dempsey Bin-5)

50503.0GHz /667MHz

2x2MB

Q2'06 $320

Page 44: Http:// Higher Education Program Многоядерные микропроцессоры: прогресс и последствия Задачи образования Форум

44

http://www.intel.com/education Intel® Higher Education Program

Updated Platform DefinitionsAVERILL FUNDAMENTAL AVERILL FUNDAMENTAL

*T’s

Pentium® D Processor 900 sequence

(Presler, no VT)

Intel® Q963 Express Chipset

w/ ICH8

Intel GbE LAN

Net

wo

rkin

gC

hip

set

Pro

cess

or

EM64T, EISTT

AVERILL PROFESSIONAL AVERILL PROFESSIONAL *T

’s

Intel® Core™ processor family

(Conroe)

Intel® Q965 Express Chipset

w/ ICH8-DO

Intel® PRO/1000 (Nineveh)

Net

wo

rkin

gC

hip

set

Pro

cess

or

Intel® Virtualization Technology

Intel® Active Mgmt Technology

EM64T, EIST

T

Q963

Page 45: Http:// Higher Education Program Многоядерные микропроцессоры: прогресс и последствия Задачи образования Форум

45

http://www.intel.com/education Intel® Higher Education Program

Intel® AMT and Intel® VT – Compare, Contrast, Compliment

Intel® AMT

Virtual Appliances

with Intel® VT

Intel AMT Alone

• OOB management

• Asset info store in NVM

• Circuit Breaker

• Secure wake

• Remote diagnostics & boot

• Most intelligence & remediation paths in mgmt console

Virtual Appliance Alone

• Tamper-resistant security or mgmt “watchdog” for User OS

• Highly programmable application environment

• Local intelligence & remediation paths

• No Intel AMT features

When Used Together

• All benefits of each individually, plus:

• OOB management of both User OS & appliance*

• Appliance access to Circuit Breaker, NVM, secure wake*

• Intelligence & remediation paths distributed to best local or console option

Page 46: Http:// Higher Education Program Многоядерные микропроцессоры: прогресс и последствия Задачи образования Форум

46

http://www.intel.com/education Intel® Higher Education Program

1.171.29 1.30 1.32

1.00 1.00 1.00 1.00

0.00

0.50

1.00

1.50

2.00

PCWorldbench* 5 SYSmark* 2004 SE PCMark*05 - CPU WebMark* 2004

Nor

mal

ized

to A

MD

* A

thlo

n64*

FX

60 P

roce

ssso

r(2

x1M

B L

2 C

ache

, 2.6

0 G

Hz)

.

Conroe = uncommon performance on common tests

Conroe Performance: Desktop Application Performance

AMD expected to add DDR2 support mid 2006AMD expected to add DDR2 support mid 2006

Pre-production Processor code-name “Conroe” (4 MB L2, 2.66 GHz, 1066 MHz FSB)

AMD* Athlon64* FX60 Processor (2x1 MB L2 Cache, 2.60 GHz)

*Other names and brands may be claimed as the property of others

ProductivityProductivityProductivityProductivity InternetInternetInternetInternet

Conroe 17% above

comp

ConsumerConsumerConsumerConsumer

Conroe measured on pre-production hardware and drivers. Final performance information may vary from these results

Conroe 29% above

comp

Conroe 30% above

comp

Conroe 32% above

comp