Процессоры intel® xeon® e5-2600 v3
DESCRIPTION
Процессоры Intel® Xeon® E5-2600 v3TRANSCRIPT
Процессоры Intel® Xeon® E5-2600 v3
Александр Мельников
Специалист по корпоративным технологиям,
Европейская Техническая Группа
Intel
2
Семейство Intel® Xeon® E5-2600 v3
^Refer to Slide 14 for Source and Configuration details
+Refer to Slide 17 for Source and Configuration details
Software and workloads used in performance tests may have been optimized for performance only on Intel microprocessors. Performance tests are measured using
specific computer systems, components, software, operations and functions. Any change to any of those factors may cause the results to vary. You should consult other
information and performance tests to assist you in fully evaluating your contemplated purchases, including the performance of that product when combined with other
products. For more information go to http://www.intel.com/performance
90%-ное повышение производительности с Intel® AVX 2^
Самый энергоэффективный серверный процессор+
Возможности управления виртуализацией с
Cache Monitoring
• Node Manager 3.0
• Cache QoS Monitoring
3
Основные новшества
• Advanced Vector Extensions (AVX) 2.0
• PCPS (Per Core P-States)
• Память DDR4
• Virtual Machine Control Structure (VMCS) Shadowing
• Дедупликация
• Иерархия хранения
• Тонкие диски
• Шифрование
• Твердотельные накопители
Вычисления
• Контроллер 10/40 Gb Ethernet
• Разгрузка сетевой вирт-ции
• Flow Director
• Вирт-ция сетевых функций (NFV)
• Intel® QuickAssist® Technology
Хранени
е
Сеть
4
Intel® Advanced Vector Extensions (AVX) 2.0
2012 2013 2014
Пр
ои
зво
дите
льно
сть
\яд
ро
Intel® AVX 1.0
2X Flops: 256-битные векторы с
плавающей запятой
E5-2600
(32 нм «Так»)
Поддержка вычислений с
плав. запятой половинной
точности, ГСЧ
Intel®
AVX
2.0
E5-2600 v2
(22 нм «Тик»)
E5-2600 v3
(22 нм «Так»)
С 2001 года:
128-битные векторы
Source as of August 2014 TR#3034 on Linpack*. Baseline configuration: Intel® Server Board S2600CP with two Intel® Xeon® Processor E5-2697 v2, Intel® HT Technology
disabled, Intel® Turbo Boost Technology enabled, 8x8GB DDR3-1866, RHEL* 6.3, Intel® MKL 11.0.5, score: 528 GFlops. New configuration: Intel® Server System R2208 ВтTTYS
with two Intel® Xeon® Processor E5-2699 v3, Intel® HT Technology disabled, Intel® Turbo Boost Technology enabled, 8x16GB DDR4-2133, RHEL* 6.4, Intel® MKL 11.1.1, score:
1,012 GFlops Software and workloads used in performance tests may have been optimized for performance only on Intel microprocessors. Performance tests, such as SYSmark
and MobileMark, are measured using specific computer systems, components, software, operations and functions. Any change to any of those factors may cause the results to
vary. You should consult other information and performance tests to assist you in fully evaluating your contemplated purchases, including the performance of that product when
combined with other products. For more information go to http://www.intel.com/performance *Other names and brands may be claimed as the property of others.
new
• Ускорение высокопроизводительных вычислений
с плавающей запятой с помощью инструкций
Fused Multiply Add (FMA)
• 256-битные целочисленные векторные
инструкции помогают в математических задачах,
кодеках, при обработке изображений и сигналов
90%
До 90% прироста производительности от поколения к поколению
5
Преимущества памяти DDR4
Source as of August 2014 TR#3044 on STREAM (triad): Intel® Server Board S2600CP with two Intel® Xeon® Processor E5-2697 v2, 24x16GB DDR3-1866
@1066MHz DR-RDIMM, score: 58.9 GB/sec. New Configuration: Intel® Server System R2208 WTTYS with two Intel® Xeon® Processor E5-2699 v3, 24x16GB
DDR4-2133 @ 1600MHz DR-RDIMM, score: 85.2 GB/sec. Software and workloads used in performance tests may have been optimized for performance only on
Intel microprocessors. Performance tests, such as SYSmark and MobileMark, are measured using specific computer systems, components, software, operations and
functions. Any change to any of those factors may cause the results to vary. You should consult other information and performance tests to assist you in fully
evaluating your contemplated purchases, including the performance of that product when combined with other products. For more information go to
http://www.intel.com/performance
*Other names and brands may be claimed as the property of others.
1000
1400
1800
2200
128 GB 256 GB 384GB 512 GB 768 GB
32GB LRDIMM ONE5-2600 v3DDR4-2133
32GB LRDIMM ONE5-2600 v2DDR3-1866
Емкость подсистемы памяти 40%До 40% увеличения пропускной способностис 3-мя DIMM на канал
• Развитие технологий памяти с более высокими
скоростями и плотностью, и пониженным
напряжением
• Поддержка более высоких частот памяти на
бóльших емкостях
6
Самый энергоэффективный процессор:Поядерные режимы P-States (PCPS) делают общий вклад в
сохранение энергии
Один процессор
Одна производи-
тельность
Меньшее
потребление
PCPS Выкл
PCPS Вкл
Средняя частота/потребление на ядро
2 4 6 8 10 12
Ядро
2 4 6 8 10 12
Ядро
Comparison based on SPECpower*_ssj2008 results published as of August 26, 2014. Sugon I620-G20 platform with two Intel® Xeon® Processor E5-2699 v3, 10,599
overall ssj_ops/watt. Source. Software and workloads used in performance tests may have been optimized for performance only on Intel microprocessors. Performance
tests, such as SYSmark and MobileMark, are measured using specific computer systems, components, software, operations and functions. Any change to any of those
factors may cause the results to vary. You should consult other information and performance tests to assist you in fully evaluating your contemplated purchases, including
the performance of that product when combined with other products. For more information go to http://www.intel.com/performance *Other names and brands may be
claimed as the property of others.
24До 24% снижения потребления питания по сравнению с предыдущим поколением
%
Технологии для облачных вычисленийУлучшение качества сервисов с процессорами Intel® Xeon® E5 v3
7
Телеметрия платформы
Мониторинг Кэша
Этапы облаков:• Виртуализация
• Автоматизация
• Оркестрация
VMCS Shadowing
Быстрое шифрование данных
Сетевая виртуализация
Частное
облако
Мониторинг кэша обеспечивает качество сервиса
8
Проблема: Не видно используемые
ресурсы виртуальными машинамиРешение: согласованное предоставление
сервиса
= нет больше шумного соседа!
Раньше:
Одно приложение в
многопользовательской среде использует
слишком много ресурсов
(или “проблемы шумного соседа”)
Сегодня с мониторингом кэша:
Видимость в использовании ресурсов
кэша виртуальной машиной
VM
3
VM
4
VM
1 VM
2
Испол
ьзо
вание
Кэш
а
VM
3
VM
4
VM
1
VM
2
Испол
ьзо
вание
Кэш
а
9
VMCS Shadowing: Улучшение изоляции ВМ и возможностей мониторинга
Управление/ Защита Разраб./Тест.Поддержка старых
приложений
Hardware
Root VMM
Guest VMM
Current OS
VM0
Hardware
Root VMM
Current
OS
VM0
Legacy VMM
Legacy OS
VM1
Manage VM
Monitor for
malicious
activities
Hardware
Root VMM
Production
Env.
VM0
Pre-production VMM
Production
Env.
VM1
Dev / Test
Env.
VM2
• Node Manager 3.0
• Cache QoS Monitoring
10
Основные новшества
• Advanced Vector Extensions (AVX) 2.0
• PCPS (Per Core P-States)
• Память DDR4
• Virtual Machine Control Structure (VMCS) Shadowing
• Дедупликация
• Иерархия хранения
• Тонкие диски
• Шифрование
• Твердотельные накопители
Вычисления
Сеть
Хранение
• Контроллер 10/40 Gb Ethernet
• Разгрузка сетевой вирт-ции
• Flow Director
• Вирт-ция сетевых функций (NFV)
• Intel® QuickAssist® Technology
Трансформация СХД: строительные блоки Intel
11
Данные для
эффективности и
отказоустойчивости
Разделение данных
по типам для
увеличения
емкости и
доступности Cache Acceleration
SoftwareEnterprise Edition for
Lustre
PCIe SSDs
Развитие экосистемы
Ускорители СХД & SoC’s
СХД ПО
* Other brands and names may be claimed as the property of others.
Storage Acceleration
Library (ISA-L)
Intel® Rapid Storage
Technology enterprise
Виртуальный SAN: кардинально простой гипервизор- Конвергентная СХД
12
vSphere + Virtual SAN
…
Virtual SAN Shared
Datastore
Основы:• Програмно определяемая СХД внедрена в
vSphere
• Запускается на любых стандартных x86
серверах
• Объединяет HDD/flash в общее хранилище
• Система управления на базе политик СХД
• Высокая производительность за счет флэш
ускорения
• Высоко надежная - без потери данных в
случае аппаратных сбоев
• Глубоко интегрирована со стеком VMware
Hard disksSSD Hard disksSSDHard disksSSD
Кардинальная простота
• Устанавливается в два клика
• Управляется из клиента
vSphere
• Управление на основе политик
• Глубоко интегрирована со
стеком VMware
Высокая
производительность
• Интегрирована в ядро vSphere
• Флэш-ускорение
• Подбирает плотность VDI всего
флэш массива
• Лучшая
Цена/Производительность
Низкая Стоимость Владения
• Устраняет большие стартовые
инвестиции (CAPEX)
• Растет вместе с вами (OPEX)
• Гибкий выбор стандартного
оборудования
• Не требует специальных навыков
Основные преимущества Virtual SAN
13
Значительно снижается задержка при шифрованииреализовано за счет улучшенных инструкций Intel® AES-NI
0
0,5
1
1,5
2
E5-2600 v2 E5-2600 v3
Скорость передачи шифрованных данных
AES-GCM
14
Source as of June 2014 on AES-128-GCM Encryption algorithm: Intel internal measurements using Aztec City platform with two E5-2658 v3, DDR4-2133, CentoOS v3.8.4, Open SSL v1.0.2-beta1. Baseline
Configuration: Intel internal measurements with two E5-2658 v2, DDR3-1866, CentoOS v3.8.4, Open SSL v1.0.2-beta1. Software and workloads used in performance tests may have been optimized for performance
only on Intel microprocessors. Performance tests, such as SYSmark and MobileMark, are measured using specific computer systems, components, software, operations and functions. Any change to any of those
factors may cause the results to vary. You should consult other information and performance tests to assist you in fully evaluating your contemplated purchases, including the performance of that product when combined
with other products. For more information go to http://www.intel.com/performance *Other names and brands may be claimed as the property of others.
2xДо 2XВыросла скорость
• Node Manager 3.0
• Cache QoS Monitoring
15
Основные новшества
• Advanced Vector Extensions (AVX) 2.0
• PCPS (Per Core P-States)
• Память DDR4
• Virtual Machine Control Structure (VMCS) Shadowing
• Дедупликация
• Иерархия хранения
• Тонкие диски
• Шифрование
• Твердотельные накопители
Вычисления
Сеть
Хранение
• Контроллер 10/40 Gb Ethernet
• Разгрузка сетевой вирт-ции
• Flow Director
• Вирт-ция сетевых функций (NFV)
• Intel® QuickAssist® Technology
10GbE / 40GbE создан для E5 v3Отличительные особенность Intel® Ethernet CNA XL710
• Новое поколение 10 / 40 GbE – спроектировано для
использования в облачных средах
• Программно определяемая инфраструктура – разгрузка
сетевой виртуализации, Intel® Ethernet Flow director для
управления трафиком
• Виртуализация сетевых функций (NFV) – высокая
производительность на маленьких пакетах, Intel® DPDK
Валидация платформ
Драйверы Intel
30 лет – «Just Works»
Проверенные
Созданы для программно определяемой
инфраструктуры SDI
Конверг.: LAN / SAN
Интерфейсы: 2x40, 1x40,
4x10, 2x10
Гибкие
Виртуализация: VMDq, SR-
IOV, Flow Director,
оптимизирован для DPDK
Производительные
Ускорение виртуальных оверлейных сетей
Производительность VXLAN Overlay
Source Intel Arch Lab Aug 2014 1: Test Configuration SUT1 2x Xeon E5-2697 v2 (2.7ГГц, 24c) 128GB, 8-ch, DDR3, 1600MHz 2x Intel X520, ixgbe 3.21.2 Ubuntu x64, kernel v3.11, SUT2: 2x Xeon E5-2699 v3 (2.3ГГц, 14c) 128GB, 8-ch, DDR4, 2133MHz Intel Ethernet CNA XL710, i40e 1.0.15 Linux x64, kernel v3.15.6, Netperf 2.6 default settings running on 4 VNIs with 8 threads eachSoftware and workloads used in performance tests may have been optimized for performance only on Intel microprocessors. Performance tests, such as SYSmark and MobileMark, are measured using specific computer systems, components, software, operations and functions. Any change to any of those factors may cause the results to vary. You should consult other information and performance tests to assist you in fully evaluating your contemplated purchases, including the performance of that product when combined with other products.For more information go to http://www.intel.com/performance *Other names and brands may be claimed as the property of others.
25%Более 25% увеличения
пропускной способности
1 x 40 GbEПропускная 39 Гбит/с
@ 11% загрузка CPU
4 x 10 GbE LAGПропускная 31 Гбит/с
@ 52% загрузка CPU
78%До 78% снижения нагрузки на CPU
Контроллер
Ethernet
без механизма
UDP RSS для
VXLAN
4 x 10 GbE LAGПропускная 4 Гбит/с
@ 5% загрузка CPU
Intel® Ethernet Flow Director
19
Более чем в три раза memcachedЗапросов В Секунду (RPS)1
~3x RPS
Снижениелатентности
Из-за уменьшеногопереключения контекста
Source Intel Arch Lab Aug 2014 1: Test Configuration Memcached v1.4.20, 48 or 64 thr 12 Clients, Mcblaster Record Size = 64 Bytes (TCP) Number of keys = 1,000,000 Threads per client (-t) = 24 Connections per
thread (-c) = 1 Nagles Disabled, SUT1 2M RPS – RSS and 5.6M RPS – Flow Director: 2x Xeon E5-2697 v2 (2.7GHz, 24c) 128GB, 8-ch, DDR3, 1600MHz Intel X520, ixgbe 3.21.2 RHEL 7.0 x64, optimized kernel
v3.10, SUT2 7.6M RPS – Flow Director: 2x Xeon E5-2699 v3 (2.3GHz, 36c) 128GB, 8-ch, DDR4, 2133MHz Intel Ethernet CNA XL710, i40e 1.0.15 RHEL 7.0 x64, optimized kernel v3.10
Performance tests and ratings are measured using specific computer systems and/or components and reflect the approximate performance of Intel products as measured by those tests. Any difference in system
hardware or software design or configuration may affect actual performance. Buyers should consult other sources of information to evaluate the performance of systems or components they are considering
purchasing. For more information on performance tests and on the performance of Intel products, visit http://www.intel.com/performance/resources/benchmark_limitations.htm.
Non Intel EthernetController
Hardware Queues
Intel EthernetController XL710Hardware Queues
Linux* OSLinux* OS
Intel® Data Direct I/O (Intel® DDIO)Intel® Data Direct I/O (Intel® DDIO)
Rx1Queue
App
Rx0Queue
Core1
App
Received Side Scaling ONLY Intel® Ethernet Flow Director
No Flow to Core Alignment Intelligent Flow to Core Alignment
Core0
Context Switch
Flow Flow
Core1
Intel® Ethernet Flow Director
20
Source Intel Arch Lab Aug 2014 1: Test Configuration Memcached v1.4.20, 48 or 64 thr 12 Clients, Mcblaster Record Size = 64 Bytes (TCP) Number of keys = 1,000,000 Threads per client (-t) = 24
Connections per thread (-c) = 1 Nagles Disabled, SUT1 2M RPS – RSS and 5.6M RPS – Flow Director: 2x Xeon E5-2697 v2 (2.7GHz, 24c) 128GB, 8-ch, DDR3, 1600MHz Intel X520, ixgbe 3.21.2 RHEL 7.0
x64, optimized kernel v3.10, SUT2 7.6M RPS – Flow Director: 2x Xeon E5-2699 v3 (2.3GHz, 36c) 128GB, 8-ch, DDR4, 2133MHz Intel Ethernet CNA XL710, i40e 1.0.15 RHEL 7.0 x64, optimized kernel v3.10
Performance tests and ratings are measured using specific computer systems and/or components and reflect the approximate performance of Intel products as measured by those tests. Any difference in
system hardware or software design or configuration may affect actual performance. Buyers should consult other sources of information to evaluate the performance of systems or components they are
considering purchasing. For more information on performance tests and on the performance of Intel products, visit http://www.intel.com/performance/resources/benchmark_limitations.htm.
Non Intel Ethernet Controller Hardware Queues Intel Ethernet Controller XL710 Hardware Queues
AppApp
Linux* OSLinux* OS
Intel® Data Direct I/O (Intel® DDIO)Intel® Data Direct I/O (Intel® DDIO)
App App App App
AppApp App App App
AppApp App App App App
AppApp App App App
Received Side Scaling ONLY Intel® Ethernet Flow Director
No Flow to Core Alignment Intelligent Flow to Core Alignment
Более чем в три раза memcachedЗапросов В Секунду (RPS)1
~3x RPS
Снижениелатентности
Из-за уменьшеногопереключения контекста
Процессоры
Intel® Xeon® E5-2600 v3
Процессор Intel® Xeon®,
SSD диски Intel и ПО
Контроллеры и
адаптеры Intel® 40
Gb Ethernet
21
Intel® Xeon® E5 v3: выигрышная комбинациякомплексного подхода
Вычисления
Сеть
Хранение
Back up
23
24
Cache Monitoring Designed to Improve Service Quality and Utilization
Hardware
VMM
“Good
Neighbor”
VM1
Cache Subsystem
Unused Cache
E5 v3: Cache Monitoring
Hardware
VMM
“Good
Neighbor”
VM1
“Noisy
Neighbor”
VM0
Cache Subsystem
“Good Neighbor” cache
“Noisy Neighbor” cache
Cache QoS provides information
on individual VMs in Cache.
E5 v2:
No Cache Monitoring
First come, first served
“Good Neighbor” cache
Hardware
VMM
“Good
Neighbor”
VM1
Cache Subsystem
Unused Cache
“Good Neighbor” cache
Enables IT automation to make
better utilization decisions
+“Better Neighbor” cache