intel® cloud for all accelerating cloud adoption · pdf fileintel confidential ipmi =...

27
云数据中心基础架构 敏捷管理 王军,[email protected] 数据中心解决方案部研发总监,英特尔中国 201617

Upload: hadat

Post on 30-Jan-2018

236 views

Category:

Documents


0 download

TRANSCRIPT

Page 1: Intel® Cloud for All Accelerating Cloud Adoption · PDF fileIntel Confidential IPMI = Intelligent Platform Management Interface iDRAC ... SSH = Secure Shell ... 板载 BMC 进行数据监测

云数据中心基础架构敏捷管理

王军,[email protected]

数据中心解决方案部研发总监,英特尔中国

2016年1月7日

Page 2: Intel® Cloud for All Accelerating Cloud Adoption · PDF fileIntel Confidential IPMI = Intelligent Platform Management Interface iDRAC ... SSH = Secure Shell ... 板载 BMC 进行数据监测

2

计算无处不在,中国引领世界

1,2 来源:第35次《中国互联网络发展状况统计报告》,2015年2月3 来源:腾讯2014年全年财报,2015年3月4 来源:TrendForce, 2015年7月5 来源:IDC《中国平板电脑市场季度跟踪报告》,2014年12月

其他的名称和品牌可能是其他所有者的资产。

>6.49亿1 中国互联网用户

>5.57亿2 中国手机互联网用户

>5.49亿3 全球微信月活跃用户

>4.15亿4 每年新增智能手机

>2900万5 每年新增PC和平板

随互联计算产生的,对于数据中心计算、存储、网络的巨大需求

Page 3: Intel® Cloud for All Accelerating Cloud Adoption · PDF fileIntel Confidential IPMI = Intelligent Platform Management Interface iDRAC ... SSH = Secure Shell ... 板载 BMC 进行数据监测

3

开放的云生态环境

数据中心的基础架构管理的敏捷性是加速云计算的关键

操作系统, 库文件

资源池

云协调层

虚拟化软件

开发者

存储计算 网络

数据中心运维设施

Page 4: Intel® Cloud for All Accelerating Cloud Adoption · PDF fileIntel Confidential IPMI = Intelligent Platform Management Interface iDRAC ... SSH = Secure Shell ... 板载 BMC 进行数据监测

云计算关键应用对数据中心基础架构的挑战与需求

开放

灵活、易扩展

高效率、低成本运营(能源+人力)

快速响应且稳定可靠(高性能+健康管理)

Source: Redshift Research 2015 (100 US, 100 UK operators)

4

效率低

能耗高

业务弱

50%非IT设备支出占比持续增加

100台人均维护服务器

(Google达3000台)

$300K平均每小时系统奔溃损失

7小时53分平均恢复时间

90天平均业务上线

Page 5: Intel® Cloud for All Accelerating Cloud Adoption · PDF fileIntel Confidential IPMI = Intelligent Platform Management Interface iDRAC ... SSH = Secure Shell ... 板载 BMC 进行数据监测

5

数据中心管理现状

Source: Redshift Research 2015 (100 US, 100 UK operators)

Page 6: Intel® Cloud for All Accelerating Cloud Adoption · PDF fileIntel Confidential IPMI = Intelligent Platform Management Interface iDRAC ... SSH = Secure Shell ... 板载 BMC 进行数据监测

英特尔平台技术Intel Platform Technologies

• Manageability Engine, Innovation Engine, Run Sure Technology

• Node Manager, PTAS, DCMI, Redfish

• Rack Scale Architecture

英特尔软件产品Intel® Datacenter Manager

• 能耗和容量管理专家

Intel® vKVM

• 设备健康管理

• 集中化带外/带内远程接入

英特尔支持和服务Intel Support & Services

• 咨询

• 实施

• 维护服务

• 定制化开发服务

Intel提供专业的数据中心基础架构管理方案

OEM/ODM 平台 合作伙伴/Intel控制台/SDK

6

Page 7: Intel® Cloud for All Accelerating Cloud Adoption · PDF fileIntel Confidential IPMI = Intelligent Platform Management Interface iDRAC ... SSH = Secure Shell ... 板载 BMC 进行数据监测

Intel® Virtual KVM

能耗管理专家

Intel® Datacenter Manager

Page 8: Intel® Cloud for All Accelerating Cloud Adoption · PDF fileIntel Confidential IPMI = Intelligent Platform Management Interface iDRAC ... SSH = Secure Shell ... 板载 BMC 进行数据监测

Copyright © 2011, Intel Corporation. All rights reserved.

*Other brands and names are the property of their respective owners

Intel Confidential

IPMI = Intelligent Platform Management Interface iDRAC = Integrated Dell Remote Access Controller iLO = Integrated Lights-out

IMM = Integrated Management Module CMC = chassis management controller OA = Onboard Administrator

SNMP = Simple Network Management Protocol CLI = command line interface SSH = Secure Shell

WS-MAN = Web Services-Management DCMI = Data Center Manageability Interface

DCM中间件(Web Service API)控制监测 分析

标准化可扩展性

DCM Console或者第三方客户界面

硬件协议Node Manager

IPMIiDRAC IPMI

iLO/DCMIIPMI

IMMIPMI

CMCHTTPS/WS-MAN

OASSH/CLI

IMMSSH/CLI

SNMP

PDU和UPS刀片服务器

DCM 是一款管理数据中心功耗,温度和容量的管理软件,并提供完整功能的SDK,可以便捷地集成在数据中心已有管理平台中

Intel® DCM 数据中心管理平台

机架服务器

8

Page 9: Intel® Cloud for All Accelerating Cloud Adoption · PDF fileIntel Confidential IPMI = Intelligent Platform Management Interface iDRAC ... SSH = Secure Shell ... 板载 BMC 进行数据监测

Intel DCM 从数据中心到服务器

数据中心架构管理

按照物理设备进行数据中心分级架构管理

可视化机柜 在机架级别显示能耗和温度

设备管理 显示和操作设备的详细信息

网络发现 通过网络自动发现可支持的设备并加入

设备导入 从excel文件导入大批可支持的设备

逻辑组管理 灵活的逻辑组构建及管理

通过DCM我能马上看到财务部新购置的Windows服务器部署在什么位置,让我来检查下它运行的状态…

ABC公司数据中心服务器管理员

通过服务器板载BMC进行数据监测,无须任何额外硬件

软件客户端无须安装托盘程序,使用浏览器进行监测

超过上百类主流服务器厂商型号兼容,并随着英特尔新平台不断扩展,服务器厂商未来将进行DCM认证

9

Page 10: Intel® Cloud for All Accelerating Cloud Adoption · PDF fileIntel Confidential IPMI = Intelligent Platform Management Interface iDRAC ... SSH = Secure Shell ... 板载 BMC 进行数据监测

能耗优化:发现热点、优化空调能耗

在这个月机房巡检的时候,总感觉机房里很凉,我觉得有可能是空调过度制冷了,让我在DCM看一下是否是这样的情况…

果然,没有一台服务器超过22度,让我找数据中心经理谈一谈,我们能否从空调入手节省能源?

ABC公司数据中心基础设施管理员

根据ASHRAE(美国暖通协会)的最佳实践作为评判标准

数据中心服务器进风口温度可视化报告

提供科学的的制冷系统优化建议并给出能源节省预估

发现服务器热点,提供优化建议,并立即定位设备

关联应用进行更智能的优化(与百度合作)

10

Page 11: Intel® Cloud for All Accelerating Cloud Adoption · PDF fileIntel Confidential IPMI = Intelligent Platform Management Interface iDRAC ... SSH = Secure Shell ... 板载 BMC 进行数据监测

能耗优化:发现“僵尸服务器”和低效率服务器

低效能服务器报告——让无谓耗电的“僵尸”服务器无处藏身。上图显示某IPDC数据中心20%的服务器,利用率长期<5%。

销售部门又要申请新服务器来上线他们的Salesforce系统,电费又要激增了..对了,先别着急,让我看看有没有压根没有人用的服务器,嗯,果然有不少,这下节能任务好办了。

ABC公司数据中心经理

根据大量的能耗监测数据进行分析,掌握低利用率服务器

准确的服务器利用率监测报告

预估的关闭/下降/整合该服务器将带来的能源节约

1瓦特的服务器用电节省,将给数据中心带来约3瓦特的能源节省

11

Page 12: Intel® Cloud for All Accelerating Cloud Adoption · PDF fileIntel Confidential IPMI = Intelligent Platform Management Interface iDRAC ... SSH = Secure Shell ... 板载 BMC 进行数据监测

能耗优化:服务器能耗控制自动策略

最近新上架的给研发用的30台服务器晚上几乎没有人用,让我来在DCM设置下策略,尝试降低一下服务器耗电甚至关掉它们,这样也可让捉襟见肘空调制冷压力降低一些…

基于数据中心至服务器级别的能耗控制策略

基于业务分组的能耗控制策略,灵活多变

可设置服务器能耗控制优先级,保证关键业务效率

策略可设置为一次性、永久、循环满足不同应用场景

基于服务器分组的开机/关机任务策略,让能源控制更加智能

紧急情况策略,延长UPS使用时长

结合应用,空调系统可以实现更多的策略控制

ABC公司数据中心运维管理员

12

Page 13: Intel® Cloud for All Accelerating Cloud Adoption · PDF fileIntel Confidential IPMI = Intelligent Platform Management Interface iDRAC ... SSH = Secure Shell ... 板载 BMC 进行数据监测

机柜密度提升:延长数据中心寿命

4400

服务器数量

机架铭牌容量 = 4400w

3800

预计的机架电源容量 = 3800w

*Data may vary due to server power consumption difference*Planned Power is based on 270w/server for original planning(163-269w in standard)

机柜密度提升——透过监测某IPDC 数据中心, 利用DCM的监测及能耗控制功能,将服务器上架数量从14 台24 台。极大的提高了机柜密度,毫无疑问可延长数据中心寿命

13

Page 14: Intel® Cloud for All Accelerating Cloud Adoption · PDF fileIntel Confidential IPMI = Intelligent Platform Management Interface iDRAC ... SSH = Secure Shell ... 板载 BMC 进行数据监测

°

数据中心温度与能耗监测及管理

可避免购买价格高昂测量型PDU即能测试IT设备能耗

数据中心容量规划

准确分析并确定数据中心内的“僵尸”服务器

最小监测级别为设备级的准确监视

发现并及时通知电源及温度紧急情况

虚拟化环境的电源保障

不同应用情况下的服务器电源控制策略

数据中心供电紧急状态下的特殊功耗策略

热点分析及进一步能耗优化建议

服务器功耗特征

总结:Intel® DCM 帮助数据中心灵活

管理能源使用

14

Page 15: Intel® Cloud for All Accelerating Cloud Adoption · PDF fileIntel Confidential IPMI = Intelligent Platform Management Interface iDRAC ... SSH = Secure Shell ... 板载 BMC 进行数据监测

全球的成功案例

15

Japanese Large

Internet Service

Company

峰值功率需求不断增大情况下数据中心每月电费减少

收费系统使设备无误地为主机代管(colo)和其它类型的服务器用户计费

识别确定用电峰值,高峰时段用电量减少18%

运用Intel DCM使得机架密度增加71%

运用电源管理策略在保持功率包络不变时增加机架密度多达83%

监测容量和耗电量使得机架密度增加60%

识别出10%-15%未被充分利用的服务器和虚拟化系统

发现13%的服务器未充分利用, 可以提高计算性能或者关掉设备

通过低效服务器合并,10K服务器的数据中心三年可节约63万美元

停电时UPS在有限影响范围内正常运行时间延长15%

停电时延长正常运行时间达25%

整合到预警设备加快新产品上市

采集温度数据可使用户看到数据中心的二维热度图

从最低级到设备级极大程度提高的温度监测能力

将机房温度提高了4

度,制冷能耗节省了32%

在几乎不影响性能情况下电量消耗度数减少了18%

不影响性能情况下节省了15%的能量消耗

运用DCM ED和节点管理节省了25%的能源消耗

客户

用途

电量监测 增加机架密度

识别僵尸服务器

识别功耗/温度故障

提高温控技术 功耗管理

中国大型IPDC

中国大型IPDC

Page 16: Intel® Cloud for All Accelerating Cloud Adoption · PDF fileIntel Confidential IPMI = Intelligent Platform Management Interface iDRAC ... SSH = Secure Shell ... 板载 BMC 进行数据监测

Intel® Virtual KVM

远程访问与健康管理

Intel® Virtual KVM

Page 17: Intel® Cloud for All Accelerating Cloud Adoption · PDF fileIntel Confidential IPMI = Intelligent Platform Management Interface iDRAC ... SSH = Secure Shell ... 板载 BMC 进行数据监测

Intel® Virtual KVM -健康管理及远程访问

远程服务器访问(支持带内、带外多种方式)

带外服务器健康监测及报警,分析和预警

远程服务器控制

支持各种服务器品牌 (HP, Dell, Lenovo, Huawei, Inspur, Sugon, Quanta, Fujitsu, etc.)

提供集中式管理界面及SDK开发包

17 17

Page 18: Intel® Cloud for All Accelerating Cloud Adoption · PDF fileIntel Confidential IPMI = Intelligent Platform Management Interface iDRAC ... SSH = Secure Shell ... 板载 BMC 进行数据监测

3rd Party Intel CompsLegend:

Intel® Virtual KVM 产品架构

IT/Facility Management Solution

Intel® Virtual KVM Gateway

Web Launcher(Java applet)

Virtual KVM Gateway Service

API – WS, JSON

OOB Device Management

Http/HttpsKVM Session Management

IPMI/SSH /etc.

Device Mgmt

OOB vKVM Driver Lib

HTTP Parser

OOB Device Connector

Data Logging

IT Administrator

vKVM

SSH

VNC RDP

Option 2

Direct Comm.

vKVM Engine

SunIntel/EPSDIBMHPDell

iDRAC/CMC iLO/OA IMM/AMM

Cisco

UCS

Fujitsu

BMCBMC ILOM/ALOM

Device Info

VGW Sock Proxy

vKVM Traffic Vendors’ proprietary protocol

Proxy thru vGTW

Option 1

SoftKVM

SOL

browser

Device Management

Server Health

Power on/off

18

Page 19: Intel® Cloud for All Accelerating Cloud Adoption · PDF fileIntel Confidential IPMI = Intelligent Platform Management Interface iDRAC ... SSH = Secure Shell ... 板载 BMC 进行数据监测

19

集中式远程访问

• 统一认证• 一键启动• 屏蔽不同服务器品牌差异• 带内和带外• 跨网关支持

Page 20: Intel® Cloud for All Accelerating Cloud Adoption · PDF fileIntel Confidential IPMI = Intelligent Platform Management Interface iDRAC ... SSH = Secure Shell ... 板载 BMC 进行数据监测

健康监测及远程访问

远程访问

健康监测

远程开关机

健康报警

服务器组件级健康信息

19

Page 21: Intel® Cloud for All Accelerating Cloud Adoption · PDF fileIntel Confidential IPMI = Intelligent Platform Management Interface iDRAC ... SSH = Secure Shell ... 板载 BMC 进行数据监测

更多健康数据获取,分析与预警

20

分析与预警

更多平台数据的获取(基于英特尔平台创新技术)

系统健康数据统计和分析

子组件健康数据统计和分析

基于数据分析的异常检测

基于机器学习的异常预警

基于应用的健康管理和预测

Page 22: Intel® Cloud for All Accelerating Cloud Adoption · PDF fileIntel Confidential IPMI = Intelligent Platform Management Interface iDRAC ... SSH = Secure Shell ... 板载 BMC 进行数据监测

Intel® Virtual KVM

市场推广与合作

Page 23: Intel® Cloud for All Accelerating Cloud Adoption · PDF fileIntel Confidential IPMI = Intelligent Platform Management Interface iDRAC ... SSH = Secure Shell ... 板载 BMC 进行数据监测

终端客户方案与途径

23

英特尔自带方案

英特尔

ISV 方案

ISVs

OEM 方案

OEMs

Page 24: Intel® Cloud for All Accelerating Cloud Adoption · PDF fileIntel Confidential IPMI = Intelligent Platform Management Interface iDRAC ... SSH = Secure Shell ... 板载 BMC 进行数据监测

24

Intel®DCM, Intel®vKVM 全球合作伙伴

Page 25: Intel® Cloud for All Accelerating Cloud Adoption · PDF fileIntel Confidential IPMI = Intelligent Platform Management Interface iDRAC ... SSH = Secure Shell ... 板载 BMC 进行数据监测

相关信息

更多信息 Intel® Virtual KVM: www.intel.com/vgateway

Intel® DCM: www.intel.com/dcm

联系方式:

Jason Gao [email protected]

Joshua Wang [email protected]

Jun Wang [email protected]

25

Page 26: Intel® Cloud for All Accelerating Cloud Adoption · PDF fileIntel Confidential IPMI = Intelligent Platform Management Interface iDRAC ... SSH = Secure Shell ... 板载 BMC 进行数据监测

www.intel.com/centerofpossibility

Page 27: Intel® Cloud for All Accelerating Cloud Adoption · PDF fileIntel Confidential IPMI = Intelligent Platform Management Interface iDRAC ... SSH = Secure Shell ... 板载 BMC 进行数据监测