baidu big data driven artificial intelligence

Post on 15-Aug-2015

189 Views

Category:

Documents

0 Downloads

Preview:

Click to see full reader

TRANSCRIPT

百度大数据人工智能

请求来自 138 个

国家和地区

每天

60 亿次搜索请求

每天每个中国网民

使用 10 次百度

移动搜索份额

79.8%

490 亿元2014 年总营收

15 年健康成长

百度海量数据

• >2000PB存储能力

• 10-100PB/ 天数据处理量

• 千亿 ~ 万亿网页

• 百亿 ~ 千亿索引

• 十亿 ~ 百亿 / 天更新量

• 100TB~1PB/ 天日志

百度每天处理的数据量将近 100个 PB , 1PB 就等于 100 万个G ,相当于 5000 个国家图书馆的信息量的总和

自诞生第一天起,百度就是一家人工智能公司

搜索数据Mega Data

商业价值Monetization

大数据人工智能Data - driven AI

人工智能,正在成为科技创新的主战场

什么是人工智能?

感知

控制思考

无处不在的“ 智能 XX ”

智能水杯智能手表

智能手环智能汤匙智能冰箱

智能手机

如何区分这些产品是否真的智能?

VS.

随着经验演化,越变越聪明

学习的能力,是智能的本质!

一个时代正在来临

20102008 201420122004 20202006 2016 2018

电脑

智能手机

平板

联网设备

联网电视

联网汽车可穿戴设备

260 亿 互联设备

移动时代 万物互联

40ZB 数据量

20102008 201420122004 20202006 2016 2018

万物互联 数据暴增

数据来源: IDC

万物互联 万物智能

大数据时代

深度学习为 2013 年十大技术突破之首

MIT Technology Review , April 23rd

, 2013

深度学习迅速影响了最前沿的高科技公司

Google Microsoft Facebook

百度大脑

无时不刻在学习和演进

千亿级参数

构建世界上最大规模深度神经网络

世界领先的

深度学习算法:

语音识别,图像识别,自然语言理解,广

告精准匹配,用户建模,

百度大脑,让连接变得更智能

人 百度

1. 理解用户意图:文本分析,图像识别,语音识别,…

1

2. 匹配用户需求:优化搜索结果的智能排序,…

信息2

3. 精准推送广告和服务:估计和优化点击率和转化率,…

广告服务3

• 模拟大脑的行为

• 特别适合大数据

• End-to-end 学习

• 提供一套建模语言

为什么深度学习受到重视?

模拟人类大脑的分层结构以及行为

图像像素

不同方向

的边界

物体的各个部位

整个物体

大数据和深度学习

数据规模

效果

传统人工智能算法

深度学习算法

人工智能的成功应用

世界上首次深度学习成功应用于广告变现

凤巢系统从浅层模型时代到深度模型时代

用户

百度 广告主

深度学习显著提升了百度凤巢广告系统

未用深度学习 用了深度学习语义模型之后

世界上首次将深度学习成功应用搜索引擎

迄今为止深度神经网络作用于自然语言最成功的例子。

深度学习显著提升了百度搜索满意度领先优势

Voice Search

Voice Type-setting

LBS

voice service

Voice Assis-

tant

深度学习提升了语音识别准确率

60708090

安静环境 噪声环境

百度

Google

移动语音搜索,世界首屈一指的中文语音识别率

安静环境 噪声环境

Accuracy

自然图片 OCR :百度翻译

自然图片 OCR :百度作业帮

高峰时用户一天上传 9000 万张照片, 连续三周 iOS 应用商店总榜排行第一

百度魔图:基于深度学习的人脸识别技术

人脸验证准确率达到 99.85%

百度拥有世界领先的基于内容的图像搜索技术

输入检索图片

百度结果 竞品结果

0.380.40

百度 谷歌

全球最好的物体检测模型

来源: ImageNet Challenge 2014

Mean Average Precision

No.1 No.2

述说图片的故事

A yellow bus driving down a road with green trees and green grass in the background.

Living room with white couch and blue carpeting. The room in the apartment gets some afternoon sun.

这些字幕是深度学习程序写的

舆情分析,让营销活动更具针对性舆论趋势监测

网民正负面意见挖掘舆论传播路径追踪

舆论监督与引导突发事件的及时发现与响应

有针对性的营销活动对竞争对手的了解和针对性策

略“ 肯德基”舆情分析

工业领域——智能监控与运维

• 百度基础设施• 200+ 万块硬盘• 硬件故障率:硬盘 > 内存 > 电源

• 预测故障,提前拷贝数据,更换硬盘• 百度经过对近 9 亿条实例进行采集处理• 选取15 万个训练样本• 从历史的硬盘故障病例中,选取了 240 个特征• 人工智能模型预测硬盘故障

• 对比无预测的故障恢复的好处• 提前一天预测出硬盘故障• 提前拷贝数据,更换硬盘• 准确率 >85%

• 极大节省带宽和计算资源

• 正在 IT、发电机组、发动机组、汽车制造和基站等的智能监控与运维方面开展合作 34

生产效率 运营成本

数据智能预测

数据查询

数据存储

百度大数据引擎

疾病预测,提前防范

借助大数据,让医疗卫生管理和服务真正深入人心、体现公益性: 公共卫生监测 流行疾病追踪 医疗服务质量评测

人工智能,不仅仅发生在互联网

百度高度自动驾驶项目

Remodeled LBS street-view car Two BMW 335i

LiDAR + Camera + Radar + GPS/IMUThe ATV car as a quick test bed

三维高精度地图和感知定位

•开发大规模的三维高精度地图技术 (已完成 G7 和五环 )

• 达到业界最领先精度 10~20 厘米• 高精度定位是包括自动驾驶在内的很多应用的核心技术

3D point clouds around the Baidu headquarter

A 3D high-precision map of the G7 highway

Curb Weight: 1650kg

Wheelbase: 2.92m

Turning Circle: 11.8m

Geometry and Physics ParametersEngine Model and Parameters

BMW N55B30 3L

Transmission Model and Parameters

* by estimation

百度自动驾驶项目–动力控制系统建模仿真

Suspension Model and Parameters

基于图像的实时道路场景理解

•利用深度学习开发各种图像识别技术•低成本的摄像头和其他感知设备是关键 (compare to Google).

Scene parsing with CDNN Real-time vehicle detection

从辅助驾驶到高度自动驾驶

辅助驾驶

主动安全

特定条件下的自动驾驶

高度自动驾驶

全景图:基于大数据的人工智能

42

互联网索引知识

人机交互

物理世界传感器 ,3D 建模

百度大脑 Deep Learning Platform

高性能计算

搜索,广告,预测,决策

智能硬件 ,机器人 , 自动驾驶

探索发现,3D打印

信息感知 思考 , 学习 决策 , 行动 , 创造

开放+合作

中国大脑计划:人工智能基础资源和公共服务平台,面向不同研究领域开放平台资源,高效对接社会资源,依托统一平台协同创新。

建议设立“中国大脑”计划,推动人工智能跨越发展,抢占新一轮科技革命制高点。

中国大脑计划总体目标

一个平台

两个技术方向

一系列基础研究与关键技术

多行业示范应用

万亿级产业规模

一个平台,整合资源与服务

异构计算(GPU、 CPU、类脑处理器)

深度学习

脑科学研究

大规模机器学习 类脑计算

关键技术

公共民生、国防军事、产业应用

行业数据

多行业示范应用

生物医药、医疗健康金融经济调控与预测

智能机器人

军事国防

互联网智能交通与自动驾驶汽车

农业

工业制造

能源化工

谢谢各位领导!

top related