oracle r enterprise介绍

21
<Insert Picture Here> ©2012 Oracle All Rights Reserved Oracle R Enterprise介绍 杨雷 甲骨文公司资深咨询顾问

Upload: trinhdang

Post on 02-Jan-2017

251 views

Category:

Documents


1 download

TRANSCRIPT

Page 1: Oracle R Enterprise介绍

<Insert Picture Here>

©2012 Oracle – All Rights Reserved

Oracle R Enterprise介绍

杨雷 甲骨文公司资深咨询顾问

Page 2: Oracle R Enterprise介绍

2

Rexer Analytics Survey 2011

Page 3: Oracle R Enterprise介绍

3

R语言介绍

• R是统计领域广泛使用的诞生于 1980年左右的S语言的一个分支。 R是S语言的一种实现。S语言是由AT&T贝尔实验室开发的一种用来进行数据探索、统计分析、作图的解释型语言。最初S语言的实现版本主要是S-PLUS

• R是用于统计分析、绘图的语言和操作环境。R是属于GNU系统的一个自由、免费、源代码开放的软件,它是一个用于统计计算和统计制图的优秀工具

• R是一套完整的数据处理、计算和制图软件系统。其功能包括:

– 数据存储和处理系统;

– 数组运算工具(其向量、矩阵运算方面功能尤其强大);

– 完整连贯的统计分析工具;

– 优秀的统计制图功能;

– 简便而强大的编程语言:可操纵数据的输入和输入,可实现分支、循环,用户可自定义功能。

• R是一种统计软件,也是一种数学计算的环境,因为R并不仅仅提供若干统计程序;使用者只需指定数据库和若干参数便可进行一个统计分析

Page 4: Oracle R Enterprise介绍

4

R语言核心

• 提供一些集成的统计工具

• 更大量的是它提供各种数学计算、统计计算的函数,从而使使用者能灵活机动的进行数据分析

• 提供可以创造出符合需要的新的统计计算方法。

• 语法表面上类似 C,但在语义上是函数设计语言的(functional programming

language)的变种并且和Lisp 以及 APL有很强的兼容性。

Page 5: Oracle R Enterprise介绍

5

R相关的Package 序号 包(Package) 描述

1 base 基本R函数

2 datasets 基本R数据集

3 grDevices 基本的或grid图形的设备函数

4 graphics 基本图形函数

5 grid grid函数

6 methods 用于R对象和编程工具的方法和类的定义

7 splines 样条回归函数和类

8 stats 统计函数

9 stats4 基于S4标准定义的统计函数

10 tcltk R和Tcl/Tk图形接口元素的交互函数

11 tools 包开发和管理的工具

12 utils R工具函数

13 boot 抽样和bootstraping方法

Page 6: Oracle R Enterprise介绍

6

R相关的Package - 续 序号 包(Package) 描述

14 class 分类方法

15 cluster 聚类方法

16 foreign 读取各种格式(S3,Stata,SAS,Minitab,SPSS,Epi Info)的外部数据

17 KernSmooth 核密度拟合方法(包括双变量核)

18 lattice grid图

19 MASS Venables & Ripley著的“Modern Applied Statistics with S”中的配套库,包含很多有用的函数,工具和数据集

20 mgcv 广义的可加模型

21 nlme 线性和非线性混合效应模型

22 nnet 神经网络和多项对数线性模型

23 npart 递归分割

24 spatial 空间分析(“kriging”,空间协方差,…)

25 survival 生存分析

... ... ...

Page 7: Oracle R Enterprise介绍

7

Oracle R Enterprise的优势

• 在数据库中运行模型

• 可处理大型数据集

• 发挥 Oracle Database 11g 和 Exadata 的强大能力

• 代码相同,而速度更快

• Oracle Advance Analytics

• 与OBIEE集成

• SAS与SPSS之外很好的选择

• 3500+可用的开源R packages

Page 8: Oracle R Enterprise介绍

8

缺省的R GUI

Page 9: Oracle R Enterprise介绍

9

RStudio – Third Party, Open Source IDE

Page 10: Oracle R Enterprise介绍

10

Data Visualization with R

Page 11: Oracle R Enterprise介绍

11

ORE图型示例…

Page 12: Oracle R Enterprise介绍

12

SQL

Oracle Advanced Analytics Option

Data Analysts

Data Scientists

Statisticians

Database

Statistics

Data Mining

Spatial

OLAP

Text

… Query

data parallelism

Database Developers

DBAs

SQL

©2012 Oracle – All Rights Reserved

Page 13: Oracle R Enterprise介绍

13

主题 SAS产品线 SPSS产品线 R语言相关包

高级模块 SAS/STAT® SPSS Advanced Models™ stat, MASS及众多扩展包

基础模块 SAS® SPSS Base™ R

联合分析 SAS/STAT®: Transreg SPSS Conjoint™ homals, psychoR , bayesm

对应分析 SAS/STAT®: Corresp SPSS Categories™ homals, MASS, FactoMineR, ade4, PTAk,

cocorresp, vegan, made4, PsychoR

自定义表格 SAS Base® Report、SQL, Tabulate SPSS Custom Tables™ reshape

数据接口 SAS/ACCESS® SPSS Data Access Pack™ DBI, foreign, RODBC

数据挖掘 Enterprise Miner™ Clementine® rattle, arules, FactoMineR

数据校验 Various procedures Various procedures, SPSS Data

Preparation™ dprep, various functions

Exact Tests SAS/STAT®: various SPSS Exact Tests™

coin, elrm, exactLoglinTest,

exactmaxsel, exactRankTests,及其他许多包

基因分析 SAS/Genetics®, SAS/Microarray®

Solution®, JMP Genomics® 无 Bioconductor

GIS SAS/GIS®,

SAS/Graph® SPSS Maps™

maps, mapdata, mapproj,

GRASS via spgrass6,

RColorBrewer及其他包的部分功能

交互图 Enterprise Guide® SPSS Base™ JGR, R Commander, pmg, Sciviews

SAS/INSIGHT® 无 GGobi via rggobi iPlots, Mondrian via Rserve

统计图 SAS/GRAPH® SPSS Base™

ggplot, gplots, graphics, grid, gridBase,

hexbin, lattice, plotrix, scatterplot3d, vcd,

lot, geneplotter, Rgraphics

分析向导 SAS/LAB® 无 无

R与SAS, SPSS详细比较

Page 14: Oracle R Enterprise介绍

14

主题 SAS产品线 SPSS产品线 R语言相关包

分析向导 SAS/LAB® 无 无

矩阵数学 SAS/IML®, SAS/IML SPSS Matrix™ R, matlab, Matrix, sparseM

缺省值分析 SAS/STAT®: MI SPSS Missing Values Analysis™ aregImpute (Hmisc), EMV,

fit.mult.impute (Design), mice,mitools, mvnmle

统筹研究 SAS/OR® 无 glpk, linprog, LowRankQP, TSP

统计效力检验

SAS® Power and

Sample Size

Application,

SAS/STAT: Power,

GLM Power

SamplePower™ asypow, powerpkg, pwr,

MBESS

品质控制 SAS/QC® SPSS Base™ qcc, spc

回归模型 SAS/BASE® SPSS Regression

Models™ R, Hmisc, Design, lasso, VGAM, pda

抽样及调查 SAS/STAT®:

surveymeans,等 SPSS Complex Samples™

pps, sampfling, sampling,

spsurvey, survey

结构方程模型 SAS/STAT®: Calis Amos™ sem

文本分析 Text Miner SPSS Text Analysis for Surveys™,

Text Miner for Clementine® Rstem, lsa, tm

时间序列 SAS/ETS® SPSS Trends™ Expert Modeler 大量的包可完成

时间序列分析预测 SAS Forecast Studio® SPSS Trends, DecisionTime/WhatIf™ 无

决策树 Enterprise Miner™ SPSS Classification

Trees™, AnswerTree™

ada, adabag, BayesTree, boost, GAMboost,

gbev, gbm, maptree, mboost, mvpart, party,

pinktoe, quantregForest, rpart, part.permutation,

randomForest, randomForests, tree

R与SAS, SPSS详细比较 – 续

Page 15: Oracle R Enterprise介绍

15

Oracle R Enterprise – 关键信息

• 绝大部分或者完全集成到现有市场上的企业级高级分析软件套

件中

• 从现有的平台实现了实质性的飞跃

– 数据量 – 利用SQL和现有的数据库功能

– 数据的异构行– Oracle DB + BDA

– 分析的广度– Oracle DB + R packages

– 用户的种类– R+SQL+BI report developers, DBAs

• 通过与Oracle Exalytics集成,能够使得共享企业级的高级分析

模型

©2012 Oracle – All Rights Reserved

Page 16: Oracle R Enterprise介绍

16

Oracle R Enterprise

Function push-down – data transformation & statistics

R workspace console

Oracle statistics engine

OBIEE, Web Services

No changes to the user

experience

Scale to large data sets

Embed in operational

systems

©2012 Oracle – All Rights Reserved

Page 17: Oracle R Enterprise介绍

17

Oracle R Enterprise

Transparently leverage Hadoop for High Performance Analytics to Oracle Big Data Appliance

Function push-down – data transformation & statistics

R workspace console

Oracle statistics engine

OBIEE, Web Services

©2012 Oracle – All Rights Reserved

Page 18: Oracle R Enterprise介绍

18

Enabling ORE Results in OBIEE Approaches

OBIEE

Oracle Database

Dashboards

ORE

R Script

Table

Independent R script execution

©2012 Oracle – All Rights Reserved

OBIEE

Oracle Database

Dashboards

ORE

R Script

Graphics / Table Result Generation

BIP

MS Word BIP Template Builder

R script execution from dashboard / document

R Script

Repository

.rtf Template

RPD

Table Result

Generation

Page 19: Oracle R Enterprise介绍

19

OBIEE中使用ORE示例

©2012 Oracle – All Rights Reserved

Page 20: Oracle R Enterprise介绍

20

Oracle R Enterprise的资源

• R是一个免费的自由软件,它有UNIX、LINUX、MacOS和WINDOWS版本,都是可以免费下载和使用的。

– R 官网地址:http://www.r-project.org/

– R 中国官网:http://www.rproject.cn/

• Oracle R Enterprise资源:

– 安装介质下载(Windows 32-bit, 64-bit,Linux 64-bit ):

http://www.oracle.com/technetwork/cn/database/options/advanced-analytics/r-enterprise/r-enterprise-doc-1510100-zhs.html

– 参考资料下载:http://www.oracle.com/technetwork/database/options/advanced-analytics/r-enterprise/index.html

Page 21: Oracle R Enterprise介绍

21

ORE Demo演示

Getting Started