統計解析ソフト案内 - · pdf file2 ここで取り上げた統計解析ソフト...
TRANSCRIPT
2
ここで取り上げた統計解析ソフト1)SAS2)SPSS3)JMP4)Rとその周辺ソフト
5)Stata6)Excelアドインソフト
7)Excel内蔵「分析ツール」
8)Excelの統計関連関数
9)StatView(生産中止)
10)WinSTAT, JSTAT
3
1)
大規模データ解析パッケージ
プログラムを組む
買取でなく,契約方式(年間)
現在Windows版の最新版はSAS9.2基本ツールである「Base SAS」の他,
統計解析ツールである「SAS/STAT」が必要
6
2)
大規模データ解析パッケージ
プログラムを組まなくてよい(メニュー選択方式)
買取方式(価格は後述)
現在,Windows版の最新版は
IBM SPSS Statistics ver21 http://www-
06.ibm.com/software/jp/analytics/spss/
2012年8月
7
SPSS ― 名称の変遷
SPSSは社会調査の統計解析ツールとして1968年にスタンフォード大学で生まれた
元々は
Statistical Package for Social Science現在は
Statistical Products and Service Solution 2009年7月IBMが買収し,
IBM SPSS Statistics となった
最新版IBM SPSS Statistics ver21情報
最新OSへの対応(Win8,MacOS10.8) 2つのデータセットの比較(入力ミスのチェック等)データビューから変数名を右クリックで記述統計が実行可能
出力後に表示言語変更
【以前から】看護系で「テキストデータの解析」可
専用ツール:「Text Analytics for Surveys」9
10
SPSS価格 (2012年6月)
製品名 手法新規の価格円(税込)
Statistics Base
基本(必須)システム.因子分析やCronbachのα係数も含
む〔下記〕
【一般】215,250【教育】113,400
Advanced Statistics
生命表分析,Kaplan-Meier法,Cox回帰分析など
【一般】119,700【教育】 63,000
Regression 多重ロジスティック回帰を含む
同上
11
CD-ROM 統計ソフトSPSSStudent Version 13.0J( 石 村 貞 夫
著)
使用期限は 1 年 ,
症 例 数1500,変数50個ま
でと制限
Baseと同じhttp://www.spss.co.jp/books/details/a34.html
12,600解説書付き東京図書株式会社発行
Dr.SPSSⅡfor Windows
医科向け簡易パッケージVersion 11.0J にもとづく
Baseの一部+生命表分析,Cox回帰分析,多項ロジスティック回帰等を含む.因子分析や Cronbach のαは無し.
102,900南江堂でも扱が,在庫がなくなり次第販売終了
SPSS Student Version Base 13.0Jで,解説本付き
学生でなくとも購入可 ¥12,600 次の制限あり
①インストールを行った時点から1年しか使えない
②扱えるデータの制限は1500ケース,50変数まで
③SPSSのオプションを追加することはできない,等
使用期間終了後に再購入しても,同一PCへのインストールはできないので要注意
英語版(2010年)は18.0で4年間使える 9,386円12
SPSS Statistics GradPack 利用期間は購入から1年間
ソフトウェア名 価格IBM SPSS STATISTICS BASE GRAD PACK 9,750円IBM SPSS STATISTICS STANDARD GRAD PACK 12,800円IBM SPSS STATISTICS PREMIUM GRAD PACK 14,300円IBM SPSS AMOS GRAD PACK 5,850円IBM SPSS MODELER GRAD PACK 14,300円
Statistics構成モジュール Base Standard Premium
Statistics Base基礎統計処理と、統計解析のための基本機能を網羅する
✓ ✓ ✓
Advanced Statistics一般線型モデルや順序回帰、生命表分析、Cox回帰などを実現する ✓ ✓
Regression多項ロジスティック回帰、二項ロジスティック回帰、プロビット回帰など高度な回帰分析を行う
✓ ✓
その他 ✓
SPSS Statistics GradPack詳細は下記
http://www-06.ibm.com/software/jp/analytics/spss/products/statistics/gradpack/
SPSS(Base)詳細解説本
15
小野寺 孝義・山本 嘉一郎編
「SPSS事典:BASE編」
ナカニシヤ出版(2004年10月)
網羅的詳細な解説
ただし,完全に読み込むためには統計学の上級の知識が必要
16
3)
ジャンプと読む
JMPはJohn's Macintosh Productの頭文字
SASが扱っている中規模の統計解析パッケージ
プログラムを組まなくてよい(メニュー選択方式)
個人の買取方式/団体の年間ライセンス方式
JMP 10:一般ユーザー 22万500円アカデミックユーザー 8万1900円
トライアル版あり(フルバージョンを30日間無料)
19
4)
中規模の統計解析パッケージ
プログラムを組む
ただし,「Rコマンダー」をインストールすればメニュー処理可能
フリーウエアでインターネットからダウンロードできる
…2013年3月時点での最新版は R-2.15.3 日本語対応あり
同じS言語を使った「S-Plus」は市販
21
Rのインストール方法(R-2.2.1,2.3.0 Windows版)
下記のWebサイトが参考になります
ここでは、国際化+中間さんの日本語版を新規インストールする方法を説明しています
http://www.okada.jp.org/RWiki/index.php?R-2.2.1%28Windows%29%A4%CE%A5%A4%A5%F3%A5%B9%A5%C8%A1%BC%A5%EB%CA%FD%CB%A1
より新しい版をダウンロードする場合,下記参照
http://www.okada.jp.org/RWiki/?R%20%A4%CE%A5%A4%A5%F3%A5%B9%A5%C8%A1%BC%A5%EB
EZR on Rコマンダー
Rコマンダーを用いたフリー統計ソフト
http://www.jichi.ac.jp/saitama-sct/SaitamaHP.files/statmed.html#_pageHead
自治医大さいたま医療センター血液科作成
メニュー式Rを一度にインストールできる
参考:神田善伸「EZRでやさしく学ぶ統計学」中外医学社 (2012年)…CD付
24
EZRのデータファイル
SPSSやExcelのファイルも読み込める
1)フォルダ名,ファイル名とも英数字
(パスがすべて英数字)
2)変数名で no. などは不可
3)Excelは2010でも読み込み可で,シート名・変数名とも漢字可
4)SPSSファイルの変数名は英数字とする
26
SPSSのメニューなどに無い解析例
【答】http://aoki2.si.gunma-u.ac.jp/R/diff_r.htmlより
Rで次のように2行を入力する
> source("http://aoki2.si.gunma-u.ac.jp/R/src/diff_r.R", encoding="euc-jp")
> diff.r(50,0.5,0.32,0.65)
Web情報ではRのスクリプトで示される例が多い
27
【問】同じ標本からの2つの相関係数に差があるか検定するには?具体例として
r(x-y) =0.50,r(v-y) =0.32 に差があるか?ただし,n=50,もう1組のr(x-v)=0.65 である
Rに関する参考サイト(1)(1)The R Project for Statistical Computing … R の総本山 http://www.r-project.org/
(2)続・わしの頁…リンク先と紹介豊富
http://www.cwk.zaq.ne.jp/fkhud708/index.html(3)R-Tips…情報豊富
http://cse.naro.affrc.go.jp/takezawa/r-tips/r/00.html
(4)〔群大前公衆衛生准教授中澤先生による〕
統計処理ソフトウェアRについてのTipshttp://minato.sip21c.org/swtips/R.html 28
Rに関する参考サイト(2)(5)〔群大社会情報学部教授青木先生による〕 「Rによる統計解析」(オーム社)サポートページ
http://aoki2.si.gunma-u.ac.jp/R/(6)RjpWiki:R に関する情報交換を目的としたWiki http://www.okada.jp.org/RWiki/(7)The Comprehensive R Archive Networkhttp://cran.r-project.org/
5)Stata 1985年,StataCorp社により開発された
本邦では主に計量経済学,社会学,政治学などの分野で用いられている
(医療・保健分野ではなじみ薄か)
コマンド入力方式
adoファイルと呼ばれるユーザーが作成した拡張コマンドが多数公開されている
日本語の解説書はまだ少ない
最新版はRelease1231
33
6)Excel アドインソフト
Excelと組み合わせて使う
1)4Steps エクセル統計 4,200円2)StatMateⅣ 1.8万円(ネット)
3)エクセル統計2010 for Win 2.6-2.9万円(ネット)
4)Excel NAG統計解析アドイン
一般価格 12.6万円
35
「ヒストグラム簡単作成ソフト」
http://keijisaito.info/archive.htm より
齋藤経史(Keiji Saito)の「Web倉庫」
↓
「分析用ファイル ・ シミュレーション」
↓
「Excelでヒストグラム作成-貼るだけ」
をダウンロードできる
8)Excelの関数を用いる
(1) 標準正規分布,t分布の両側・上側確率
NORM.S.DIST(Z値,TRUE):右下図白の面積
T.DIST.2T(t値,自由度):下図灰色面積
T.DIST.RT(t値,自由度)(2)各分布の上側%点
NORMSINV(1-上側確率) …正規分布
TINV(上側確率*2,自由度) …t分布
CHIINV(上側確率,自由度) …χ2分布
FINV(上側確率,第1自由度,第自由度) …F分布46
(1)は検定統計量からP値を求
めるのに使える
10)小規模安価なソフト
麻酔科医の佐藤真人氏作
1)WinSTAT for Windows 1.24 〔フリー〕
http://www.vector.co.jp/soft/win31/business/se030908.html
2)JSTAT for Windows 13.0 〔1,680円〕
上記の改訂版
http://www.vector.co.jp/soft/win95/business/se030917.html
48
JSTATの統計手法(青はWinSTAT)
基本統計量の計算度数分布表等分散のF検定Bartlett検定対応のあるt検定(検出力の計算も)対応のないt検定(検出力の計算も)Wilcoxonの符号付順位和検定Mann-WhitneyのU検定一元配置(多重比較も)二元配置(多重比較も)カイ2乗検定
適合度検定Kruskal-Wallis検定(多重比較も)Friedman検定(多重比較も)
回帰直線回帰曲線重回帰分析Logistic回帰分析
主成分分析判別分析Fisherの直接確率計算法Spearmanの順位相関係数Kendallの順位相関係数Thompson棄却検定Grubbs-Smirnov棄却検定ヒストグラム,散布図などのグラフ作成
乱数表の作成
49
51
まとめソフト名 操作 価格(万)
SAS プログラム 契約
SPSS メニュー Base¥20
JMP メニュー ¥20
R プログラム,メニューも可 フリー
(S-PLUS) プログラム
Excelアドイン各種 メニュー ¥4千~13
Excel「分析ツール」 Excel操作 付録
(StatView) メニュー 〔生産中止〕 ¥約10