rによるノンパラメトリック検定と効果量の出し方

30
R によるノンパラ検定と効果量の出し方 五島 @hikaru1122 2016 3 5

Upload: hikaru-goto

Post on 14-Apr-2017

1.862 views

Category:

Data & Analytics


2 download

TRANSCRIPT

Page 1: Rによるノンパラメトリック検定と効果量の出し方

Rによるノンパラ検定と効果量の出し方

五島 光 @hikaru1122

2016年 3月 5日

Page 2: Rによるノンパラメトリック検定と効果量の出し方

自己紹介

I オモテの顔:歯科医院専門経営コンサルタント

I いつもコンサルタントになりたい方を募集中です。

I ウラの顔:JAIST 知識科学研究科 博士後期課程(東京社会人コース)

I サービス・マーケティング、消費者行動

I 価値の共創(Co-creation of Value)I サービスによる社会的厚生の研究(Transformative Service

Research)

I R歴は 1年半。統計分析歴も 1年半。I 最近 Mac 買いました。でも、使うのは 1週間に 1度だけです。

Page 3: Rによるノンパラメトリック検定と効果量の出し方

研究がニッチ、マイナー。

Page 4: Rによるノンパラメトリック検定と効果量の出し方

ブログやってます。最近、サボり気味。

Page 5: Rによるノンパラメトリック検定と効果量の出し方

メインテーマ

I 有意差が出たと単純に喜ばず、効果量も見てみよう!

Page 6: Rによるノンパラメトリック検定と効果量の出し方

発表の流れ

1. 顧客満足度のデータ2. ノンパラメトリック検定のおさらい3. ノンパラメトリック検定の効果量を 2つ

Page 7: Rによるノンパラメトリック検定と効果量の出し方

本日のネタ本

Page 8: Rによるノンパラメトリック検定と効果量の出し方

顧客満足度データ

I 順序カテゴリカル変数(とても悪い1~とてもよい7)

I 500人I kyousou は exametrica を使って出した「共創レベル」

head(d, 5)

## gender riyuu qol wom kyousou## 1 0 0 5 5 4## 2 0 0 6 6 2## 3 0 0 4 4 1## 4 0 0 5 5 2## 5 0 0 4 6 4

Page 9: Rによるノンパラメトリック検定と効果量の出し方

ノンパラメトリック検定のおさらい

I 2つの名義尺度×順序尺度I ウィルコクソンの順位和検定(マン・ホイットニーの U検定)I wilcox.test()

I 3つ以上の名義尺度×順序尺度I クラスカル・ウォリス検定

I kruskal.test()

I 順序尺度×順序尺度I 線形連関の検定

I lbl_test() {coin}I 藤井良宜『カテゴリカルデータ解析』(2010)

Page 10: Rによるノンパラメトリック検定と効果量の出し方

性別と共創レベルは関連があるか?

I クロス表はこちら。

xtabs(~ gender + kyousou, data = d)

## kyousou## gender 1 2 3 4 5 6 7## 0 35 28 28 39 32 25 21## 1 35 37 48 44 42 39 47

I 5%水準で検定。有意差は見られなかった。

wilcox.test(kyousou ~ gender, data = d)

#### Wilcoxon rank sum test with continuity correction#### data: kyousou by gender## W = 27532, p-value = 0.07198## alternative hypothesis: true location shift is not equal to 0

Page 11: Rによるノンパラメトリック検定と効果量の出し方

来院理由(治療 or 定期検診)と共創レベルは関連があるか?

I クロス表はこちら。

xtabs(~ riyuu + kyousou, data = d)

## kyousou## riyuu 1 2 3 4 5 6 7## 0 44 41 40 46 36 29 39## 1 22 22 32 33 37 34 28

I 5%水準で検定。有意差が認められた。

wilcox.test(kyousou ~ riyuu, data = d)

#### Wilcoxon rank sum test with continuity correction#### data: kyousou by riyuu## W = 25375, p-value = 0.03193## alternative hypothesis: true location shift is not equal to 0

Page 12: Rによるノンパラメトリック検定と効果量の出し方

共創レベルとQOL向上は関連があるか?I クロス表はこちら。

xtabs(~ kyousou + qol, data = d)

## qol## kyousou 1 2 3 4 5 6 7## 1 0 4 9 47 9 1 0## 2 1 4 8 28 14 10 0## 3 4 0 7 41 17 6 1## 4 2 1 3 15 41 18 3## 5 0 2 2 20 26 20 4## 6 0 1 0 8 13 31 11## 7 3 0 1 8 5 12 39

I 5%水準で検定。有意差が認められた。

library(coin)lbl_test(ordered(qol) ~ ordered(kyousou), data = d)

#### Asymptotic Linear-by-Linear Association Test#### data: ordered(qol) (ordered) by## ordered(kyousou) (1 < 2 < 3 < 4 < 5 < 6 < 7)## Z = 11.713, p-value < 2.2e-16## alternative hypothesis: two.sided

Page 13: Rによるノンパラメトリック検定と効果量の出し方

共創レベルとクチコミ意図は関連があるか?

I クロス表はこちら。

xtabs(~ kyousou + wom, data = d)

## wom## kyousou 1 2 3 4 5 6 7## 1 1 2 10 43 12 0 2## 2 2 4 5 22 20 11 1## 3 2 1 8 27 22 10 6## 4 0 3 1 15 40 19 5## 5 0 2 1 18 16 28 9## 6 0 1 1 7 7 30 18## 7 4 0 1 7 1 9 46

I 5%水準で検定。有意差が認められた。

lbl_test(ordered(wom) ~ ordered(kyousou), data = d)

#### Asymptotic Linear-by-Linear Association Test#### data: ordered(wom) (ordered) by## ordered(kyousou) (1 < 2 < 3 < 4 < 5 < 6 < 7)## Z = 11.098, p-value < 2.2e-16## alternative hypothesis: two.sided

Page 14: Rによるノンパラメトリック検定と効果量の出し方

分析結果

I 来院理由と共創レベル、共創レベルとQOL&クチコミ意図の分析は有意差があった。

I よかった! …の?I 有意差があっても、大したことないかもしれない…。

Page 15: Rによるノンパラメトリック検定と効果量の出し方

効果量

I 「効果量は…帰無仮説が正しくない程度を量的に表す指標」

I 「独立変数と従属変数の区別のない場合には、効果量は変数

間の関係の大きさを表す」

I 大久保・岡田『伝えるための心理統計』44ページI ウィルコクソンの順位和検定には、Cliff の dI 線形連関の検定には、順序相関係数

I 0.2 は小さく、0.5 は中くらいで、0.8 は大きいI 0.1 は小さく、0.3 で中、0.5 で大きいという文献もあり。

Page 16: Rによるノンパラメトリック検定と効果量の出し方

効果量

I 「効果量は…帰無仮説が正しくない程度を量的に表す指標」I 「独立変数と従属変数の区別のない場合には、効果量は変数

間の関係の大きさを表す」

I 大久保・岡田『伝えるための心理統計』44ページI ウィルコクソンの順位和検定には、Cliff の dI 線形連関の検定には、順序相関係数

I 0.2 は小さく、0.5 は中くらいで、0.8 は大きいI 0.1 は小さく、0.3 で中、0.5 で大きいという文献もあり。

Page 17: Rによるノンパラメトリック検定と効果量の出し方

効果量

I 「効果量は…帰無仮説が正しくない程度を量的に表す指標」I 「独立変数と従属変数の区別のない場合には、効果量は変数

間の関係の大きさを表す」

I 大久保・岡田『伝えるための心理統計』44ページ

I ウィルコクソンの順位和検定には、Cliff の dI 線形連関の検定には、順序相関係数

I 0.2 は小さく、0.5 は中くらいで、0.8 は大きいI 0.1 は小さく、0.3 で中、0.5 で大きいという文献もあり。

Page 18: Rによるノンパラメトリック検定と効果量の出し方

効果量

I 「効果量は…帰無仮説が正しくない程度を量的に表す指標」I 「独立変数と従属変数の区別のない場合には、効果量は変数

間の関係の大きさを表す」

I 大久保・岡田『伝えるための心理統計』44ページI ウィルコクソンの順位和検定には、Cliff の d

I 線形連関の検定には、順序相関係数

I 0.2 は小さく、0.5 は中くらいで、0.8 は大きいI 0.1 は小さく、0.3 で中、0.5 で大きいという文献もあり。

Page 19: Rによるノンパラメトリック検定と効果量の出し方

効果量

I 「効果量は…帰無仮説が正しくない程度を量的に表す指標」I 「独立変数と従属変数の区別のない場合には、効果量は変数

間の関係の大きさを表す」

I 大久保・岡田『伝えるための心理統計』44ページI ウィルコクソンの順位和検定には、Cliff の dI 線形連関の検定には、順序相関係数

I 0.2 は小さく、0.5 は中くらいで、0.8 は大きいI 0.1 は小さく、0.3 で中、0.5 で大きいという文献もあり。

Page 20: Rによるノンパラメトリック検定と効果量の出し方

効果量

I 「効果量は…帰無仮説が正しくない程度を量的に表す指標」I 「独立変数と従属変数の区別のない場合には、効果量は変数

間の関係の大きさを表す」

I 大久保・岡田『伝えるための心理統計』44ページI ウィルコクソンの順位和検定には、Cliff の dI 線形連関の検定には、順序相関係数

I 0.2 は小さく、0.5 は中くらいで、0.8 は大きい

I 0.1 は小さく、0.3 で中、0.5 で大きいという文献もあり。

Page 21: Rによるノンパラメトリック検定と効果量の出し方

効果量

I 「効果量は…帰無仮説が正しくない程度を量的に表す指標」I 「独立変数と従属変数の区別のない場合には、効果量は変数

間の関係の大きさを表す」

I 大久保・岡田『伝えるための心理統計』44ページI ウィルコクソンの順位和検定には、Cliff の dI 線形連関の検定には、順序相関係数

I 0.2 は小さく、0.5 は中くらいで、0.8 は大きいI 0.1 は小さく、0.3 で中、0.5 で大きいという文献もあり。

Page 22: Rによるノンパラメトリック検定と効果量の出し方

来院理由と共創レベルの分析の効果量

I Cliff の dI orddom {orddom} を使う。

library(orddom)riyuu0 <- subset(d, riyuu == 0, select = kyousou)riyuu1 <- subset(d, riyuu == 1, select = kyousou)orddom(riyuu0$kyousou, riyuu1$kyousou)

Page 23: Rによるノンパラメトリック検定と効果量の出し方

たくさん出力があるけど、落ち着いて。

I delta を見る。

## ordinal metric## var1_X "group 1 (x)" "group 1 (x)"## var2_Y "group 2 (y)" "group 2 (y)"## type_title "indep" "indep"## n in X "275" "275"## n in Y "208" "208"## N #Y>X "27786" "27786"## N #Y=X "8078" "8078"## N #Y<X "21336" "21336"## PS X>Y "0.373006993006993" "0.444629004025406"## PS Y>X "0.485769230769231" "0.555370995974594"## A X>Y "0.443618881118881" "0.443618881118881"## A Y>X "0.556381118881119" "0.556381118881119"## delta "0.112762237762238" "0.382325174825174"## 1-alpha "95" "95"## CI low "0.0101591026267808" "0.0302267862546508"## CI high "0.21301567944591" "0.734423563395697"## s delta "0.051887409035548" "1.94981537125244"## var delta "0.00269230321642227" "3.80177998197229"## se delta NA "0.179171545884847"## z/t score "2.17321003029819" "2.1338498417092"## H1 tails p/CI "2" "2"## p "0.0302517795413157" "0.0319070819713241"## Cohen's d "0.149911005786357" "0.19608275760981"## d CI low "0.0127976401030426" "0.0155546716988696"## d CI high "0.299920441033551" "0.376610843520751"## var d.i "0.360937987738679" "4.00100862641009"## var dj. "0.287732469726146" "3.53806670382757"## var dij "0.846075693044171" "7.50764752446281"## df "481" "458.908414516163"## NNT "8.86821705426355" "6.90200243050863"

Page 24: Rによるノンパラメトリック検定と効果量の出し方

共創レベルとQOL向上およびクチコミ意図の効果量

I 順序相関係数

I 効果量は中だった。

cor(d$wom, d$kyousou, method = "spearman")

## [1] 0.5403846

cor(d$qol, d$kyousou, method = "spearman")

## [1] 0.563659

Page 25: Rによるノンパラメトリック検定と効果量の出し方

まとめ

I 来院理由と共創レベルには有意な関連があるが、効果量はほ

とんどない。

I クチコミ意図およびQOL向上と共創レベルには有意な関連があって、効果量も大きい。

I だいたいの効果量はパッケージで楽に計算できる。

Page 26: Rによるノンパラメトリック検定と効果量の出し方

まとめ

I 来院理由と共創レベルには有意な関連があるが、効果量はほ

とんどない。

I クチコミ意図およびQOL向上と共創レベルには有意な関連があって、効果量も大きい。

I だいたいの効果量はパッケージで楽に計算できる。

Page 27: Rによるノンパラメトリック検定と効果量の出し方

まとめ

I 来院理由と共創レベルには有意な関連があるが、効果量はほ

とんどない。

I クチコミ意図およびQOL向上と共創レベルには有意な関連があって、効果量も大きい。

I だいたいの効果量はパッケージで楽に計算できる。

Page 28: Rによるノンパラメトリック検定と効果量の出し方

Take-home message

I 有意差が出すだけでなく、その有意差にどれくらいのインパ

クトがあるのかも重要。

I スライドやデータはいつものとおりブログにアップします。

I @hikaru1122

Page 29: Rによるノンパラメトリック検定と効果量の出し方

Take-home message

I 有意差が出すだけでなく、その有意差にどれくらいのインパ

クトがあるのかも重要。

I スライドやデータはいつものとおりブログにアップします。

I @hikaru1122

Page 30: Rによるノンパラメトリック検定と効果量の出し方

Take-home message

I 有意差が出すだけでなく、その有意差にどれくらいのインパ

クトがあるのかも重要。

I スライドやデータはいつものとおりブログにアップします。

I @hikaru1122