初めてのベンチマーキングrio.andrew.ac.jp/~yane/class/s34/rmanu.pdf · 2014-09-07 · 1...

27
1 初めてのベンチマーキング ~R の 1 日自主トレ・マニュアル~ 2014 7 月版 桃山学院大学 経済学部 矢根 真二 主旨 自分で収集・整理したデータの分析を通じ、単純化・モデル・推定・反証・帰無仮説・検定等に絡む「科学的・ 実証的な判断力」を養成することが最終目標です。私のように統計学や計量経済学を学んでいないと苦労します が、本学では授業も履修できますし後からでも独学できますから、最重要な要件は以下の数回のコピペを機敏に始 める行動力です。やったらすぐに分かるとは思いませんが、「自分の分からないところ」が分かってくるはずですから、 新学期から「何をどう学習すれば良いか」という自分なりの最適戦略を練るのに必要なのです。すなわち、「行動す る頭脳集団」たる本演習Ⅲ・Ⅳを始める以前の現時点での主目標は、「自分の分からない点を自分で明確にす る」という自主自律的な学習力と、そのレベルの診断と処置を自ら機敏に実行する行動力のチェックにあります。私 たちは知らないことばかりだから知らないことを学び合うのですから、同じチーム・メートとして効率的に切磋琢磨し合う には、せめて1日自主トレぐらい機敏にこなせる行動力が不可欠だからです。 活用法 ここでは「熱帯地方に暮らせば、あるいは教育が充実していれば、その国民は長生きできるのか?」という 研究トピック」を例にしていますが、自分が分析したいテーマの仮説やデータと対比させながら実行すると、 後が楽で実践的になります(バックワード・インダクション)。 そうすると、RStudio を起動して Appendix にある RStart.txt をコピペ・実行するだけなら5分もかかりません から、その中で特に自分の分析に利用したい点に集中でき、実際にすぐに活用できるからです。 私と同様の初心者なら、最初から R や統計学・計量経済学の用語をすべて調べていたら挫折します。最 初は完璧主義を捨て、英文を読むのと同様、自分の理解に不可欠な最小の用語のみのチェックに抑え、 分かっても分からなくても最後まで体験してみることを最優先しましょう。 もちろん経験者や余裕のある方は、怠惰な私が「Help」と叫んで投げ出してしまった作業を解決して頂けれ ば、みんな助かるでしょうから、是非便利な道具を見つけたり試作したり、いっそのことパッケージ化までして 頂ければ、後輩は大喜びでしょう。

Upload: others

Post on 03-Mar-2020

0 views

Category:

Documents


0 download

TRANSCRIPT

Page 1: 初めてのベンチマーキングrio.andrew.ac.jp/~yane/class/S34/Rmanu.pdf · 2014-09-07 · 1 初めてのベンチマーキング ~rの1日自主トレ・マニュアル~

1

初めてのベンチマーキング

~R の 1 日自主トレ・マニュアル~

2014 年 7 月版

桃山学院大学 経済学部 矢根 真二

主旨

自分で収集・整理したデータの分析を通じ、単純化・モデル・推定・反証・帰無仮説・検定等に絡む「科学的・

実証的な判断力」を養成することが 終目標です。私のように統計学や計量経済学を学んでいないと苦労します

が、本学では授業も履修できますし後からでも独学できますから、 重要な要件は以下の数回のコピペを機敏に始

める行動力です。やったらすぐに分かるとは思いませんが、「自分の分からないところ」が分かってくるはずですから、

新学期から「何をどう学習すれば良いか」という自分なりの 適戦略を練るのに必要なのです。すなわち、「行動す

る頭脳集団」たる本演習Ⅲ・Ⅳを始める以前の現時点での主目標は、「自分の分からない点を自分で明確にす

る」という自主自律的な学習力と、そのレベルの診断と処置を自ら機敏に実行する行動力のチェックにあります。私

たちは知らないことばかりだから知らないことを学び合うのですから、同じチーム・メートとして効率的に切磋琢磨し合う

には、せめて1日自主トレぐらい機敏にこなせる行動力が不可欠だからです。

活用法

ここでは「熱帯地方に暮らせば、あるいは教育が充実していれば、その国民は長生きできるのか?」という

「研究トピック」を例にしていますが、自分が分析したいテーマの仮説やデータと対比させながら実行すると、

後が楽で実践的になります(バックワード・インダクション)。

そうすると、RStudio を起動して Appendix にある RStart.txt をコピペ・実行するだけなら5分もかかりません

から、その中で特に自分の分析に利用したい点に集中でき、実際にすぐに活用できるからです。

私と同様の初心者なら、 初から R や統計学・計量経済学の用語をすべて調べていたら挫折します。

初は完璧主義を捨て、英文を読むのと同様、自分の理解に不可欠な 小の用語のみのチェックに抑え、

分かっても分からなくても 後まで体験してみることを 優先しましょう。

もちろん経験者や余裕のある方は、怠惰な私が「Help」と叫んで投げ出してしまった作業を解決して頂けれ

ば、みんな助かるでしょうから、是非便利な道具を見つけたり試作したり、いっそのことパッケージ化までして

頂ければ、後輩は大喜びでしょう。

Page 2: 初めてのベンチマーキングrio.andrew.ac.jp/~yane/class/S34/Rmanu.pdf · 2014-09-07 · 1 初めてのベンチマーキング ~rの1日自主トレ・マニュアル~

2

目次

1 目標の自覚: 回帰分析からベンチマーキングへ .............................................................................................. 1

2 R で遊んで効能を知る: 見せる技術と科学的判断 ........................................................................................... 1

2.1 セットアップ: 気に入ったらコピペで遊ぶ (EX.1-2) ...................................................................................... 2

2.2 検定: 科学的な手続きの実際 (EX. 3-4) ................................................................................................. 4

3 線型回帰分析: 基本的なスキルの実践 ........................................................................................................ 8

3.1 線形回帰モデルの単純化 (EX.5: PAIRS・TREE・STEP) ............................................................................. 9

3.2 終モデルの診断と主張できる結論 (EX.6) ............................................................................................ 12

4 効率性フロンティア分析(EFA): ベンチマーキングの基礎 .............................................................................. 15

4.1 パラメトリックな方法: 確率的フロンティア分析(EX.7 SFA) ...................................................................... 16

4.2 ノンパラメトリックな方法: データ包絡分析(EX.8: DEA) ........................................................................... 18

4.3 技術効率性の相違の説明 (EX.9: TWO-STEP 法) .................................................................................. 19

5 APPENDIX(付録) ................................................................................................................................. 21

5.1 引用文献について ................................................................................................................................. 21

5.2 使用コード例: リンク(RSTART.TXT) ...................................................................................................... 23

5.3 使用データ例: リンク(WHO.XLSX) ........................................................................................................ 24

6 使ってこそ道具: 4月に備える自主トレの課題選択 ........................................................................................ 24

Page 3: 初めてのベンチマーキングrio.andrew.ac.jp/~yane/class/S34/Rmanu.pdf · 2014-09-07 · 1 初めてのベンチマーキング ~rの1日自主トレ・マニュアル~

1

1 目標の自覚: 回帰分析からベンチマーキングへ

線型回帰分析は、現実のビジネスから大学の研究に至る幅広い分野で も多用されている分析道具の1つで、

しかもネット上のくだけた説明から統計学・計量経済学の緻密な教科書に至るまで、多様なレベルで幅広く解説さ

れている実証技術の基本中の基本です。そのうえ、一世代昔には高価な汎用電子計算機が必要だったのに、今

や計算自体は携帯アプリでも瞬時に可能な時代になりつつあります。もはや誰でもカップヌードルを作る時間さえあ

れば半世紀前のノーベル賞学者の仕事を追体験できるのですから、チャレンジするかどうかの 大のハードルは行

動力だけです。したがって、「行動する頭脳集団」を目指す本演習メンバーの共有知識として、 も高いコスト・パ

フォーマンスに優れた実証スキルと言えるでしょう。

もっとも、計算結果は簡単に出せても、その意味を理解するには統計学的な知識が必要ですし、高価な商用

ソフトではなくフリーソフトの R を使うためには、マウス操作だけではなく呪文のようなコードを打っ必要があります。こ

の面倒さは確かに忍耐力を要する費用ですが、だからこそ未だに食わず嫌いの学生が多いのですから、この新しい

有用技術の習得は高い希少価値を有する、つまりセールスポイントになるのです。

特に本演習では、回帰分析の理解のうえに、今後ますますビジネスの現場で多用されるだろう効率的フロンティ

ア分析(EFA: Efficiency Frontier Analysis)に基づくベンチマーク・スキルを重視します。ベンチマークとは相

対的な業績評価のことで、たとえば昔は打率のような単一指標でしか打者をランキングできなかったのに対し、今で

は打率やホームランといった複数のアウトプットを同時に考慮できるメリットがあるからです。社員やチェーン店、産業

内の会社や異なる国々のオリンピックのメダル数等々、様々な分野で実用化されており、私たち自身がランキング

対象になる日も近いでしょう1。

そうだとすれば、ベンチマーキングの意義と限界を理解しておくことは、ゲーム理論と同様に、卒業後の人生にと

っても重要です。もちろん、双方共に応用範囲が非常に広いので、卒業研究にも活用しやすく、学習と研究の相

乗効果も極めて高いのです。その第一歩が、以下のコピペと自主トレから始まるのです。

2 R で遊んで効能を知る: 見せる技術と科学的判断

R は、高価な商用ソフトに匹敵する高機能を備えているだけでなく、その柔軟さゆえ幅広い問題に対処できるの

で、多様な分野のプロにも利用されています。しかし、私たちのような GUI 環境でしか PC を使わないエンドユーザ

ーにとっては、柔軟性はただただ不快で面倒なだけですから、いかに早く慣れ親しむかが 初の関門です。

1 実際、2013 年度現在すでに桃山学院大学を含む私立大学の費用関数を推定した研究がありますから、その

データを利用すれば私立大学の効率性をランキングできます。もちろん、大学の教職員の給料や論文数・教育状

況等のデータが利用可能になれば、私も含めて否応なくランキングされる時代なのです。

Page 4: 初めてのベンチマーキングrio.andrew.ac.jp/~yane/class/S34/Rmanu.pdf · 2014-09-07 · 1 初めてのベンチマーキング ~rの1日自主トレ・マニュアル~

2

この壁を突破するには、実際に直ちに R をインストールし、好きなように触って遊んでみる実践あるのみでしょう。特

に、現実のデータから何が言えるかということをグラフィックス等を用いて分かりやすく「見せる技術」はプレゼン効果を

左右しますし、数字から読み取ったメッセージの「科学的・実証的な根拠」の提示は説得力あるプレゼンに不可欠

です。

どこから手をつけて良いか分からない人でも、5分もあれば、Appendix のコードを見れば分かるように R 初心者

の私が使えるコマンド(関数)の数はわずかですから、それをコピペしてすべて実行させることができるでしょう。後は少

しずつ興味あるコードの意味を理解し、今後の自分の分析に使えるようにするだけです。R のコマンドや関数の使い

方は、R 上でヘルプを使うかネット上の解説やパッケージ PDF のマニュアルを見るか、それでも分かりにくければ

Appendix のような参考文献を参照すれば良いでしょう。いずれにせよ、自動車の原理を理解できなくても運転はで

きるのですから、R を操作しながら原理を理解した方が効率的です。

ゆえに手間がかかるのは、むしろ原理の理解、たとえば平均値の検定のような科学的・統計学的な考え方に慣

れることです。同じく5分で終わる作業ですが、統計学的な考え方を理解していないと、それがどんな作業でなぜ重

要なのかさえ分からないからです。実際、私も作業の前提や使い方をよく理解していなかったために間違って分析し

たことがありますし、今でも実証分析の経験が少ないために 2.2 で述べるような疑問に常につきまとわれています。し

かし、自らこの種の判断に迫られる体験を繰り返してこそ、理論的判断と現実的判断の両者のバランスといった総

合的な事実判断力を養成できるのですから、まさに実践練習なくして判断力を高めることなどできないのです。

2.1 セットアップ: 気に入ったらコピペで遊ぶ (EX.1-2)

R とタイプし検索すれば、すぐにダウンロードサイト(http://www.r-project.org/)が表示されますし、インストールや

始め方・使い方の解説サイトも数多く見つかりますから、早速インストールしてみましょう。以下は、これを書きながら実

際に私が行っているインストール手順の実例です。

自分の OS(例: Windows)に対応する R(base を選択)のダウンロード・インストール

R を起動し(パッケージ →パッケージのインストール)、以下のようなパッケージをインストール

例: AER, Benchmarking, frontier, ggplot2, MASS, rgl, sfa, texreg, tree

R のコードのコピペ・修正・保存用のテキストエディタ(メモ帳でも OK)と、見栄えが良く今後も必需品となるだ

ろう RStudio は必ずインストールしておきましょう2

2 よく分からない場合は、サクラエディタのようなフリーソフトを使えば今は十分です。ただし RStudio は、まだ日本語

では石田(2012)のような解説ぐらいしか見つけられなかったものの、たぶん本学でもブラウザを通じて誰でもアクセス

できるようになるので、 初からの活用を推奨します。

Page 5: 初めてのベンチマーキングrio.andrew.ac.jp/~yane/class/S34/Rmanu.pdf · 2014-09-07 · 1 初めてのベンチマーキング ~rの1日自主トレ・マニュアル~

3

R を起動すると、一番下の行に「>」が現れますから、このコンソール画面に「10 + 20」とか打ち込めば反応(計

算)してくれます。R がタイプ内容を理解できなければエラーが出ますが、それで壊れるようなことはありませんからま

ったく気にする必要はなく、むしろ「R の理解力」を理解するうえで重要な遊びです。ですから、この時点では飽きたら

「ファイル →終了」で終われば OK ですし、終了時に「ワークスペース」を保存する必要もありません。

しかし、すぐに計算には飽きるでしょうから、面白そうな数行のグラフィックコードなどを試してみましょう。数行でも

打つのは面倒ですから、興味あるコードはエディタにコピーしてペーストすると(次からもコピペだけで済むので)便利

です。

図1 3 次元の散布図(Ex.1) 図2 カラーパレットの使用(Ex.2)

上図は、Appendix の Ex.1 と Ex.2 のコードのコピペで遊ぶ実例で、ネットや Chang(2013)には棒グラフやや折

れ線グラフ等の基本を描く数行のコードが満載ですから、必要に応じて試してみましょう。図1は三次元プロット、図

Page 6: 初めてのベンチマーキングrio.andrew.ac.jp/~yane/class/S34/Rmanu.pdf · 2014-09-07 · 1 初めてのベンチマーキング ~rの1日自主トレ・マニュアル~

4

2はカラーパレットのコピペで3、作業フォルダに「1-3Dplot.png」と「2-palette.png」が自動的に作られるはずです。こ

こから以降は、同じワーキング・ディレクトリに結果を保存しておくと便利です4。

2.2 検定: 科学的な手続きの実際 (EX. 3-4)

R のいろいろなコマンドを試し、使えそうなモジュールを幾つかエディタに保存したなら、いよいよ単純化・推論・反

証・帰無仮説・検定・有意水準といった Science に基づく事実判断力の養成開始です。もっとも現実には、人間

相手の社会科学では特に、単純化された仮定が複雑な現実に一致することなどありえませんから、個別の具体的

な問題処理への判断はむしろ経験を要する Art な領域に属するのはゲーム理論や経済学と同じです。

分析したい「研究トピック5」を決めデータを集める場合には、Excel で整理するのが便利です。Excel は、R に比べ

ると計算・グラフ・統計処理の機能で見劣りしますが、実際にデータ画面を見ながら直感的に操作できるからです。

そこで、「長寿の国の原因は?」というテーマから、「教育は寿命を延ばすか?」というトピックを設定したとして、自

分で Appendix にあるような Excel データ「who.xlsx6」を作ったと想定してみましょう。

Excel で who.xlsx を開いてみると、 初の A 列には ID としての country 番号(B 列に国名もあれば便利なの

ですが)、B 列には応答(被説明)変数の dale(平均余命)、C 列からは数値型の説明変数 hexp(1人当たりヘ

ルスケア支出)・hc3(教育到達度)・gdpc(1人当たり GDP)・gini(ジニ係数で計った不平等度)、さらに 1 と 0 でカ

テゴリーの違いを表すダミー変数 oecd(OECD 国ダミー)・tropics(熱帯国ダミー)が並べられています。自分で回

帰分析のデータを準備する場合にも、このクロスセクション分析の形式が基本になりますから、しっかり諸変数が列

ベクトルになっている点を頭に入れておくと作業を効率化できます。

さて、回帰分析は次節にゆずるとして、たとえばノンビリした「熱帯の国(tropics=1)の平均寿命(dale1)はそうでな

い国(tropics=0)の平均寿命(dale0)より長いか?」という(素朴だけれども単純化されている仮説ゆえに)立派なトピ

3 それぞれ Chang(2013)の p.291 および p.266 あたりに解説があり、一般には PDF 出力を推奨していますが、ここ

では WORD での利用を前提にして ping 形式にしています。

4 getwd()で作業ディレクトリを確認できます。変更は、「ファイル →ディレクトリの変更」で可能です。しかし

RStudio なら、より直感的に操作できますから、次節のように 初から RStudio を使って新しいプロジェクト(作業フ

ォルダ)を指定しましょう。

5 本演習における研究トピックの設定は、研究の手始めとしてではなく、研究成果を決定する中核作業として 重

要視しています。というのも、たとえば地域問題や所得格差に関心があるというのは漠然とした幅広いテーマへの関

心に過ぎず、その中から自分が特に興味を持ち分析できる「単純な仮説・命題」にまで削ぎ取られた(たとえば『年

収は「住むところ」で決まる』モレッティ、プレジデント社)トピックではないからです。トピックの設定は、自らの自主自

律的な問題発見能力・問題解決能力の証明として重要なのです。

6 Greene(2012,p.1151)の Table F6.3 から作成。213 頁の例 6.10 と同様に、元の WHO(世界保健機関)のデ

ータから 1997 年のみを取り出し、さらに簡単化のために使用しない変数を削除しています。

Page 7: 初めてのベンチマーキングrio.andrew.ac.jp/~yane/class/S34/Rmanu.pdf · 2014-09-07 · 1 初めてのベンチマーキング ~rの1日自主トレ・マニュアル~

5

ックが浮かんだとしましょう。この疑問は Excel でも、熱帯 97 国の平均余命は 51 歳、熱帯でない 94 国の平均余

命は 63 歳だと分かりますから、意外にも正しい疑問?の発し方は「熱帯の国民の平均寿命は短いか?」ということも

分かります。

しかし、「これらの平均値が等しい」という帰無仮説を本当に有意7に棄却できるのかといった検定や次節以降の

回帰分析・フロンティア分析を何度も実行するには、R の方が便利なので、このシートを「コンマ区切りの csv ファイ

ル」として作業ディレクトリに保存します。Excel2013 なら、「ファイル →エクスポート →ファイルの種類の変更

→csv」と選ぶだけです。

今後の作業ディレクトリの設定やデータの読み込みを含めて、R 自体より RStudio を使う方が便利です。という

のも RStudio の起動画面の左下はオートコンプリート機能付きの R のコンソールそのものであるうえ、その上には

エディタ、右上には作業フォルダやファイルの情報、右下には描画やヘルプの情報が表示されるからです。しかも、

初に「プロジェクト」としてディレクトリを選んでやると、(プロジェクトを変更しない限り)これらの情報を常に確認しな

がら作業できるからです。

たとえば、私の場合には作業ディレクトリを「ドキュメント¥¥R¥¥start¥¥wd」に設置しましたが、RStudio のプロジェクト

として「File →New Project」で「Existing Directory8」として上記を選ぶと、プロジェクト wd が始まることになります。

すると csv データの読み込みも、右上の「Import Dataset →From Text File」で Header を Yes にして import をク

リックするだけで OK、終了時に保存しておけば履歴を含めてすべて残りますから安心です。もちろん、csv ファイルを

¥wd にコピーして、R のコンソールから下のようにタイプしても同じですが、RStudio を使った方が簡単で(作業ディレ

クトリの指定等の)間違いも少ないでしょう。

>who <- read.csv("who.csv",header=T)

実際、RStudio を再起動しても、同じプロジェクトを読み込むだけで、Ex.3 のようにいきなり「who」を簡単に使える

よう attach で宣言し、各変数の平均値等の summary(3-sum.txt)を sink でテキストファイルにも書き

出すことができます。この変数の分布に関する要約表のチェックによって、データのおよその特徴

が分るだけでなく、最大値や最小値によってデータの入力ミスが分かったり 0のデータがある変数

にはそのままでは対数値が取れないことが分かったりします。

7 適用される有意水準は研究分野でも異なるでしょうが、少なくとも 5%の有意水準(p 値<0.05)を原則、10%水

準は何か強調したい場合の例外としておきましょう。

8 もちろん、ここで New Directory を作っても良いし、面倒でなければ(Git のアカウント等の作成が必要です)、

Version Control を選べば RStudio 本来の高度な機能を利用できます。

Page 8: 初めてのベンチマーキングrio.andrew.ac.jp/~yane/class/S34/Rmanu.pdf · 2014-09-07 · 1 初めてのベンチマーキング ~rの1日自主トレ・マニュアル~

6

Ex.3 では、gini の値が 1 未満なので 100 倍して%表示にした hgini をデータフレーム who に加え、R ではダミ

ー変数を「factor (因子)」として扱うので、見かけ上の違いは(summary を見ない限り)分かりませんが、oecd と

tropics の変数タイプを factor に変更しています。

この各変数の特性に加え変数間の関係も含めて「見える化」するには pairs コマンドが便利で、それにヒストグラ

ムと相関係数を加えた Ex.3 の後半のコードを実行すると9、RStudio の右下に図3が表示されますから、「Export

→Save as Image」で 3-corr.png として保存して使用しています。対角線上には各変数の分布がヒストグラムとして

見える化され、左下には各変数間の散布図、右上はその相関係数が示されています。Crawly(2008, 11 章)によ

れば、こうした(ダミー変数を除く)数値型変数間の見える化は、図4の回帰ツリーと共に、次節の回帰分析モデル

作成の重要な準備作業です。

図 3 数値型変数の相関・散布図 (Ex.3)

9 ヒストグラムと相関係数の追加は、Chang(2013, p.116)からのコピーです。

Page 9: 初めてのベンチマーキングrio.andrew.ac.jp/~yane/class/S34/Rmanu.pdf · 2014-09-07 · 1 初めてのベンチマーキング ~rの1日自主トレ・マニュアル~

7

さて、これで平均値が等しいという帰無仮説を検定する準備ができましたから、作業の道筋を考えましょう。基本

は、両者とも正規分布であり分散が等しければ t 検定で、分散が等しくなければウェルチの t 検定です10。

そこで Ex.4 では、正規分布(Shapiro-Wilk および Kolmogorov-Smirnov のテスト)と等分散(F 検定と

Bartlett およびノンパラメトリックな Ansari-Bradley のテスト)をチェックし、Welch を含む t 検定とノンパラメトリックなウイルコ

クソンの順位和検定(マン・ホイットニーの U 検定)を行っています。

「私の解釈11」では、そもそも(非熱帯諸国を除けば)正規分布とは言えないので、ノンパラメトリックな Ansari-

Bradley テストによる等分散を認め、t 検定によって平均値には有意な格差があるというもので、これは順位和検定

の結果と合致しています。

このように伝統的な統計学的推論は当該変数が正規に分布している等の仮定を前提とするのに、図3のヒスト

グラムからも明らかなように、社会科学のデータが実際に諸仮定を満たすことなどきわめて希なのが現実です。それ

ゆえ後述するように、実際には観測値をそのまま使うのではなく、その対数値等を使用することが少なくないのです。

図3L は、図3に対応する対数値のケースで、左にピークがあった hexp や gdpc といった経済変数の分布が幾分

矯正されている一方、dale のように右にピークがあった分布は更に歪められることが分かります。

このレベルの具体的な解決策になると、上記のように統計学的な知識や経験が不十分な私などは自分で判断

することや調べることも難しくなりますから、やはり大学時代に統計学や計量経済学を学習したり専門家に相談でき

る行動力を養ったりしておくことが非常に大切です。

事実、「練習問題 1: 豊かな OECD 加盟の 30 国の平均余命(daleo)は非加盟の 161 国の平均余命(dalen)

より高いか」という仮説を検定してみて下さい12。平均値は 70 歳と 54 歳で、格差がさらに有意になりますから当たり

前と思う一方、サンプル数と分散の相違が跳ね上がるうえ、(非 OECD 諸国を除けば)正規ではなく、かつノンパラ

メトリックにも等分散ではなくなってしまいます。こうなると、私なら 4-ex1.txt の 後のウイルコクソンのテストによる帰無

仮説の棄却をそのまま採用したくなりますが、それが専門家に相談してみて乱暴すぎると言われるならば、より柔軟

な方法を探して適用するか、逆に正規とも言える非熱帯諸国や OECD 諸国に注目して分析するかといった選択を

迫られるかもしれません。教科書にあるような計算は数行のコマンドによって数秒で終わりますが、その説明・解釈は

豊富な経験・知識を要し、 終的には自分なりの総合判断力を求められる Art なのです。

10 R のコマンドでは、後者は t.test、前者はそのオプションとして var.equal=T を指定するだけです。

11 私自身は正規分布とは言えないが等分散の平均値の t 検定の妥当性に確信を持てないので、Lander(2014,

pp.233-5)の手続きに従ったつもりです。特に Crawly(2008, p.87)によれば、順位和検定は保守的だから、その棄

却結果に注目すれば十分だと考えています。

12 【Help1】これら数行の2標本の平均値の検定の引数はいずれも2つのベクトルだけですから、一連の措置を1つ

の関数にして結果のみを分かりやすく表示するようにすれば、私のような初心者は大喜びすると思いませんか?

Page 10: 初めてのベンチマーキングrio.andrew.ac.jp/~yane/class/S34/Rmanu.pdf · 2014-09-07 · 1 初めてのベンチマーキング ~rの1日自主トレ・マニュアル~

8

図 3L 対数値に変換後の相関・散布図 (Ex.3L)

3 線型回帰分析: 基本的なスキルの実践

私たちの興味は、観測された応答(被説明)変数(ここでは平均余命 dale)の変動を、観測された他の幾つかの

説明変数(1人当たりヘルスケア支出 hexp や教育到達度 hc3 等)を用いてうまく予測することで、うまく予測すると

はその観測データが も出やすくなるような係数( 尤推定)値を見つけてやることです。その中でも、 も広範囲

に多用されている基本的な方法が、線形回帰モデルの OLS( 小自乗法)による推定です。すなわち、応答変数

を y、説明変数を x1, x2, x3の3変数だけだとすると、誤差項εの平方和を最小にするようにパラメー

ター(β0,β1,β2,β3)を決めるという推定法です。たとえば、この説明変数が3つの場合には、次

のようなモデルになります。

(1) y 0 1x1 2x

2 3x3

ϵ .

Page 11: 初めてのベンチマーキングrio.andrew.ac.jp/~yane/class/S34/Rmanu.pdf · 2014-09-07 · 1 初めてのベンチマーキング ~rの1日自主トレ・マニュアル~

9

ただし、必ずしも応答変数や説明変数に観測値をそのまま当てはめる必要はありません。たとえば説明変数 x1

は、ヘルスケア支出 hexp そのものでも良いし、その2乗 I(hexp^2)でも自然対数値 log(hexp)でも良いのです。た

とえば、コブダグラス型と呼ばれる次式は両辺の対数を取ると、上記の(1)式のような形に変換できるからです。

(2) y .

しかしネット上や統計学・計量経済学の教科書で解説されているように、こうした回帰モデルの推定には諸仮定

を満たす必要があり、特に観測値間の独立性・誤差項の正規性・分散の均一性といった仮定はモデルの有意性

の判断を左右する重要性を持つ一方、社会科学のデータでは満たすのが非常に難しい諸仮定です。ゆえに平均

値の検定と同様に、たとえ(1)式のモデルの説明力(決定係数 R2)が高い場合でさえ、そのモデルがどれほど OLS

に必要な前提を満たしているかを吟味する必要があるのです。

さらに経済学では、ミクロ経済学やマクロ経済学の精緻な理論展開によって、アウトプットたる応答変数とインプッ

トたる説明変数の関係、つまり関数型の性質があらかじめ制約されていることが多いので、「モデルにデータを当て

はめる13」ことになりがちです。たとえば、農工業製品の生産関数には上記のコブダグラス型やトランスログ型を使っ

たり、費用関数や需要関数の推定においても様々な制約条件が課されたりするため、実際の推定過程はより制約

され難しい作業になりがちなのです14。

しかし幸か不幸か、私たちは必ずしも生産関数や費用関数の理論的な知識には馴染みがない方でしょうし、実

際には平均余命の関数形のように未知の関係の方が多いでしょうから、本演習ではとりあえず「データにモデルを

当てはめる」アプローチを採用しましょう。この場合のモデルとは、Crawly(2008, p.5)の推奨する多変数の複雑なモ

デルから有意な変数のみを残した単純なモデルに絞るという意味での実証的な回帰モデルのことです。このアプロ

ーチは時には「理論なき計測」と批判されるかもしれませんが、確固たる経済理論が存在する領域ならば後で考慮

すれば済むことですから、まずは自主自律に興味ある推定を始めることが大切です。

3.1 線形回帰モデルの単純化 (EX.5: PAIRS・TREE・STEP)

Crawly(2008, 11 章)によれば、(1)式のような回帰モデルの具体的な変数を決める準備作業として便利なのは、

Ex.3 で使った pairs と tree コマンドで、それぞれ図3と図4のようになります。図4の回帰ツリーが物語るのは、 も

長い縦線を有する教育到達度 hc3 こそ平均余命(dale)に対して も影響力の大きい説明変数で、教育到達度

が高い場合には1人当たりヘルスケア支出(hexp)が、低い場合には1人当たり GDP(GDPC)が大きな影響力を発

揮するということです。

13 この理論モデルの実証テストという手続きは、モデルの予測力の検証には必要な反面、データを神聖視する

Crawly(2008, p.5)のような「データにモデルを当てはめる」という立場と対立します。

14 ただし現実には、基本的な経済モデルの制約でさえ十分に考慮されているとは限らないようです。たとえば

Henningsen and Henning. (2009)を参照。

Page 12: 初めてのベンチマーキングrio.andrew.ac.jp/~yane/class/S34/Rmanu.pdf · 2014-09-07 · 1 初めてのベンチマーキング ~rの1日自主トレ・マニュアル~

10

図 4 回帰ツリー(決定木)(Ex.3)

この結果は、図3の応答変数 dale に対する相関係数の値と整合的です。すなわち、hc3 が 0.77 と も高く、次

いで hexp と GDPC がよく似た値で続いているからです。問題は、hexp と gdpc の 0.93 という説明変数間のあまりに

高すぎる相関で、その散布図が直線的に並んでいることからも、両者が「独立した関係にある」という仮定に反する

ことは明白でしょう。事実、WHO や Greene の研究で GDPC が説明変数から除外されてているのは、この多重共

線性問題を回避するためでしょう。

以上の考察から、試せる説明変数は、残る3つの数値型の説明変数と、2つのダミー変数のせいぜい 5 変数

であることが分かります。

Page 13: 初めてのベンチマーキングrio.andrew.ac.jp/~yane/class/S34/Rmanu.pdf · 2014-09-07 · 1 初めてのベンチマーキング ~rの1日自主トレ・マニュアル~

11

表1 OLS による推定結果(係数推定値の下段の()内は標準誤差)

二次関数型モデル(OLSQ2)

(Intercept) 34.815***

(3.643)

hexp 0.006***

(0.001)

hc3 7.950***

(0.885)

hgini -0.172*

(0.073)

I(hc3^2) -0.473***

(0.076)

tropics1 -2.542*

(1.225)

R2 0.707

Adj. R2 0.699

Num. obs. 191

***p < 0.001,

**p < 0.01,

*p < 0.05,

·p < 0.1

対数型モデル(OLSL1, OLSL2)

(Intercept) 3.792***

3.694***

(0.205) (0.204)

log(hexp) 0.088***

0.073***

(0.013) (0.011)

log(hc3) 0.177***

0.187***

(0.026) (0.026)

log(hgini) -0.138* -0.098

·

(0.055) (0.053)

oecd1 -0.087*

(0.037)

tropics1 -0.049* -0.044

·

(0.024) (0.025)

R2 0.709 0.701

Adj. R2 0.702 0.694

Num. obs. 191 191

***p < 0.001,

**p < 0.01,

*p < 0.05,

·p < 0.1

Page 14: 初めてのベンチマーキングrio.andrew.ac.jp/~yane/class/S34/Rmanu.pdf · 2014-09-07 · 1 初めてのベンチマーキング ~rの1日自主トレ・マニュアル~

12

Ex.5 では再び Crawly(2008, 11 章)に従い、 初に上記の3変数を中心に交互作用も含めた複雑な二次関

数型(quadratic)モデル(OLSQ)を作り、それを step 関数15で自動的に単純化したモデル(OSLQ1)から、すべての

変数が有意になるような も単純なモデル(OLSQ2)を作ってみたのが表1です。その右側は、対数値を使った場

合の複雑なトランスログ型モデル16(OLSL)のフィットが悪かったので、コブダグラス型モデル(OLSL1-2)を表示して

います。このとき R の summary の結果をコピペしてもかまいませんが、texreg の htmlreg を使って word に書き出し

て活用する方が便利だと思います17。

OLSQ2 と OLSL1 の両モデルとも、すべての変数の係数が少なくとも5%の水準で0から有意に異なっており、

平均余命 dale の変動の約7割を説明できています。教育と健康支出の増加だけでなく、不平等度の減少も平均

余命を上昇させることが分かります。教育の充実だけでなく不平等の改善も寿命を延ばすという主張に持って行け

れば、結構重要な事実判断に関わってくるのではないでしょうか。

しかし、熱帯諸国のダミーが負なのは想定通りである一方、対数型では OECD のダミーが負の符号で有意にな

ったのは私には予想外の結果でした。そこで OECD を外した OLSL2 を試したのですが、逆に tropics と log(hgini)

の有意水準が 10%にまで低下してしまうから困ったものです。

結局、私なら OLSQ2 と OLSL1 を残しますが、後者を選ぶ場合には OECD ダミーが負になる理由を添える必

要があるでしょう。その解釈の面倒さは別としても18、二次関数型の OLSQ2 と対数型の OLSL1 のいずれを選ぶか

という 終的な選択が残されています。

3.2 最終モデルの診断と主張できる結論 (EX.6)

モデル診断の基本は、 初に誤差項が他変数とは独立に正規分布していると仮定して推定しているのですか

ら、観測値に適合させた(fitted)結果としての残差がその仮定から乖離していてはまずいという考え方です。すでに説

明変数間の独立性は変数選択時に相関だけはチェックしましたから、Ex.6 では残差の正規性と分散の均一性を

AER パッケージ(が呼び出してくれるパッケージ lmtest)を使ってチェックしてみましょう。

15 【Help2】Lander (2014, Chapter18-19)によれば、もう AIC を基準にした Stepwise 法は古く、cv.glimnet を使っ

てよりモダンな lasso と ridge 回帰をブレンドする cross-validation(交差確認法)を推奨していますので、この Step

の利用を書き換えた方が良いと思いませんか?

16 【Help3】トランスログ型の関数をタイプするのは面倒なので、ここでは micEcon の translogEst を使いましたが、

これでは Step 関数が働かないようです。変数を入れれば、自動的に lm を使った二次とトランスログを推定してくれ

る関数を作れば便利だと思いませんか?

17 表1が texreg のほぼデフォルトの結果で、「*印は5%の有意水準」を示す点に注意して下さい。もちろん、

texreg の中でラベルや表示事項・桁数そして有意水準等を指定して自動化することもできます。

18 たぶん OECD 諸国は教育水準も健康支出もずば抜けて高いでしょうから、その大きさ程には平均余命は高まら

ないため、シフトパラメーターが負になるのではないでしょうか。

Page 15: 初めてのベンチマーキングrio.andrew.ac.jp/~yane/class/S34/Rmanu.pdf · 2014-09-07 · 1 初めてのベンチマーキング ~rの1日自主トレ・マニュアル~

13

図5 OLSQ2 と OLSL1 の正規 Q-Q プロット 6-3Q2.png 6-3L1.png

正規性のチェックには、すでに 2-2 の Ex.4 で使った Shapiro-Wilk および Kolmogorov-Smirnov のテストを使い

ましたが、前者では棄却、後者では棄却できないという結果になります。

Page 16: 初めてのベンチマーキングrio.andrew.ac.jp/~yane/class/S34/Rmanu.pdf · 2014-09-07 · 1 初めてのベンチマーキング ~rの1日自主トレ・マニュアル~

14

しかし、いずれのモデルの均一的な分散も、Goldfeld-Quandt のテストでも Breusch-Pagan のテストでも棄却され

てしまいます。こういう困った事態は社会科学では日常茶飯事で、 良(Best)な推定量とは言えないけと無視する

か、頑強な標準誤差を使うか19、加重した OLS で推定し直すかでしょうが、ここでは実際に頑強な標準誤差を使っ

た結果(6-hetest.txt)や次に説明する3つのグラフ(6-***.png)からも「 初の無視」を選んでも大きな問題はないと

思います20。

もっと直感的にヴィジュアルに正規性を診断するには、実際に残差の分布を描く、適合値に対して残差をプロット

する、正規分布の分位数に対して順位づけられた残差をプロットするといった方法があります。ここでは、 後の正

規 Q-Q プロットと呼ばれるグラフのみを図5に示しておきます。直線上に並ぶかどうかを見れば良いだけですから、

も判断しやすそうだからです。主な問題は左側、そこでは OLSQ2 の方が少しはマシに見えますが、その分だけ

右側でも OLSQ2 は反対に乖離しています。外れ値(outlier)を除外すれば結果は変わるかもしれませんが、モデル

の優劣は基本的な作業をチェックしたからといって必ずしも自動的に決定できるものではなく、 終的には分析者が

総合的に判断し決断するしかないのです。

たとえば OLSQ2 なら、平均余命の変動の7割を説明することができ、健康支出と教育と平等度はすべて正の有意

な効果、特に教育は二次の逓減的に増加する効果を有しており、熱帯ダミーは切片を引き下げる有意な効果を持

っていることになります。ゆえに、教育の充実も平等の促進も寿命を延ばす効果があり、熱帯諸国の人々の寿命は

その下方シフト分だけ短くなる傾向があると言えるでしょう。

コブダグラス型の場合も同様ですが、対数値の説明変数の係数は弾力性に相当しますから、説明変数の1%の

変化に対して応答変数が何%変化するかを示していて便利です。さらに、表1のようにその係数の和が1よりも小さ

ければ(大きければ)規模に関する収穫逓減(収穫逓増)が作用していると言われます。こうした理論的背景もあっ

て、ベンチマーキングではコブダグラスやトランスログといった対数型が多用されています。

このように両モデルとも明確な主張を引き出せたとはいえ、そもそも交互作用に有意な項があったモデルを単純

化しても不均一分散のままで、RESET もパスできないという事実が残る点を分析者自身は知っていますから、十分

に留意しておくべきでしょう。実証分析は正確な事実判断に関する強力な武器ですから、教育の充実や平等化の

推進が寿命を延ばすという主張に明確な根拠を与えます。しかし、新たな変数やモデルの改善によって、表1で有

意であった変数がそうではなくなる可能性は常にありますから、実証分析から導かれ科学的に見える主張であっても

19 【Help4】近年の商用パッケージではロバストな標準誤差の使用は当たり前ですから、R でも意識することなく自

動的に頑強な標準誤差や t 値で上書きし、summary や texreg(には上書き機能があります)に反映できるようにす

れば便利だと思いませんか?

20 頑強な標準誤差等については Kleiber and Zeileis (2008, 4 章)に解説されていますが、そこにある Ramsey の

RESET には両モデル共にひっかかってしまいます。さらに4のベンチマーキングでは、誤差項の分布が効率性の分

布と密接に関連してきますから、無視するコストはきわめて高くなります。クロスセクション分析における不均一分散を

伴うフロンティア分析に挑戦したい方には、Yane and Berg (2013)が少しは参考になると思います。

Page 17: 初めてのベンチマーキングrio.andrew.ac.jp/~yane/class/S34/Rmanu.pdf · 2014-09-07 · 1 初めてのベンチマーキング ~rの1日自主トレ・マニュアル~

15

すぐに鵜呑みにするようでは逆に施策を誤る危険性も高まるのです。この点は、特に個人の生活や組織の運命にも

関わる強力なツールであるベンチマーキングを実施する際には肝に銘じておくおくべきでしょう。

4 効率性フロンティア分析(EFA): ベンチマーキングの基礎

t 検定や OLS など耳慣れない用語の霧の中を、ここまで一気に一日で駆け抜けられれば、もう八合目、山頂も

間近です。皆さんもお疲れでしょうが、私も試験や矢根(2014)の原稿の〆切りが迫ってきましたので、できるだけ手

短に閉めくくりましょう。

振り返れば、R による t 検定や OLS の体験を通じて、「よく分からない」概念や手続きが「少しは分かってきた」は

ずです。すなわち、「何が分からないか」を自覚することが「個人の学習」の出発点で、それを互いに補い合い刺激

し合うのが4月からの「チームとしてのゼミの研究」なのです。自主自律の個人の機敏な行動力がなければ、チーム

を組むメリットもなければ切磋琢磨による研究成果の向上もありえないからです。

各自が取り組む実証研究は、ここまでの t 検定や OLS の理解を深める分析でもかまいませんが、必要な基礎

知識はほとんど変わらないので、以下のいずれかのベンチマーキングの手法を活用できる分析の方が一般的にはよ

り有益かつ面白いでしょう。ベンチマーキングとは、who の例で言えば各国が自国民の寿命を延ばすのに教育や健

康支出を使って競い合う中、 も効率的に資源を活用している国々をフロンティアにあるとみなし、そこからその他

の国々がどれほど乖離しているかを数値化・ランキング化して相対的な評価をするものだからです。論文検索アプリ

で調べれば分かるように、すでに野球選手の年俸と打率やホームラン数、銀行やチェーン店の費用と利益や顧客

数、電気通信や水道等の公益企業の生産要素と供給量といった幅広い分野で先行研究が行われていますか

ら、まずは興味をそそられるしっかりした先行研究を探すことが先決で、そのマネから始めれば良いでしょう。

効率性の尺度や分析手法の相違は矢根(2014)の解説を参照して頂くとして、ここでは効率性フロンティア分析

(EFA)の2大アプローチである SFA(確率的フロンティア分析)と DEA(データ包絡分析)の基本モデルのみに限

定して、その R による推定法を紹介しておきましょう。おおざっぱに言って、who のデータのように回帰分析で7割ぐ

らいの説明力があれば、そのままコマンドを打ち直すだけで SFA は完成です。SFA は、基本的には OLS と同じ計

量経済学的なパラメトリックな手法だからです。他方、関数関係がよく分からない場合やアウトプット(応答変数)が

複数ある場合には、DEA が便利です。数理計画法をベースにしたノンパラメトリックな手法だからです。いずれの方

法も十分に定評がある一方、実際には推定法やモデルそして効率性の尺度によってランキングに差が出ることも

知っておくべきでしょう。

いずれの手法で効率性を測ろうと、効率性が相違する原因を検討することは重要です。特に、効率性が自分で

はコントロールできない要因(たとえば自国が熱帯気候に属していることなど)に左右される場合、当該国の能力や

努力を評価する際に配慮すべきだからです。都心の繁華街と地方の過疎地にあるコンビニでは、たとえ同じ店長を

Page 18: 初めてのベンチマーキングrio.andrew.ac.jp/~yane/class/S34/Rmanu.pdf · 2014-09-07 · 1 初めてのベンチマーキング ~rの1日自主トレ・マニュアル~

16

配置しても、売上高と費用の関係が大きく変わるのは自明でしょう。本演習では、実証分析を科学的な事実判断

の基礎として活用する利点を会得するだけでなく、その分析の仮定や解釈に潜む限界や問題を認識する能力も重

視しています。

4.1 パラメトリックな方法: 確率的フロンティア分析(EX.7 SFA)

すでに表 1 の OLSQ2 や OLSL1 程度の結果を得ている場合には、そのまま SFA すればほぼ同様の結果を得

られる確率が高いと思います。というのも SFA の基本は、上記の(1)(2)式で「ε= v - u」と置き、v をε同様の通常

の誤差項、u を非負の(基本モデルではハーフノーマルな)非効率性タームとみなすモデルだからです。非効率性

が大きいほど、生産量(who では寿命)が低下するというわけです。基本的な生産 SFA モデルの(Farrell の産出

指向の)技術効率性は、この非効率性タームから推定される尺度です21。

Ex.7 の分析作業も Ex.5 の OLS とほぼ同様で、主な違いは frontier や Benchmarking あるいは sfa といった

SFA 専用パッケージを使うことぐらいです22。ただ唯一の難点は、ML( 尤)な 適解の計算を R が放棄してしまう

場合があることで、その場合にはアルゴリズムの変更など面倒な作業が必要になります。ここでは、Ex.7 のように上

記のパッケージ順にデフォルトで試すことで、この面倒な作業を 後の手段として避けることにしましょう。

実際に出力結果である 7-sfa.txt を見ると、frontier で推定された二次関数モデル FsfaQ および対数型モデル

FsfaL はそれぞれ対応する表1の OLS モデルと似通った係数を持ちながらも、LR(尤度比)テストの結果は OLS

と有意な差があること(つまり非効率性の存在)を示唆していますから、それを表1のように(各分散の推定値と共に)

提示し、各効率性の分布を要約(summary)することで(ここでは省略しますが)、分析を開始できます23。

2つの SFA モデルの効率性を比較すると、対数型モデル FsfaL の平均値が 0.86 なのに、二次関数モデル

FsfaQ は 0.08 と極端に低いことが分かります。これを「見える化」したのが図6で、平均値だけでなく分布自体の形

もまったく異なることが分かります。

21 同じ(技術)効率性といっても推定法が異なれば値も異なりますが、相関は一般的に非常に高いと言われてい

ます。Ex.7 の 後の4種の効率性の尺度を含めた詳細な解説は Bogetoft and Otto (2011, p.199, 217-221)を参

照。

22 Benchmarking では、インプット x とアウトプット y の両方ともマトリックス形式にする必要がある分だけ面倒です

が、それをそのまま DEA でも使えますから、DEA も試みる人には便利かもしれません。

23 Bogetoft and Otto (2011, p.337)のように、frontier はもう過ちを犯しかねない標準以下のプログラムだという指摘

もあります。後の2つはダミー変数がうまく入らなかったので使い方を誤っているのかもしれず【Help5】要検討です

が、対数型が動かなかった(関数 optim を使用する)sfa の二次関数型の LR テストの結果は非効率性の影響の

棄却です。DEA でも使う(パッケージ ucminf を使う)Benchmarking では一応の結果が出ているように見えます

が、「Covergence = 4」なので改善しないと使えません。しかし3パッケージの中では frontier が も使用されている

現状では、本演習でも frontier が動けば十分です。

Page 19: 初めてのベンチマーキングrio.andrew.ac.jp/~yane/class/S34/Rmanu.pdf · 2014-09-07 · 1 初めてのベンチマーキング ~rの1日自主トレ・マニュアル~

17

図 6 FsfaQ と FsfaL によって推定された効率性の分布 7-eFsfaQ.png 7-eFsfaL.png

Page 20: 初めてのベンチマーキングrio.andrew.ac.jp/~yane/class/S34/Rmanu.pdf · 2014-09-07 · 1 初めてのベンチマーキング ~rの1日自主トレ・マニュアル~

18

この二次関数モデルのあまりに低い効率性は私も予想外でした。これほど効率性が違っては、いずれのモデルを

選ぶかで結果も大きく変わりそうだからです。しかし、両者の相関係数は 0.62、特に順位相関係数は 0.87 もあり、

両者とも有意に関係していますから、相対的な業績評価の結果は非常に似たものになるはずです。

ゆえに留意しておくべきことは、モデルが異なれば効率性も変わりますから、異なるモデルの比較には絶対値では

なくランキングに注目すべきだということです。同時に3でも確認したように、ランキングは推定したモデルに依存します

から、モデルの妥当性の検討には慎重を期すべきだということです。

4.2 ノンパラメトリックな方法: データ包絡分析(EX.8: DEA)

上記のように関数型が不確かな場合や複数アウトプット24を扱う場合には、ノンパラメトリックな DEA が便利です。

多用されるフロンティアは、規模に関して収穫不変の CRS(CCR)と可変的な VRS(BCC)で、その効率性の商

は規模の効率性と呼ばれています。意思決定主体の裁量余地の大きさから、投入指向型や産出指向型等に分

類されます。こうした基礎概念は矢根(2014)でも参照して頂くとして、早速パッケージ Benchmarking を使って

(Ex.8)、CRS と VRS、それに も制約の少ない FDH のフロンティアと効率性を測定してみましょう25。

数値型のインプットとアウトプットの関係を分析する DEA は、すべての変数の対数値を使っても結果が変わら

ず、ML( 尤)推定のような収束問題も起きないので、非常に簡単に作業できます。しかも非効率な国(主体)に

は、節約可能な資源量(slack)や改善のために参照すべき国(peers)とそのウェイト(lambda)の情報まで分かるの

で、非常に実践的です。これらの情報と共に 8-dea.txt に要約されているように、投入指向型の3つのフロンティア

の効率性指標を比較すれば、「eicrs ≦ eivrs ≦ eifdh」という関係の成り立つことも分かります。

ここでも各モデルの効率性の数値の要約は省略し、前項の SFA モデルによる効率性も含めた相互の関係を

「見える化」したのが図7です。ただし、図3や図3L とは違って、順位相関係数を表示しています。右下の3モデル

によって推定された効率性の順位相関係数、特に eicrs と eivrs の順位相関係数の高さが目立ちます。

重要な点は、少なくとも SFA や DEA といった同じ手法の中での順位相関係数は高い一方、異なる手法で

推定された効率性間の順位相関はかなり低いという点です26。こういう場合には、いずれの推定手法を用いるかとい

う論拠と判断が非常に重要になります。

24 SFA でも距離関数や費用関数を用いれば、複数のアウトプットを扱うことは可能です。

25 FDH は order-m アプローチ等を使った近年の分析で多用され、DEA とは別分類されることもありますが、ここで

は DEA の中の 1 アプローチとみなしておきましょう。

26 ただし、ここでの SFA モデルにはダミー変数が含まれており、それらの推定値を投入指向型の DEA の結果と

比べていますから、相関係数が低くなるのも当然かもしれません。正確さを期すには、同じ変数のみを使い、産出型

の DEA の結果を比べるべきだからです。

Page 21: 初めてのベンチマーキングrio.andrew.ac.jp/~yane/class/S34/Rmanu.pdf · 2014-09-07 · 1 初めてのベンチマーキング ~rの1日自主トレ・マニュアル~

19

図 7 SFA および DEA による効率性の分布と順位相関 (8-eff.png)

4.3 技術効率性の相違の説明 (EX.9: TWO-STEP 法)

さて 後に全体の復習を兼ねて、以上のいずれかのモデルを使って効率順にランキングした場合に、なぜそんな

格差がつくのかという要因分析をしてみましょう。基本は2で実施した平均値の差の検定、応用は frontier パッケー

ジでの Z 変数の利用や FEAR パッケージの order-m の活用等様々ですが27、 も広く使われているのは Two-

Step 法です。これは私のような素人から見ても統計学的に問題があると思いますが、推定した効率性を「記述的な

指標」とみなして(誤魔化して?)OLS ないし Tobit28で回帰するだけです。

ですから作業自体は、たんなる OLS の復習のようなものです。ただ、この手法自体に問題があるとしても、どんな

変数に注目すれば良いかを見つける準備作業としては非常に簡単・便利ですから、まずは使ってみましょう。

ここでは、応答変数に投入指向型 CRS フロンティアの効率性 eicrs を選び、とにかくデータフレームにある変数

をほとんど入れた OLS00 モデルを作り、それを Step 関数で単純化し、有意な説明変数のみの OLSC を残してみ

27 たとえば、Frontier パッケージの活用例は吉川・他(2013)、order-m の活用例は Marques et.al. (2013)を参

照。

28 応答変数が効率水準のように上限値 1 を持つような場合の分析として、かの Tobin が考案した手法です。たい

ていは OLS の結果に近く、そもそも Two-Step 法自体の論理が曖昧なこの領域でも多用されますから、AER パッ

ケージの使い方だけでも習得しておくと便利です。

Page 22: 初めてのベンチマーキングrio.andrew.ac.jp/~yane/class/S34/Rmanu.pdf · 2014-09-07 · 1 初めてのベンチマーキング ~rの1日自主トレ・マニュアル~

20

ました。それを Tobit で推定したのが Tobc で、両者の結果を texreg で要約したのが表2です。一連の作業が5の

OLS の場合とほぼ同じだと気づけば、R の 1 日学習はほぼ成功です。

表 2 CRS フロンティアの効率性の要因分析(係数推定値の右側の()内は標準誤差)

による推定OLS による推定Tobit

(Intercept) 1.174 (0.015)***

1.180 (0.016)***

hc3 -0.007 (0.001)***

-0.008 (0.001)***

hgini -0.006 (0.000)***

-0.006 (0.000)***

tropics1 -0.014 (0.006)* -0.015 (0.006)

**

Log(scale) -3.454 (0.052)***

R2 0.698

Adj. R2 0.693

Num. obs. 191

AIC -729.159

BIC -712.898

Log Likelihood 369.580

Deviance 198.890

Total 191

Left-censored 0

Uncensored 185

Right-censored 6

Wald Test 426.685

***p < 0.001,

**p < 0.01,

*p < 0.05,

·p < 0.1

Page 23: 初めてのベンチマーキングrio.andrew.ac.jp/~yane/class/S34/Rmanu.pdf · 2014-09-07 · 1 初めてのベンチマーキング ~rの1日自主トレ・マニュアル~

21

表2から、OLS と Tobit の係数推定値は非常に近いことが分かります。また、9-ts.txt を見れば分かるように、

VRS の効率性を応答変数にとっても、ほぼ同様の結果を得ます。3つの説明変数で効率性の変動の約7割を説

明できているのですから、これらの変数がきわめて重要だと分かるのです。

ただし、平等化や非熱帯国での高効率には説明がつくとしても、0.1%という極めて高い有意水準で教育の充実

が効率性を阻害するとは意外でしたし、今すぐには名答が思いつきません。ですから、これはオープンクエッションとし

て、 後の自主トレの選択肢の1つに加えておきましょう。

というのも、意外な発見をうまく説明できればそれだけで面白いし、十分に価値ある立派な研究だからです。もち

ろん同時に、以外に思えた発見は、実は大事な説明変数が抜けていたりモデルがまずかったりすることによって偶然

に現れた「見せかけの関係」かもしれませんが、それをしっかり解明するのもまた立派な研究だからです。いずれにせ

よ、その合理的な説明を与え、多くの人を納得させ事実判断に関する共有知識を高めることが「行動する頭脳集

団」の Mission の確信なのです。

5 APPENDIX(付録)

以下は、このマニュアル作成に使った文献・コード・データに関する付録です。特に、ここでは一部のみしか表示

していないコードとデータもリンク先には実物そのままのファイルがありますので、自由に活用して下さい。

5.1 引用文献について

オープン・ソースの R は、その機能や使い方もネット上に豊富な解説が存在し、その使用環境も RStudio のよ

うに日進月歩ですから、自分のレベルと要求に見合ったネット上の解説を探せれば、わざわざ市販の書籍を買う必

要はありません。しかし私のように、R だけでなく統計学の履修経験もなく、しかもあれこれ参照するのが面倒な人に

とっては、Lander, J. (2014)のようなコンパクトな入門書で自習する方が効率的かもしれません。英語は嫌いという方

には、,Crawly(2008)のような実践的な訳本が便利だとは思いますが、英語情報に比べて選択肢は狭く内容も古く

なるでしょう。やはり語学や統計学は、学生時代に習得しておくと、その後の学習を効率化できるのです。

Atkinson, A (1985), Plots, Transformations and Regression, Oxford.

昔の本も役立ちます。プロット、つまりお絵描きは、当時の技術革新によって可能になった 新のチェックツールだった

のですから、今も回帰分析の良きお友達なハズです。

Bogetoft, P. and L. Otto (2011), Benchmarking with DEA, SFA, and R, Springer.

学生でも R を使えば自由にフロンティア分析ができる時代になったと確信した種本です。著者たちの主要な関心がマネ

ジメントにもあることから、実践的なビジネスでも、ゲーム理論と同様、基本ツールになるハズです。

Page 24: 初めてのベンチマーキングrio.andrew.ac.jp/~yane/class/S34/Rmanu.pdf · 2014-09-07 · 1 初めてのベンチマーキング ~rの1日自主トレ・マニュアル~

22

Chang, W. 【石井・他訳】 (2013), 『R グラフィックスクックブック』, オライリージャパン.

様々なグラフのサンプルを見て必要なコマンドをチェックできるので、非常に便利です

Crawly, M. 【野間口・菊地訳】 (2008), 『統計学: R を用いた入門書』, 共立出版.

理系の題材が多いのですが、そのぶん科学的・統計的な判断とは何かが分かりやすく、かつデータやコマンドもダウン

ロードできる実践的なマニュアルです。特に、回帰分析の仮定のチェックや変数の吟味は非常に具体的で、これだけで

自分の問題に取り組めるようになると思います。ただ、英語ではキンドル本や新版が出ても、日本語版の改定はあまり期

待できないでしょう。

Greene, W. (2012), Econometric Analysis, 7th edition, Pearson.

WHO のデータの出所、たぶん現状では EFA の話が出てくる唯一の計量経済学の教科書だと思います

Henningsen, A. and C. Henning. (2009), “Imposing regional monotonicity on translog stochastic production

frontiers with a simple three-step procedure,” Journal of Productivity Analysis, Vol.32, pp.217-29.

生産関数の実証において理論的に重要な「単調性」を満たしていない研究が多いとして、R による3ステップの手続き

を推奨。私もいつかはと思いつつ手をつけていませんから、この手続きに従って制約の有無による結果の相違を確認する

だけでも、十分に面白いと思います。

石田基弘 (2012), 『R で学ぶデータ・プログラミング入門』, 共立出版

副題が「RStudio を活用する」で、まだ少ない日本語の RStudio の解説書の1つですが、私には Lander(2014)のよう

な解説で十分でしたから、たぶん他の RStudio の日本語解説も急増すると思います。

Kleiber, C. and A.Zeileis. (2008), Applied Economics with R, Springer.

書名の頭文字通り、パッケージ AER を使って計量経済学を学ぶのに便利なコンパクトな教科書と思います

Lander, J. (2014), R for Everyone, Addison Wesley.

各章も全体もコンパクトですぐに読めるうえ、 近の手法も解説されているので、私にはこれだけで十分です。訳本が出

れば、貸し出しします。

Marques, R. et.al. (2013), “Nonparametric Benchmarking of Japanese Water Utilities,” Journal Water

Resources Planning and Management.

Order-m のような 近の手法を初めて日本の水道事業に適用した研究です。

Ruggiero, J. (2011), Frontiers in Major League Baseball, Springer.

野球選手の年俸と、複数の指標(打者ならホームランや三塁打等、投手なら投球回数や自責点等)の効率性を

DEA で測定し、お買い得選手を浮き彫りにするスポーツ・ベンチマーキングの面白い教科書。

Yane, S. and S. Berg. (2013), "Sensitivity Analysis of Efficiency Rankin 論文ですが、gs to Distributional

Assumptions: Applications to Japanese Water Utilities." Applied Economics, March (45), 2337-48.

Page 25: 初めてのベンチマーキングrio.andrew.ac.jp/~yane/class/S34/Rmanu.pdf · 2014-09-07 · 1 初めてのベンチマーキング ~rの1日自主トレ・マニュアル~

23

2010 年の米国研修の「五十の手習い」で初めて実証に手を染めた論文ですが、Two-Step は嫌だけどパネルではない

場合の SFA の分析をしたい場合には役立つと思います。

矢根真二 (2014), 「ベンチマーキングの普及と社会科学の役割」『総合研究所紀要』に書く予定です

ここではベンチマーキング自体の詳しい説明をするスペースがなかったので、ベンチマーキングの実態とその重要性、

特に、1アウトプット・1インプットという も簡単なケースの DEA および SFA の効率性概念の図解を要約するつもりで、こ

のマニュアルのベンチマーキングの基礎的な参考書になれればと願っています。

吉川丈・他 (2013), 「確率的生産フロンティアと環境変数:技術効率性効果フロンティアモデルの上水道事業への適

用」, 『桃山学院大学経済経営論集』,第 53 巻第 4 号.

現在本学にも教えに来て頂いている吉川先生や荒木ゼミの磯合さんらが院生時代に frontier を使って書いた論文

ですが、先行研究から論点を絞ってオリジナリティを主張するスタイルは本演習での論文の書き方の良い手本になると思

います

Zhu, J. and W. Cook 【森田訳】 (2014), 『データ包絡分析法』, ITSC.

SFA や DEA の解説は、英語ならそれぞれ Coelli のフリーソフト Frontier および Deap のマニュアル29で十分だと思

うのですが、日本語では両者共に少なく、せいぜいこの DEA の訳本が豊富な実例があるという点で分かりやすい部類に

属するぐらいだと思います。

5.2 使用コード例: リンク(RSTART.TXT)

使用したコードのテキストファイルで、ここでは Ex.1 だけを示しておきます。これをコピペして実行すれば図1が出来

上がるはずです。リンク先のテキストファイルのすべてのコードをコピペし実行すれば、ここで紹介したすべての作業が

あっという間に完了するはずです。

# Ex.1 -> 1-3Dplot

#library(rgl)

require(rgl)

plot3d(mtcars$wt,mtcars$disp,mtcars$mpg,type="s",size=0.75,lit=FALSE)

rgl.snapshot('1-3Dplot.png',fmt='png')

# rgl.postscript('1-3Dplot.pdf',fmt='pdf')

detach("package:rgl")

29 http://www.uq.edu.au/economics/cepa/frontier.php. マニュアルは各ソフトの pdf として含まれています。

Page 26: 初めてのベンチマーキングrio.andrew.ac.jp/~yane/class/S34/Rmanu.pdf · 2014-09-07 · 1 初めてのベンチマーキング ~rの1日自主トレ・マニュアル~

24

5.3 使用データ例: リンク(WHO.XLSX)

使用した「who.xlsx」の 192 行のうちの 初の5行です。手順に従って、自分の R のデータフレームとしての使

い方をマスターして下さい。各列が各変数ベクトルという形のイメージを頭に入れておくと、データ操作も理解しやすく

なるでしょう。特に R が便利なのは、「hexp * 2」のように簡単にベクトル自体の演算をできることだからです。自分で

データを集める場合、サンプル数(行の数)は少なくとも 30 程度は欲しいところです。

country  dale  hexp  hc3  gdpc  gini  oecd  tropics 

1  63.4349  344.017  8.4766 4648.89 0.381411 0  1

2  72.4934  1213.6  7.32606 16181.3 0.285139 0  0

3  37.6295  28.2885  1.35877 884.016 0.334725 0  0

4  37.9282  47.1741  2.2486 1310.39 0.444238 0  1

5  60.1735  63.5321  4.88903 1815.2 0.441193 0  0

6  65.9875  818.348  4.97681 19484.5 0.3679 0  0

7  66.8238  820.766  8.77134 10009.4 0.474325 0  0

8  66.8975  152.893  8.16303 1935.35 0.285139 0  0

9  59.1857  596.454  7.19482 9319.59 0.474325 0  1

10  71.9358  1609.32  10.458 20632.3 0.341 1  0

  71.81  1971.07  7.81984 21900.7 0.2235 1  0

6 使ってこそ道具: 4月に備える自主トレの課題選択

以上が、私のように初めて R を触る人を念頭においた基本的なベンチマーキング・スキルへの私なりの 短案内

です。たった1日を費やせば、回帰分析やベンチマーキングの詳細な理解はさておき、それらの雰囲気は呪文のよう

なコードを実行しながら体感できるはずです。もっとも私のように懐疑心とか好奇心のある方は、自分なりにちょっとコ

ードをいじりたくなり、改善できて喜んだり動かなくなって腹が立ったりしている間に、数日が過ぎてしまったかもしれま

せんが、それこそ本当の自分なりの学習ですから無駄どころか貴重な経験です。もちろん、もっと簡単で分かりやす

いネット上や書籍の解説があれば、代替もしくは修正しますので、ご意見下さい。これをベースに、あるいは全面的に

分かりやすく書き直して下さっても結構です。

とはいえ、仮にも「行動する頭脳集団」を標榜する本演習Ⅲ・Ⅳのメンバーに加わるのですから、この2日目から

が本番です。本演習で学習するゲーム理論で言えば、以上の1日は以下の自主トレ課題をこなすウォーミングアッ

プにすぎませんから、いかにうまくバックワード・インダクションして学習戦略を実行してきたかが重要になります。要する

に、道具やスキルは使えないと何の価値もありませんから、常に少なくとも「何を・なぜ・いかに(What・Why・

How)」学習するのかを自覚しておかないと、いくら学習しても無駄になったり非効率になったりするのです。私なら、

Page 27: 初めてのベンチマーキングrio.andrew.ac.jp/~yane/class/S34/Rmanu.pdf · 2014-09-07 · 1 初めてのベンチマーキング ~rの1日自主トレ・マニュアル~

25

表紙の活用法で「バックワード・インダクション」の重要性の示唆に注目し、 初にざっと目を通してココの課題を選

択してから、同時並行的に学習したでしょう。その方が実践的ですし、よく理解でき 1 度で終わるからです。

さて、以下の 4 つのカテゴリーの中から1つ選択し、そのカテゴリーに属する分析結果を4月の開校時に名刺代

わりに報告し合うというのが本演習の自主トレです。例をそのままパクってもかまいませんし、他のメンバーと組んでも

かまいません。不明な点は、チューターたる先輩でも私でも遠慮なく活用するのが行動力です。本演習でも実践す

るディベートでは口で語ることがほぼすべてですが、意欲や努力は語るものではなく行動した結果がすべてです。

Type1 は、すでに R のパッケージ等に含まれるデータがありますから、それを回帰やベンチマーキングしてみるだ

けです。「なぜそれを選んだのか、どのような分析を試みたのか、明らかになった主たる分析結果とは何か」を分かり

やすく報告・説明できれば OK です。

Type2 は、興味あるデータを自ら収集・整理したうえ、回帰やベンチマーキングといった分析を使って面白そうな

仮説や結果を提示します。どんなデータを集めるかを決めるには、すでに一定のテーマへの関心と知識が必要です

から、本演習の春学期の中心課題たる研究トピックの完成に限りなく近いレベルです。このチャレンジを成功させる見

事なバックワード・インダクションを実現するには、論文検索アプリ等で手本となる先行研究論文を見つけることが効

果的です。そこにデータの出所と分析手法の解説があれば、実質は Type1 の作業と同じなのに、春学期中の中

心課題をほぼ終えることができるからです。

Type3 と Type4 は本来ならば私の宿題なのでしょうが、前者は純粋にテクニカルなことの方が気になる方、後者

は曖昧なことをそのままにして別のことに移るのが気持ち悪い方に向いているかもしれません。その他、疑問や希望

があれば、時間を無駄にせぬよう早めに相談して下さい。ゲーム理論の観点から見れば、人生は無数の選択の結

果です、つまり何をなせどのように選択するかは非常に重要だからです。自分の将来を見据えたうえで、賢明なバック

ワードインダクションを心がけましょう。

Type1

既存のデータセットを使って、検定・回帰分析・ベンチマーキング等の実習を試みる

例1: 現4回生の南君*が 13 年度に書いた日本の銀行の DEA のデータ(と論文?)を活用

例 2: パッケージ「frontier」にある Coelli 教授が使ったデータ「ricsProdPhil」(と論文)を活用

Type2

(先行研究に基づき)自らデータを収集・整理し、回帰分析やベンチマーキングの結果を提示する

例1: 現4回生の黒沢君*によれば、日本のプロ野球選手の年俸と打撃成績はネットから収集できる

例 2: Ruggiero(2011)によれば、メジャーリーガーの年俸と成績は ESPN サイト等から収集できる

Type3 「Help1-5」もしくはそれに準ずる問題に、より便利なテクニカルな改善・提言を試みる

Type4 表2で hc3 の符号が負になる点について、別の理論ないし実証の観点から合理的に説明してみる

*2015 年度以降は、たぶん上級生によく似た研究が増えているでしょうから、学生研究発表大会や演習説明

会等を活用すれば、より多くの情報が容易に集まると思います。