統計基礎(第1回)...
TRANSCRIPT
統計基礎(第1回)
オリエンテーション
早稲田大学大学院商学研究科
2017年4月12日
大塚忠義1
Agenda
オリエンテーション
本講義の目的と概要
本講義のゴールと評価方法講義計画教科書と参考文献
統計の適用範囲
2
本講義の目的(1)
• 社会科学の研究における統計の重要性を認識する
- 実証のない仮説は支持されない
- 経営や経済に関する分析を行うにあたり、データの処理は必須である
3
本講義の目的(2)
• 数理統計の基本的な理論と概念を理解する
- 諸現象を説明するためのモデル構築の際に、発生確率は重要な役割を果たす
- 計算結果を張り付けただけの実証は信頼されない
- 適切な標本、現実的な前提に対する検討
4
本講義の目的(3)
・基礎的な統計手法を学ぶ
・それらによって必要な情報を実際に導きだす
・統計をもとに意思決定を行うために必要な知識の基礎を習得する
5
講義のゴール(1)
本講義は実学である「統計」の基礎
統計を活用できるようにする:多くの学問のとって便利なツール
≠応用数学の一種である統計学
:実用に供する
≠ 統計手法のマニュアルを学ぶ
:統計のソフトウェアの操作方法にすぎない
6
講義のゴール(2)
(1)不確実な現象を確率論に基づき数理モデル化するプロセスを理解する
(2)検定・分析の前提となる事象の独立に係る仮定を理解する
(3)確率事象に従うモデルを活用できる範囲を理解する
(4)実際に仮説を仮説検定または回帰分析を活用して実証する
7
講義のゴール(3)統計分野の拡大を理解する(1)記述統計学データの説得力を高め(わかりやすく)、分類表記(表やグラフ)する
(2)統計的推論仮説をたて、その仮説の説明力が十分高いことを実証する
(3)統計解析ビックデータを対象に統計学が機械学習、人工知能への広がる過程を理解する
8
評価方法
レポートによる評価(4~6回程度)
講義資料に記載した課題に対するレポートを提出していただきます
予習はともかく復習は必須実際に手を動かして確認する
提出期限は講義後2週間期限後提出は認めます
9
スケジュール15回の講義のうち
2回 記述統計学
5回 確率論
確率の概念、主要な確率分布確率論の重要な法則と定理
6回 統計的推論
標本と統計量、推定と検定回帰分析
2回 実習とまとめ
10
講義計画(1)
Ⅰ.記述統計学1.オリエンテーション、統計とデータ2. 統計とデータⅠ.確率論
3.確率論の基礎4.代表的な確率分布5.分布関数、平均と分散、正規分布6.大数の法則、中心極限定理7. 標本分布
11
講義計画(2)Ⅲ.統計的推論
8.推定と検定
9.正規分布からの標本
10.主要な仮説手法
11.相関と因果
12.回帰分析と最小二乗法
13.多重回帰分析とその他の検定
Ⅳ.実習とまとめ
14.さまざまな検定・分析手法
15.回帰分析の実習
12
講義資料
http://tyotsuka.cocolog-nifty.com/blog/
から各自事前にダウンロードしてください
講義後に課題とともにコースナビにアップロードします
レポートはコースナビで提出してください
13
教科書
なし
確率・統計に関わる本はたくさん存在するが1冊の本をもとに本講義を構成することはない
14
参考文献
東京大学教養学部統計学教室(編)『統計学入門』東京大学出版会
森棟公男『統計学入門』新世社
鳥居泰彦『はじめての統計学』日本経済新聞出版社
詳しさと難易度の順
統計に関する文献を1冊持っていることをお勧めします
15
参考文献
16
統計処理
17
• エクセルを使えると便利です
• というか統計処理にPCと専用ソフトは必須
• 代表的なものはSTAT,E-viewsでもエクセルの「データ分析」で十分
『Excelで学ぶ統計解析入門 Excel2013/2010対応版』菅民郎 「オーム社」
参考図書
講義のときに、参考になる文献・図書を推薦します
確率統計に関する本はたくさん
数学がしっかりしたもの、漫画で解説したもの
理論がきちんとあるもの、統計ソフトの使い方が中心のもの
統計にまつわる読本:これはこれで結構楽しい
18
19
統計学は最強の学問である
19
統計学の始まりがコレラからロンドン市民を救ったテムズ川の下流の水を飲む人の方が上流の水を飲む人より病人が多い
コレラ菌の発見を待つことなく、予防に成功
西内啓 「ダイヤモンド社」
統計の適用範囲(1)
実証分析を伴う分野:エビデンスにより仮説の正当性を主張する学問
自然科学:医学、薬学、保健、衛生農業、工業
社会科学:経済学、商学、経営学、特にマーティング、金融、保険、会計学、金融工学人文科学:心理学、言語学
20
統計の適用範囲(2)
実業(企業、行政)のなかで統計は必須
PDCAサイクル
・事業活動における生産管理や品質管理などの管理業務を円滑に進める手法の一つ・Plan(計画)→ Do(実行)→ Check(評価)→ Act(改善)の 4 段階を繰り返すことによって、業務を継続的に改善する
21
PDCAサイクル1.Plan(計画):従来の実績や将来の予測などをもとにして業務計画を作成する
2.Do(実施・実行):計画に沿って業務を行う
3.Check(点検・評価):業務の実施が計画に沿っているかどうかを確認する
4.Act(処置・改善):実施が計画に沿っていない部分を調べて処置をする
下線部は統計の世界
22
統計処理とIT紙とペンのころの統計は根気のいる(面白くない)作業
しかし、重要!!
大化の改新:律令制度の実施⇒初めての国勢調査:人口、耕作面積⇒兵力、税収
桃山、江戸時代の検知:度量衡の統一⇒正確な国勢調査、正確な耕作面積⇒大名の国替え
現在はITの得意分野⇔統計の取説が重要
23
ITの発達とビッグデータ処理
記憶容量の拡大、処理速度の向上
⇒不要としてきたデータでも廃棄不要⇒未知の因果要因⇒原因☞結果だけでなく、結果☞原因ベイズ理論
データを蓄積によりプログラミングを必要としない統計的推論⇒機械学習機械学習の蓄積⇒人工知能
24
Question?
お疲れ様でした次回以降、電卓、PC、モバイル等計算機能のある機器の持ち込みを勧めます
25