情報リテラシー基礎㈵b 科学的方法 20130909

38
科学的方法について 情報リテラシー入門B 京都大学国際高等教育院 小山田耕二

Upload: sympo2011

Post on 02-Jul-2015

348 views

Category:

Documents


1 download

TRANSCRIPT

科学的方法について

情報リテラシー入門ⅠB

京都大学国際高等教育院 小山田耕二

内容

• 科学とは

• 科学的方法 –仮説検証法

–査読

• 回帰分析演習 –気候と論文引用度との関係

情報リテラシー入門ⅠB

科学とは?

• 科挙で試される学問「科挙之学」の略語

• 啓蒙思想家の西周によるScienceの訳語

• 自然科学、人文科学、社会科学の総称

• 体系化された知識や経験の総称

• 自然についての体系的知識/自然科学 – 科学教育=理科教育

• 科学的方法に基づく学術的な知識、学問

情報リテラシー入門ⅠB

科学的方法

情報リテラシー入門BⅠ

情報リテラシー入門ⅠB

すべてのアメリカ人のための科学 F. James Rutherford and Andrew Ahlgren, Science for All Americans , 1989

1. 科学的リテラシーを備えた社会の市民すべてにとって必要不可欠な理解や,思考の習慣についての一連の提言

– 科学,数学,技術に関するリテラシーを包含し,教育の中心的な目標として注目。

– ○「生体細胞の主な機能はDNA 分子に暗号化されている指示に従って蛋白質分子を合成することにある。」

– ×「リボソーム」や「デオキシリボ核酸」といった用語,又はメッセンジャーRNA がどのようなものであって,それがDNA とどのような関係にあるかといった事柄

2. 実現に向けての提言 – カリキュラムは,その網羅する教材の絶対量を削減し、厳格な教科

の境界線を緩和又は排除する

– 学習すべき解答からではなくまず現象に関する疑問から始めるようなアプローチを意味し,生徒たちが仮説,証拠の収集と利用,探究や過程に関する構想を積極的に活用できるようにし,生徒たちの好奇心や創造性を重視するアプローチを意味する。

情報リテラシー入門ⅠB

イギリスにおける科学教育 Science for the 21st Century

1. 日常生活における科学と技術のインパクトを理解し正しく評価することができる。

2. 健康やダイエット、エネルギーの利用といった科学に関する事柄について、情報を得た(あるいは教育を受けた)人として意思決定ができる。

3. 科学についてのメディアレポートを読み、その本質が理解できる。

4. そのようなメディアレポートにおいて含まれるあるいは(しばしばより重要なのは)排除された情報を批判的に省察することができる。

5. 科学が関連した問題(issues)について、自信を持って他者との議論に参加できる。

情報リテラシー入門ⅠB

政策のための科学 (参考:『諮問第11号「科学技術に関する基本政策について」に対する答申』抜粋)

国は、客観的根拠(エビデンス)に基づく政策の企画立案や、その評価及び検証の結果を政策に反映するため、「科学技術イノベーション政策のための科学」を推進する。その際、自然科学の研究者はもとより、広く人文社会科学の研究者の参画を得るとともに、これらの取組を通じて、政策形成に携わる人材の養成を進める。

情報リテラシー入門ⅠB

政府コメントにおける「科学」

1. 2012年3月11日細野大臣は、フジテレビ系列の報道番組で、「科学的に安全が証明されているがれきの受け入れ拒否は、被災地の切り捨て」と言い切った。

2. 2012年5月19日細野大臣は、ストレステストの結果について、記者団に 「科学的知見に基づき作った判断基準は十分説明できた。 各首長の反応については真摯に受け止めたい」 と語った。

3. 2012年8月31日橋下徹大阪市長は、大阪府と大阪市が開いた震災がれきの受け入れの説明会で反対意見が相次いだことについて「反対の人しか集まっていない。事実誤認で、現在の一般的な科学論から離れた見解が多い」と市役所で記者団に述べ、批判した。

情報リテラシー入門ⅠB

EUストレステスト

情報リテラシー入門ⅠB

EU理事会の要請

EUストレステスト仕様書

事業者による報告書

各国政府の報告書

ピアレビュー 公開セミナー

での議論

科学的方法 F. James Rutherford and Andrew Ahlgren, Science for All Americans , 1989

1. 物事を調査し、結果を整理し、新たな知見を導き出し、知見の正しさを立証するまでの手続きであって、(仮説検証)

2. その手続きがある一定の基準を満たしているもののことである。(査読)

情報リテラシー入門ⅠB

仮説検証

• 因果法則の定式化により立てられた仮説とその実証を柱とする – 研究対象となる現象の因果関係を仮説によ

り説明する

– 論理的整合性を保ち、仮説の真偽を経験的データにより実証する

• 「根拠(証拠物件)」

• 「推論過程」

• 「結論」

情報リテラシー入門ⅠB

仮説検証法 坂下昭宣:社会科学方法論

• もともと自然科学における方法論であったが、社会科学においても採用されるようになった

• 因果法則の定式化とその実証 – 現象の因果関係を仮説により説明

– 仮説の真偽を経験的データにより実証

現象

観察

先行研究

調査

概念

操作化

仮説

構築

データ

集計

仮説

検証 適用

情報リテラシー入門ⅠB

情報リテラシー入門ⅠB

査読とは 研究ベース学習第4章,コロナ社

• 査読の目的 –投稿された論文に学問的な価値があるかどうかを判断する

–論文を掲載する雑誌の品質を保つ

• 査読の担当 –「査読者」あるいは「審査員」「レフェリー」などと呼ばれる

–論文が扱うのと同じ専門分野にいる研究者 –「ピア・レビュー」のしくみとも呼ばれる(ピアとは「同業者」の意)。

情報リテラシー入門ⅠB

査読業務シークエンス図

投稿者

事務局

論文投稿

0. 投稿受付

1. 論文番号付与

1.論文受理連絡

編集委員長

1.論文受理連絡

3. 査読者推薦

査読者

4. 内諾なし意思確認

4. 査読意思表明

5. 論文+査読報告書送付

6. 査読報告書送付

7. 報告+査読報告書送付

21. (不採録の場合)

判定結果連絡

8, 9. および12. 判定結果連絡

21. (不採録の場合)判定結果報告+謝辞

13.中間査読結果連絡

14. 修正論文送付

15. 修正論文+査読報告書送付 16.査読報告書送

17. 報告+査読報告書送付

20. 判定結果連絡

21. 最終査読結果報告

22. 最終結果報告+謝辞

担当委員

2. 選任

10. 査読者推薦 10. 論文+査読報

告書送付 10. 査読報告書送付

11. 報告+査読報告書送付 12. 判定結果連絡 21. (不採録の

場合)

判定結果連絡 21. (不採録の場合)判定結果

報告+謝辞

18, 19. 判定

• 特徴 – 複数者査読 – 匿名査読 – ボランティアベース

• 査読者は以下のような評価を下す。 – 無修正で掲載を許可する – 修正を条件として掲載を許可する。

– 修正の後,再査読を要求し,その上で掲載できるかどうかを判断する。

– 掲載を不許可とする。

情報リテラシー入門ⅠB

インパクトファクター(IF)について

• 全世界の約10万の学術雑誌中5686誌が対象

• 日本で発行される英文科学雑誌のうちIFが算定されているのは、157誌

•IFとは •ISI社の調査対象のある雑誌に掲載された論文の平均的な被引用数

•特定の研究分野における雑誌の影響度を測る客観的指標として利用

前年と前々年に発表された論文数

前年と前々年に発表された論文が引用された数

EXCELを用いた回帰分析

情報リテラシー入門BⅠ

情報リテラシー入門ⅠB

仮説検証法の例 研究ベース学習第2章,コロナ社

• アイデア – 自由な総合大学からは多くのすばらしい研究成果が生み出される

• 仮説化(変数概念への変換) – 大学組織の集権化・専門化がすすむほど教員一人当たりの論文数はより少なくなる

• 概念操作化(質問項目への変換) – 集権化(原因)→必修科目が多いですか?

– 専門化(原因)→学部の数は多いほうですか?

– 教員一人当たりの論文数(結果)→教員は年間殿程度論文を出版していますか?

情報リテラシー入門ⅠB

Excel散布図を使った検証 • 縦軸と横軸に2項目の大きさを対応させ、データを点でプロットしたもの – 必修科目数と論文数との関係を散布図で表現

– 学部数と論文数との関係を散布図で表現

• 確からしさは決定係数(0.0~1.0)で表現 大学名 必修科目数学部数 論文数北海道 5 2 4.440299東北 1 2 2.604768東京 1 1 1.805732名古屋 3 5 5.860313京都 4 5 6.769041大阪 1 2 2.426428九州 4 1 2.992099東京工業 1 2 2.021525一橋 1 3 3.560307筑波 5 2 3.793893金沢 4 5 5.928479神戸 4 2 3.357371広島 5 2 3.690512慶應 5 3 4.811682早稲田 1 5 4.897048同志社 2 4 4.461144立命館 1 1 1.390609南山 2 2 2.508387 情報リテラシー入門ⅠB

Excel回帰分析を使った検証Ⅰ

• 原因を表す変数と結果を表す変数の間に式をあてはめ目的変数が説明変数によってどれくらい説明できるのかを定量的に分析すること – 必修科目数を説明変数として指定(X1) – 学部数を説明変数として指定(X2) – 論文数変数として指定(Y) – 確からしさは決定係数(0.0~1.0)で表現

大学名 必修科目数学部数 論文数北海道 5 2 4.440299東北 1 2 2.604768東京 1 1 1.805732名古屋 3 5 5.860313京都 4 5 6.769041大阪 1 2 2.426428九州 4 1 2.992099東京工業 1 2 2.021525一橋 1 3 3.560307筑波 5 2 3.793893金沢 4 5 5.928479神戸 4 2 3.357371広島 5 2 3.690512慶應 5 3 4.811682早稲田 1 5 4.897048同志社 2 4 4.461144立命館 1 1 1.390609南山 2 2 2.508387

概要

回帰統計重相関 R 0.951283重決定 R2 0.90494補正 R2 0.892265標準誤差 0.289078観測数 18

分散分析表

自由度 変動 分散観測された分散比有意 F回帰 2 11.93283 5.966414 71.39734 2.16E-08残差 15 1.253495 0.083566合計 17 13.18632

係数 標準誤差 t P-値 下限 95% 上限 95% 下限 95.0% 上限 95.0%切片 0.075124 0.351067 0.213988 0.833438 -0.67316 0.823406 -0.67316 0.823406必修科目数 0.531537 0.06227 8.535946 3.84E-07 0.398811 0.664263 0.398811 0.664263学部数 0.835522 0.071166 11.74043 5.83E-09 0.683834 0.987209 0.683834 0.987209

075.0835.0531.0 21 XXY情報リテラシー入門ⅠB

Excel回帰分析を使った検証Ⅱ

• 元旦からの時間と清涼飲料水の売上高との関係を散布図で表現 • 回帰分析を使って放物線近似を実施する

– 元旦からの月数を説明変数として指定(X) – 元旦からの月数の二乗を説明変数として指定(X2) – 売上高を目的変数として指定(Y)

元旦からの月数 売り上げ10.89361197 60.780211.802147893 21.415972.837797423 32.719499.224646632 64.367131.073903617 11.015839.573420881 64.681494.565155036 47.898636.73898129 66.06095

7.847991441 66.4185112.23419941 53.173543.041810023 38.010716.319166653 63.789033.368901457 39.5180112.34278059 45.181097.746552172 66.0248212.26662558 49.69176

1.8214939 24.368559.765946279 60.4807212.7917737 46.45526

2.963396902 39.35665

元旦からの月数二乗 売り上げ12.73815958 162.2607 42.918743.695827066 13.65914 38.784781.761970297 3.104539 16.987486.904897101 47.6776 67.1034912.2907907 151.0635 50.10958

7.156443842 51.21469 60.9394710.04307268 100.8633 64.0800110.10541268 102.1194 58.307436.519100972 42.49868 59.760662.897920454 8.397943 33.985988.032964356 64.52852 64.338849.365301696 87.70888 61.991451.393542934 1.941962 11.372339.674889149 93.60348 59.768788.475122963 71.82771 65.558762.501252778 6.256265 26.070227.65113043 58.5398 62.08379

6.916819254 47.84239 58.853545.222492888 27.27443 57.88133.91704669 15.34325 49.41787

49.1276.1810.1 2 XXY情報リテラシー入門ⅠB

まとめ

• 科学は証拠を要求する • 科学は説明し、予測する

• 科学的方法は仮説検証と査読から構成される

• 科学知識は変更を余儀なくされるものである

• 科学はすべての疑問に完全に答えることはできない

• 科学的妥当性は0/1ではなく0.0~1.0

情報リテラシー入門ⅠB

査読業務

情報リテラシー入門BⅠ

情報リテラシー入門ⅠB

情報リテラシー入門ⅠB

論文査読報告書書式例

–原著論文としての全体的評価 • 新規性・有用性・信頼性

–総合評価の判断理由 • どのような問題に対してどのような仮説を与え、その解決方法の有用性をどのように検証したか?

• 有用性が客観的に見て十分担保されているか?

–論文修正のための詳細コメント • 採録のための条件

• 論文をよくするための事務的照会

情報リテラシー入門ⅠB

論文査読報告書例

平成21年6月20日

研究の世界A クラスシンポジウム 2009

査読結果

論文番号:rwa2008-paper-24

論文題目:BMI指標の落とし穴

全体評価 (1~5の実数値から選んで下さい)

●新規性 4 ●有用性 2 ●信頼性 2 ●総合評価 3

総合評価の判断理由 本研究では、XXX(仮説)することによりXXX(問題)を解決するための手法を提案しておりその意義は高いものと考えます。しかしながらXXXに見られるように提案手法の検証に不十分さが存在し今後検討すべきところが残っていると判断します。

著者へのコメント (より良い論文や発表にするためのコメント等)

●採録条件

1. XXXについて、関連研究を十分に調査の上、提案手法の優位性について述べてください。

●事務的照会

1. 以下のように書き換えたほうがわかりやすいと思います。

ジョージ・ワシントンは米国の最も偉大な大統領であった。 → ジョージ・ワシントンは米国の初代の大統領であった。

黒い目のきれいな子供 → 黒目がきれいな子供

情報リテラシー入門ⅠB

不採録

• 再投稿が勧められる場合とそうでない場合がある。 – 再投稿を勧められた場合は,論文を(大幅に)改訂すれば,次回には採録

される可能性はある。 – そうでない場合は他の投稿先を考えた方がよい。査読側から別の投稿

先を勧められる場合もある。 – なお不採録になったとしても,それは必ずしも研究が否定されたこと

を意味するわけではない。

• 不採録で得られるもの – 論文を改訂するのに大いに役立つ。そのようなコメントをもらえる機

会があっただけでも投稿したことには意義があったといえるだろう。

情報リテラシー入門ⅠB

条件付き採録

• 査読の結果として,採録するために必要な条件(採録条件)が示される

• たとえば「実験の設定が不明であるため信頼性が読み取れない(だから設定を明らかにせよ)」,「次の文献を参照するべきである」など,具体的に修正すべき箇所が指摘される。

• 提示された採録条件を吟味して,(修正期間が定められていれば期限内に)論文を修正して,改訂稿を提出すると再度査読が行われる。このとき採録条件を満たしていると判断されればもちろん採録となり,条件が満たされていないと判断されると不採録になる。

• 条件付き採録で改訂稿を提出する際には,採録条件にどのように対応したのかを示す回答書を同時に提出する。回答書では,条件ごとに指摘されたことに答え,改訂稿ではどのように対応したかを示す。指摘されたことが的外れである(査読者が誤解している)こともあるかもしれない。その場合は(なぜ誤解されたのかをふまえて)自分の見解を丁寧に説明する。

情報リテラシー入門ⅠB

採録条件に対する回答書 http://www2.iee.or.jp/~ias/ronbuniinkai/SYUSA/Manual20061003.pdf

• 2名の査読者からの修正項目・照会事項 に対して、個々の項目・事項とそれに対する回答とが明確に対をなすように記述する

• 論文のどこを修正したのか明瞭に回答する

• 修正箇所が多い場合には修正論文に太字等でその場所が明確にわかるようにする

情報リテラシー入門ⅠB

回答書の例 http://www2.iee.or.jp/~ias/ronbuniinkai/SYUSA/Manual20061003.pdf

平成21年6月25日

研究の世界Aクラスシンポジウム編集委員会担当者殿

投稿論文受付番号: 024

論文タイトル:BMI指標の落とし穴

拝復 標記の拙論文に対し、貴重なご意見やご指摘を賜り、誠にありがとうございます。頂きました照会事項について下記の通り回答いたします。

査読者1

1) XXXについて、関連研究を十分に調査の上、提案手法の優位性について述べてください。 (査読者からの照会事項を項目ごとに再記する)

【回答】ご指摘の箇所についてお答えいたします。・・・この件については・・・のように考えております。しかしながら、このような御指摘を頂いたのは、表現が不適切であり誤解を招いたものと考えます。・・・そこで検討の結果、本文中の「***(変更前)」という表現を「***(変更後)」のように変更し、明確化を図りました。

・・・以下同様

変数削減法

情報リテラシー入門BⅠ

情報リテラシー入門ⅠB

回帰分析で出力される表 http://www.geisya.or.jp/~mwm48961/statistics/mul_reg3.htm

概要 • 重相関R・・・重相関係数.1に近いほどよく近似されたモデルとなる.

• 重決定R2・・・決定係数.目的変数のばらつきの内,これらの説明変数で説明できる割合.Rの2乗に等しい.

• 補正R2・・・自由度修正済決定係数.データ数が少ないと決定係数が自由度の影響を受けて実際よりも大きくなるので,自由度を考慮して補正した決定係数.この値が0.5以下では半分以下の説明しかできていないことになる.この値が1に近いほどよいモデル.

情報リテラシー入門ⅠB

回帰分析で出力される表 http://www.geisya.or.jp/~mwm48961/statistics/mul_reg3.htm

分散分析表

• 係数・・・重回帰式の係数.上の図の場合,重回帰式は (実勢価格)= -115274+ 588.2779×(総容量)+ 17416.4×(ドア数) -66.8481×(冷蔵) -329.723×(冷凍) -722.658×(野菜) + 85.64699×(製氷)

となる.

• t・・・t値.| t | が大きいほど影響が大きい.(切片以外)

(元のデータが標準化されていれば:[(観測値-それぞれ

の平均値)/標準偏差]回帰係数が影響度を表わすが,その変形は少し時間がかかる.データが生のままのときは | t値 |で分かる.)

• P-値・・・P値が小さいほどその説明変数を用いたときの危険率が小さい.(切片以外)

情報リテラシー入門ⅠB

相関で出力される表 http://www.geisya.or.jp/~mwm48961/statistics/mul_reg3.htm

分散分析表

• 目的変数との相関係数が高いかどうかを見る(よい材料)

• 説明変数相互の相関係数が高いものは,多重共線性(マルチコリニアリティ)の可能性あり要注意(悪い材料)

– 「相関係数と回帰係数の符号が逆になっている」「説明変数相互の相関係数が高い」ものは,多重共線性の疑いがあるので、いずれか一方を説明変数からはずして,重回帰分析をやり直す必要がある.

情報リテラシー入門ⅠB

説明変数の選び方 http://www.geisya.or.jp/~mwm48961/statistics/mul_reg3.htm

多重共線性が端的に示しているように,説明変数は多いほどよいのでなく,むしろ,目的変数に影響していない雑多な説明変数は少ないほどよいと考える.最適な説明変数の選び方として,次のようなものがある.

1. 変数増加法・・・説明変数0個からスタートして,目的変数との相

関が強いものから順に1つずつ追加,再計算する.t値の小さいもの(t2<2を目安とすることが多い)が登場すればその前までとする.

2. 変数減少法・・・準備した説明変数を全部使って(Excel2002では16以下の制限有り)分析し,多重共線性の疑いのあるもの,t値の小さいもの(t2 <2を目安とすることが多い)をはずして再分析する.

情報リテラシー入門ⅠB

政府統計を利用した仮説検証

情報リテラシー入門BⅠ

情報リテラシー入門ⅠB

政府統計データの例

• 総務省統計局「統計でみる市町村のすがた 2007」( http://p.tl/QYOb )からデータを取得し、以下の仮説検証作業を実施せよ – まず、都道府県レベルのデータを利用する – 表番号Aと表番号Kを利用する

情報リテラシー入門ⅠB

仮説

1. 地域が都市化しているほど、犯罪が起こりやすい

2. 地域経済の状況が悪いほど、犯罪が起こりやすい

3. 地域住民のつながりが強いほど、犯罪が起こりにくい

情報リテラシー入門ⅠB

操作化

• 従属変数

– 刑法犯認知件数(人口一万人あたり)

• 独立変数:

– 人口と人口集中地区人口比

– 完全失業率

– 自治会加入率

情報リテラシー入門ⅠB

グループ課題:明日5限口頭発表

Excel回帰分析ツールを使って以下従属変数を独立変数で説明せよ • 従属変数

– 刑法犯認知件数(人口一万人あたり)

• 独立変数:

– 人口と人口集中地区人口比

– 完全失業率

– 自治会加入率(オプション)

• 説明資料( PowerPoint)を英語で作成し、英語で発表する。時間:5分 PowerPoint5ページ(表紙除く) – 仮説の説明

– データについての説明

– 得られた結果についての説明

– 結論(積み残したことも述べる)

情報リテラシー入門ⅠB