読者です 読者をやめる 読者になる 読者になる

原因と結果の経済学 (中室・津川 2017)

要約

因果関係と相関関係の混同に注意。

 

用語

交絡因子

  • 原因と結果の両方に影響を与える「第3の変数」を交絡因子と呼ぶ。
  • 相関関係の因果関係のように見せてしまう。
  • 経済学の「欠落変数」とかなり近い概念。

共変量

  • 原因と結果でない残り全ての変数。
  • 共変量の中に交絡因子とそうでないものが含まれる。

反事実

  • 実際には起こらなかった「たら・れば」のシナリオのこと。

比較可能

  • 2つのグループにおいて、結果に影響しそうな全ての特徴が似通っていて、介入・政策が唯一の違いとみなせること。

エビデンス

  • 因果関係を示唆する根拠のこと。
  • 一般的には「データを用いた分析に基づいて示された根拠」だが、専門的にはより厳格な意味で用いる。

 

 

因果推論

 因果関係の確認ポイント

1.「全くの偶然」

2.「第3の変数の存在」

  • 「体力のある子どもは学力が高い」という仮説に対して、「親の教育熱心さ」という交絡因子が体力と学力に影響を与えている可能性がある。

3.「逆の因果関係」

  • 警察が多い地域には犯罪も多い。
  • 犯罪が多いから警察が多く配備されていると考える方が理にかなっている。

反事実の必要性

  • 因果推論には、事実と反事実の比較が必要であるが、反事実は観察できない。
  • 反事実を作り出すことが因果推論の根幹にある。
  • 比較可能なグループを作り出し、反事実における結果をもっともらしい値で穴埋めする。

 

ランダム化比較試験

定義

研究対象を介入群と対照群にランダムに割り付けることで2つのグループを比較可能にし、介入群が「もし介入を受けなければどうなっていたか」という反事実を対照群で穴埋めする方法。

なぜ「ランダムに」なのか

セレクションバイアス

  • 人間が行う選択(セレクション)によって、研究対象となる2グループが比較可能でなくなること。
  • 介入群と対照群のどちらに入るかを、自分の意思で選択できなくする必要がある。

グループの規模は重要でない

  • 介入群と対照群がランダムに決定されていれば、グループの規模に違いがあっても問題ない。

研究事例

メタボ健診と長生きの因果関係

  • 健診を受けても長生きにはつながらない。
  • デンマークの研究。
  • 健診を受けた介入群の中で、病気のリスクが高かった人は保健指導を受け、生活習慣が改善された。
  • 生活習慣の改善にも関わらず、介入群と対照群の死亡率の差は統計的に有意でなかった。

メタアナリシス

  • 健診に全く意味がないとは言えない。
  • 糖尿病や高血圧を早期に治療することで、生活の質を改善できる可能性がある。

医療費の自己負担割合と健康の因果関係

  • 自己負担割合を引き上げれば、コンビニ受診を抑制し、医療費を削減できると期待される。
  • ニューハウス(ハーバード大)の'71-'86の実験。
  • 自己負担割合0の対照群と、3種類の自己負担割合を設定した介入群を比較。
  • 自己負担割合が高まると、受診・入院の回数が減り、国全体での医療費が減少する。
  • 自己負担割合と健康状態の因果関係はない。
  • 所得が低く健康状態が悪い人に限れば、自己負担の増加が健康状態を悪化させる。

ホルモン補充医療

  • 男性と比べて女性は動脈硬化による病気リスクが低いが、閉経した女性は心筋梗塞になる確率が上がるため、女性ホルモンが効いているという仮説があった。
  • ホルモン補充医療を受ける介入群と受けない対照群を比較。
  • 介入群は乳がんの発生率が統計的に有意に高い。
  • その後の研究で、ホルモン補充医療を受けると心筋梗塞のリスクが高まることが分かった。

 

自然実験

定義

制度変更や自然災害などの予想されない外生的ショックにより、研究対象が介入群と対照群に自然に分かれた状況を利用する因果推論方法。

研究事例

男性医師は女性医師より優秀?

  • ‘11-‘14年のアメリカのデータ。
  • 担当医の性別で、入院から30日以内に死亡する確率の差の有無を検証。
  • ホスピタリストに注目した。ホスピタリストは患者を選べず患者も担当医を選べないため、患者が男性医師と女性医師にランダムに割り付けられる。
  • 女性医師が担当すると死亡率が0.04%低い。
  • 女性医師の方がガイドラインに沿った診療をする割合が高く、患者とのコミュニケーションも密接であるという過去の研究がある。

出生時体重と健康の因果関係

  • 日本は底出生体重児が多い。
  • アメリカ、ノルウェー、カナダ、台湾などの研究。
  • 出生時体重が重い方が、成績・学歴・収入・健康状態が良好。
  • 日本の研究でも、出生時体重が重いほど中学卒時の成績が良い。

 

差の差分析

定義

差1:介入群の前後比較A(t+1)-A(t)と、差2:対照群の前後比較B(t+1)-B(t)、の「2つの差」の差を求める。

差の差分析の前提条件

1.介入群と対照群が介入前に平行なトレンドを持つ。

2.介入以外の別の変化が起きていない。

前後比較デザインには意味がない

1.トレンドの影響を考慮していない。

  • 放っておいても変化していた可能性がある。

2.平均への回帰

  • 介入前に平均から乖離していれば、平均への回帰が生じる可能性がある。

研究事例

認可保育所数と母親の就業

  • 1990-2010年の日本の県別データ。
  • 保育所定員率と母親の就業には因果関係がない。
  • 原因として、認可保育所が私的な保育サービスを代替しているだけという可能性が考えられる。
  • 保育所の整備が母親の就業を促さなくても、保育の専門家集団であることを考えれば、子どもの発達や健康にはプラスの影響がある可能性はある。
  • アメリカ、フランス、ノルウェーでも同様の結果になっている。

最低賃金と雇用の因果関係

スケアード・ストレート

  • 恐ろしいと感じさせる事で、正しい行動をとることを学ばせるもの。
  • スケアード・ストレートを受講した介入群は受講しなかった対照群よりも、その後の人生で犯罪に関わる確率が高かった。

 

操作変数法

定義

「原因に影響を与えることでしか結果に影響を与えない」という操作変数を用いて、介入群と対照群を比較可能にする方法。

操作変数方の前提条件

1.関連性と

2.操作変数と結果に影響を与える第4の変数が存在しない。

研究事例

テレビの視聴と学力の因果関係

  • ゲンコウらの‘48-'52のアメリカの研究。
  • 操作変数は「‘48-'52にテレビを所有したか否か」。
  • 幼少期にテレビを見ると小学校入学後の偏差値が0.02高い。
  • 特に、英語が母語でない、母親が低学歴、白人でない、などの場合は成績が上がる効果が大きい。
  • 一方で経済的に豊かな家庭では、プラスの効果は小さいかマイナス。

母親の学歴と子どもの健康

  • カリーらのアメリカの研究。
  • 操作変数「17歳時点での自宅と大学の距離」→説明変数「母親の学歴」→被説明変数「子どもの健康」
  • 母親が大卒だと子どもの健康状態がよい。
  • 高学歴な母親は、妊娠中の喫煙率が低く、妊娠健診に行く確率が高い。

女性管理職と企業の成長の因果関係

  • アハーンらのノルウェーの研究。
  • ノルウェーでは「2008年までに女性取締役比率が40%に満たない企業を解散させる」という法律が2003年に施行された。
  • 操作変数「法律施行前の各企業の女性取締役比率」。
  • 女性取締役比率の上昇は企業価値を低下させた。
  • 企業は資質に欠ける女性を取締役にして急場をしのいだため、企業価値が低下した。

 

回帰不連続デザイン

定義

カットオフ値の両サイドで介入群と対照群が分かれる状況を利用して因果関係を推定する方法。

回帰不連続デザインの前提条件

  • カットオフ値の周辺で、結果に影響を与える他のイベントが起きていない。

研究事例

友人の学力と自分の学力の因果関係

  • 友人から受ける影響をピア効果と呼ぶ。
  • アングリスト他のアメリカの研究。
  • 「エリート高校」の入試を、合格ラインぎりぎりで受かった生徒と落ちた生徒のその後の学力を比較。
  • カットオフ値の前後での学力のジャンプはないく、因果関係はない。

チャンスのあるところへの引越し

  • アメリカ政府の政策。
  • 子どものいる貧困家庭を対象に抽選し、当選者は貧困率の低い地域に引っ越せる。
  • 引越し先では学力の高い友人と学校生活を送るが、抽選に外れた子どもたちと比べても学力に有意な差がない。

医療費の自己負担割合と死亡率の因果関係

  • 重岡による日本の研究。
  • 自己負担割合は70歳までは3割で70歳を超えると1割。
  • 70歳前後で外来患者数や入院患者数にジャンプがあるが、死亡率はジャンプしない。
  • ただし重岡の研究では長期的な健康への影響や貧困層への影響を評価していない点には注意が必要。

 

マッチング法

 

定義

結果に影響を与えるような共変量を用いて、対照群の中から介入群によく似たサンプルをマッチさせて、比較する方法。

プロペンシティ・スコア・マッチング

  • 複数の共変量をまとめて1つの得点にし、この得点を用いてマッチングを行う。
  • 介入群と対照群からプロペンシティ・スコアが近いものを順次マッチングする。

マッチング法の前提条件

1.結果に影響を与えるような全ての共変量が数値化されたデータとして存在する。

2.全ての共変量がプロペンシティ・スコアの計算に用いられている。

研究事例

大学の偏差値と収入の因果関係(1)

  • クルーガー他のマッチング法によるアメリカの研究。
  • アメリカでは偏差値ではなくSATスコアを用いる。また、筆記試験以外に高校の成績や推薦状などにより総合的に合否が判断される。
  • A大学とB大学に合格しC大学に不合格だった2人が、片方は偏差値が高いA大学に、他方は偏差値が低いB大学に進学したとする。この2人の収入を比較する。
  • 卒業後の賃金に統計的に有意な差がない。
  • ただし人種的マイノリティや貧困層には当てはまらない。

大学の偏差値と収入の因果関係(2)

  • ブラック他のプロペンシティ・スコア・マッチングによるアメリカの研究。
  • 共変量として、年齢、人種、出生地、成績、出身校の規模、などを用いた。
  • 結果はクルーガー他と同じ。

 

分析の妥当性と限界

妥当性

内的妥当性

  • 内的妥当性とは2つの変数の間に因果関係があることの確からしさを意味する。
  • 研究対象と同一の集団に同一の介入をした場合の、結果の再現性の程度。

外的妥当性

  • 研究対象と異なる集団に同一の介入をした場合の、結果の再現性の程度。
  • 例えばアメリカでの研究結果が日本でそのまま当てはまるかは、慎重に考える必要がある。

ランダム化比較試験の限界

1.費用が大きい

2.外的妥当性の問題

  • ランダム化比較試験では研究対象が厳選される傾向がある。

3.倫理的な問題による実施可能性

  • タバコと癌の因果関係を調べるためにタバコを吸わせるのは難しい。

4.ランダム化失敗

  • 実験計画どとりにランダムに割り付けられなかったり、実験中に対照群から介入群への移動が生じる可能性がある。

5.ランダム化比較試験と現実の相違

  • ランダム化比較試験での結果より実社会に導入したときの効果が小さくなる問題。

強いエビデンス

  • ランダム化比較試験のエビデンスが高いのは、因果関係の確認ポイントを全て満たす確実な方法であるから。
  • 逆に観察データであっても、因果関係の確認ポイントが満たされていれば強いエビデンスとなりうる。

 

留意点

不正確な記述がある模様。

ツイッター @dojin_tw より

第一に図表5-3の「第3の変数が操作変数であるための条件(2)」だが、この「操作変数と結果両方に影響に与えるような第4の変数が存在してはならない」というのは正しくない。「観察不可能な第4の変数」ならば正しい。観察可能な変数ならば、その「第4の変数」を制御した上でIV推定可能。

 

第二に、より些末だが、回帰不連続デザインの前提条件として「カットオフ値の周辺で結果に影響を与えるようなほかのイベントが起きていないこと」とあるが、「カットオフ周辺で結果に影響を与える他のイベント」でも、カットオフでそのイベント発生や影響が不連続に変化しなければ原則問題ないはず。

 

中室・津川(2017)『「原因と結果」の経済学』についてだが、差の差分析の説明についても、ややミスリーディングな記述という印象を受けてしまった(重ねていうが別にあらさがしをしたいわけではない)。それは「1つ目の前提条件」の「並行トレンド」の説明の仕方が厳密には正しくないことだ続

 

承前:「並行トレンド」の前提条件は、"common (parallel) trend assumption"と呼ばれるものだが、これは中室津川本で説明されているように「介入前のトレンドが平行である」ということではなく、正しくは「介入がなければトレンドが平行だったはず」ということ続

 

承前:両者の差は些末に思えるかもしれないが、理屈としては「介入前のトレンドが平行」でも「介入がなければトレンドが平行」が成立しないこともあるし、その逆もまた然り。そして差の差による識別のために必要な仮定はあくまで「介入前」の話ではなく「介入がなければトレンドが平行」という仮定だ続

 

承前:確かに「介入前のトレンドが平行」であれば「介入がなければトレンドが平行(のはず)」という蓋然性も高くなる。であるが故に多くの実証論文(少なくとも上位ジャーナル)では「介入前のトレンドが平行」をチェックする。しかし、それは差の差の妥当性の「間接的なチェック」にすぎない続