「因果分析」における必須概念【30選】

はじめまして、データサイエンティストのますみです！

本記事では、「因果分析」に挑戦する上で知っておくべき概念を紹介していきます。

少し難解な内容も含まれますが、なるべく例も交えて解説します。

具体的に、この記事で紹介する概念は次の通りです。

No	用語（日本語）	用語（英語）
1	因果	cause and effect
2	因果関係	causal relationship
3	因果性	causality
4	因果律	causal law
5	因果的説明	causal explanation
6	因果的思考	causal thinking
7	交絡因子	confounding factor
8	未観測交絡因子	unmeasured confounder
9	反実仮想	counterfactual
10	潜在的結果変数	potential outcome variable
11	因果推論の根本問題	the fundamental problem of causal inference
12	双方向因果	causal relationship in both directions
13	因果効果	causal effect
14	個体レベルの処置効果を	individual treatment effect（ITE）
15	平均処置効果として	average treatment effect（ATE）
16	処置群における平均処置効果	average treatment effect on the treated（ATT）
17	対照群における平均処置効果	average treatment effect on the untreated（ATU）
18	条件付き処置効果	conditional average treatment effect（CATE）
19	因果分析	causal analysis
20	因果推論	causal inference
21	因果探索	causal discovery
22	因子	factor
23	因子分析	factor analysis
24	共通因子	common factor
25	因子負荷量	factor loading
26	独自因子	unique factor
27	介入	intervention
28	中間変数	intermediate variable
29	ランダム化比較試験	randomized controlled trial（RCT）
30	二重盲検ランダム化比較試験	double-blind RCT

因果とは？
交絡因子とは？
反実仮想とは？
双方向因果とは？
因果効果とは？
因果分析とは？
- 因果推論とは？
- 因果探索とは？
因子分析とは？
介入とは？
ランダム化比較試験とは？
その他のおすすめ記事
最後に
📩 仕事の相談はこちら 📩
🚀 新サービス開始のお知らせ 🚀
参考文献

因果とは？

そもそも因果とは何だろうか？

「因果（cause and effect）」とは、ある事象が別のある事象に対して影響を与えている時の「原因と結果」である。例えば、「Aという薬を飲んだら、熱が下がった。」というときに、原因は薬を飲んだことであり、結果は熱が下がったことである。このような因果を示すことは非常に難しいが、ここではそうであると仮定する。

このような因果が示された関係性のことを「因果関係（causal relationship）」や「因果性（causality）」という。因果関係が生じる背景として、「因果律（causal law）」というある時刻における事象（原因）があれば、未来の時刻における事象（結果）が必然的に生じるという原理がある。

このような因果関係を説明することを「因果的説明（causal explanation）」といい、因果関係を推定する思考を「因果的思考（causal thinking）」という。

交絡因子とは？

「交絡因子（confounding factor）」とは、原因事象と関連しながらも、結果事象と因果関係を持つ因子である。

例えば、「Aという薬を飲んだら、熱が下がった。」という例において、「Aという薬を飲んで、十分な睡眠を取ったため、熱が下がった。」という可能性もある。この時、睡眠という交絡因子が絡んでいるため、必ずしもAという薬を飲んだため、熱が下がったという因果を結論づけることはできない。

このように、観測しきれていない交絡因子を「未観測交絡因子（unmeasured confounder）」という。未観測交絡因子がないことが因果関係を示すための前提条件となるため、因果関係を示すことは難しい。

反実仮想とは？

「反実仮想（counterfactual）」とは、「実際にはAをしたが、仮にAをしなかったとしたら」という実際の選択とは別の選択をとった場合を想定することを指す（「反事実」ともいう）。

先ほど例において、Aという薬を飲んだという条件と飲まなかった条件は同一個体において同時には成り立たない。因果分析では、この制約があることを前提として、原因の効果の差分を示す。ここで、同一個体に時間を空けて薬を飲んでもらうという考え方もあるが、その場合、それぞれの条件が同一であるということを前向きに示す必要がある。また、一つ目の条件で介入した結果が二つ目の条件で介入する時に交絡する可能性もあり、完全に介入効果がウォッシュアウトできたことを示す必要もある。

また、Aという薬を実際に飲んだ条件の結果観測できた結果変数に対して、反実仮想の条件の場合観測させるはずの変数を「潜在的結果変数（potential outcome variable）」という。

ここで、Aという薬を飲むという介入を行なってしまうと、その介入行わなかった場合のデータ（潜在的結果変数）を観測できなくなってしまうことを「因果推論の根本問題（the fundamental problem of causal inference）」という。

そのため、「因果の証明」は非常に難易度の高い問題だと言われている（詳細は下記を参照）。

参考

「因果の証明」が難しい4つの理由

ai-lab

双方向因果とは？

「双方向因果（causal relationship in both directions）」とは、両方向に因果が働いている因果を指す。

例えば、Morita et al.（2005）は、「高齢郡において、うつ状態と運動の実施状況との間に双方向の因果関係を認めた。」という報告をしている。このように、うつ状態になれば、運動の実施状況が低下し、運動の実施状況が低下すると、うつ状態になりやすいというような非常に複雑なモデルになることがある。

このような複雑な関係を示すことは難しく、一部の因果推論の手法では一方向の因果であることを仮定する必要があるほどである。

因果効果とは？

「因果効果（causal effect）」とは、ある原因がある結果に及ぼす影響の強さである。

ITEとATEとは？

因果効果（処置効果）は、個体レベルと集団レベルに分けることができる。

個体レベルの処置効果を「individual treatment effect（ITE）」と呼び、集団レベルの処置効果を平均処置効果として「average treatment effect（ATE）」と呼ぶ。

ATTとATUとは？

また、因果効果（処置効果）は、処置群と対照群に対する処置効果に分けることもできる。

処置群における平均処置効果を「average treatment effect on the treated（ATT）」と呼び、対照群における平均処置効果を「average treatment effect on the untreated（ATU）」と呼ぶ。

CATEとは？

上記の分類には含まれない条件に応じた処置効果（条件付き処置効果）を「conditional average treatment effect（CATE）」と呼ぶ。例えば、Aの薬による男性に対する処置効果の場合、性別が男性という条件が付いた時の処置効果になる。

因果分析とは？

「因果分析（causal analysis）」とは、因果に関して理解するための分析手法である。特に、ある現象の裏側に隠れた要因を特定することが多い。

因果分析の図書を読むと、「因果推論（causal inference）」と「因果探索（causal discovery）」という二つのワードが登場する。初めて因果分析を学ばれる方は、これらを混同することがあるが、全く異なる概念である。

因果推論とは？

因果推論とは、「何らかの施策を実施した後、その施策の効果を推定する手法」である。

例えば、テレビCMを実施したことによる効果を推定したい場合は、因果推論を行う。

因果推論を行うためのアルゴリズムとしては、次のような手法があげられる。

回帰分析を用いた因果推論
回帰不連続デザイン（Regression Discontinuity Design、RDD）
逆確率重み付け法（Inverse Probability of Treatment Weighting、IPTW）
Doubly Robust法（DR法）
差分の差分法（Difference in Differences、DiD）
パス解析
構造方程式モデリング（Structural Equation Modeling、SEM）
T-Learner
S-Learner
X-Learner
DR-Learner

因果探索とは？

因果探索とは、「複数項目のデータを収集した後、それらの項目の間に因果関係があるかを探索する手法」である。

例えば、社員への労働環境に関するアンケート調査を実施した後、労働環境のどのような項目が働きやすさやQOLなどに影響しているかを探索するような場合は、因果探索を行う。

因果探索を行うためのアルゴリズムとしては、次のような手法があげられる。

LiNGAM（Linear Non-Gaussian Acyclic Model）
ベイジアンネットワーク
SAM（Structural Agnostic Model）

因子分析とは？

まず「因子（factor）」とは、ある結果を引き起こす要因である。

「因子分析（factor analysis）」とは、各変数の背後に存在する因子を特定する手法である。例えば、期末試験で10科目の教科のテストを受けた時、因子分析を行うと、「全体的な知能」、「理系知能」、「文系知能」、「創造的知能」などの因子に分けることができるかもしれない。

具体的な因子分析の方法としては、少数の「共通因子（common factor）」を用意し、それぞれの共通因子に対して「因子負荷量（factor loading）」を掛け合わせて和をとり、最後に「独自因子（unique factor）」を足し、複数の等式における因子負荷量の最適化を行うことで、因子の特徴を知ることができる。ここで、因子負荷量とは結果変数に対する共通因子の影響度を表した係数である。独自因子とはその結果変数に対する独自な因子（残差のようなもの）である。

また、分析の結果求まった各共通因子に対する解釈は、分析者によって恣意的に行う。

ここで、注意すべき点として、因子分析は因子を求めているだけで、因果を示しているものではないという点がある。ちなみに、構造方程式モデリングにおいて、潜在変数の導出を行う際に因子分析が必要にはなるため、その点での関連性はある。

介入とは？

「介入（intervention）」とは、原因となる変数を操作することである。もしもAという変数に介入し、結果としてBという事象が変化した場合、コントロール可能な関係であると考えることができる。ここで、なぜ因果関係があると断言しなかったかというと、「中間変数（intermediate variable）」が存在し、直接的な因果関係ではない可能性もあるからである。

変数Aに介入する時、数式ではdo(A = 1)と表し、これを「doオペレータ」という。

ランダム化比較試験とは？

ここまで因果分析に関する概念を中心に説明したが、ここでは具体的にどのように因果を示すための「ランダム化比較試験（randomized controlled trial、RCT）」を説明する。RCTでは、介入する対象をランダムに割り付けることにより、バイアスを低減する実験手法である。実際の臨床研究でも使われる手法で、反実仮想を擬似的に作っているが、実際には対象個体の分散は生じてしまう。

また、ランダム化を行う際に、介入を行う実験者および被験者におけるバイアスを低減するために、実験群と対照群のどちらに割り振られているかマスキングする「二重盲検ランダム化比較試験（double-blind RCT）」もある。