6주차 (11차시) 보충강의: 인과추론(Causal Inference)
인과추론은 한 사건(원인)이 다른 사건(결과)을 초래하는지를 분석하는 과정으로, 특히 의학, 사회과학, 경제학 등에서 중요한 연구 방법론입니다. 인과추론은 전통적 추론 방식과도 연계되어 있으며, 주로 귀납적 접근에 기반을 두고 있습니다.
(1) 사회과학 분야의 학생들이 스스로 “원인이 무엇인지” 밝히는 주장을 자주 하면서도, 좋은 인과추론이 갖추어야 할 요건들을 잘 준수하지 못하는 경향이 있거나, 기껏해야 상관관계를 보여주는데 그치는 반면,
(2) 정작 타인의 원인이 무엇인지 밝히는 어떤 논변에 대한 반론을 전개할 때에는, “상관관계에 불과하다.”는 수준의 반론에 머물고 있습니다.
이는 인과추론이 갖추어야 할 요건을 지키려는 의식적 인지가 부족하기 때문입니다. 사회과학도들이 인과추론에 대해 잘 모른다는 것은 의외입니다. 사회과학 연구의 많은 부분은, 어떤 좋지 않은 결과의 원인을 밝힘으로써 그 원인을 제거하는데 도움을 주거나, 반대로 어떤 좋은 결과를 발생시킬 정책을 생산하는데 도움을 주는 데 그 의의가 있다고 해도 과언이 아닙니다. 따라서, 어떤 현상의 원인 또는 인과적 과정을 밝히는 작업은 사회과학적 연구에서 매우 중요하며 빈번하게 수행됩니다. 따라서 사회과학도라면 인과추론에 대해 신경을 좀 쓸 필요가 있습니다. 학부의 사회과학 정규 과정에 인과추론 방법론 강의가 필수교과로 도입될 필요가 있어 보입니다.
그래서 인과추론 보충강의를 준비했습니다!
Table of contents
- I. 인과추론의 기초
- II. (심화편) 인과추론 접근법
- III. (비교) 규범적 논의에서의 인과와 원인
I. 인과추론의 기초
1. 인과추론의 구조
인과추론은 세 가지 주요 요소로 구성됩니다.
- 원인(Cause): 결과를 유발하는 주장되는 사건이나 상태
- 결과(Effect): 원인에 의해 발생한 사건이나 상태
- 인과 메커니즘(Causal Mechanism): 원인이 결과를 초래하는 과정 또는 방식을 설명
2. 인과추론의 방법론
인과관계를 도출하기 위해 여러 연구 설계와 분석 기법이 활용됩니다.
- 실험연구(Experimental Studies)
- 무작위 할당을 통해 실험군과 대조군을 구성하고 개입 효과를 측정
- 인과관계 입증에 강력함
- 관찰연구(Observational Studies)
- 자연 상태의 데이터를 수집해 통계적 방법으로 원인과 결과의 관계를 분석
- 제3의 변수(Confounding Variables)를 통제하는 다양한 기법이 필요함
- 인과모델(Causal Models)
- 변수 간의 관계를 도식화하거나 수학적 모델(예: 구조적 방정식 모델링)을 활용하여 인과관계를 추론
또한, 도구 변수(Instrumental Variables), 차이의 차이(Difference-in-Differences, DiD), 경향 점수 매칭(Propensity Score Matching, PSM) 등 다양한 통계적 기법들이 활용됩니다.
3. 인과추론의 논증적 취약점
인과추론에서 주의해야 할 오류와 한계는 다음과 같습니다.
- 상관관계와 인과관계의 혼동
- 두 변수 간 상관관계가 반드시 인과관계를 의미하지 않음
- 제3의 변수(Confounding Variables)
- 숨겨진 변수가 두 변수 간 관계를 왜곡할 수 있음
- 역인과(Reverse Causality)
- 결과가 원인에 영향을 미치는 경우를 잘못 해석할 위험
- 일반화의 오류
- 특정 집단이나 상황의 인과관계를 다른 상황에 그대로 적용하는 문제
4. 좋은 인과추론을 위한 필수 요소
- 명확한 인과관계 정의: 원인과 결과 변수의 명확한 설정
- 적절한 연구 설계: 무작위 통제 실험(RCTs)과 같은 엄격한 설계 또는 관찰연구에서의 통제 기법 활용
- 강력한 통계적 방법론: 정확한 모델링과 강건성 검증
- 외부 타당성과 재현성: 연구 결과의 일반화 가능성과 투명한 데이터 공개
- 비판적 사고: 연구 한계와 가정의 명확한 인식
5. 인과추론과 전통적 추론 방식의 상호보완성
인과추론은 주로 귀납적 추론에 기반해 경험적 데이터를 통해 인과관계를 도출합니다. 그러나 도출된 인과 모델은 연역적 추론을 통해 특정 상황에 적용되거나 예측을 검증하는 데 활용될 수 있습니다. 두 접근 방식은 서로 보완하여 보다 정확한 인과 관계 이해와 추론을 가능하게 합니다.
6. 강력한 상관관계 증명을 위한 실험설계
관찰연구에서 강한 상관관계를 확인하기 위해 다음과 같은 설계 요소들이 중요합니다.
- 대규모 샘플 사이즈: 우연의 영향을 최소화하여 통계적 검정력을 높임
- 종단적 연구 디자인: 동일한 집단을 여러 시점에 걸쳐 관찰하여 시간적 변화를 추적
- 다중 변수 통제: 공변량 분석이나 다변량 회귀 분석을 통해 제3의 변수 효과를 제거
- 반복 측정: 신뢰성을 확보하기 위한 여러 번의 측정
- 경향 점수 매칭(PSM): 비교 그룹 간의 유사성을 확보하여 상관관계의 견고성을 평가
- 감도 분석 및 크로스 밸리데이션: 다양한 분석 방법과 가정 하에서도 결과의 일관성을 확인
이러한 설계와 분석 기법은 인과추론뿐 아니라, 강력한 상관관계를 증명하고 이를 기반으로 한 인과관계 해석에도 기여합니다.
II. (심화편) 인과추론 접근법
다음은 인과추론 방법론에 보다 진지한 관심을 가질 사회과학도들을 위한 안내입니다.
1. 인과추론이란 무엇인가?
-
정의
인과추론(Causal Inference)은 두 변수 x와 y 간의 인과 관계, 즉 x가 y에 영향을 미쳤는가라는 질문에 데이터를 기반으로 답하고자 하는 방법론입니다. -
목적
단순한 상관관계를 넘어서 개입이 결과에 어떤 영향을 주는가를 분석하고, 정책 설계, 과학적 설명, 예측 모델링 등에 실제로 활용될 수 있도록 하는 데 목적이 있습니다. -
연구 역사
1980년대 이후 본격적인 연구가 시작되었으며, 다양한 분야(사회과학, 생명과학, 경제학, 컴퓨터과학 등)에서 학제적으로 확산되고 있습니다.
2. 인과추론의 대표적 접근법: 두 전통
인과추론에는 대표적으로 두 가지 학문적 전통이 존재합니다.
2.1 구조적 인과 모델링 (Structural Causal Modeling, SCM)
-
개념
Pearl 교수에 의해 주도된 접근으로, 변수들 간의 인과 관계를 도식화된 그래프(DAG: Directed Acyclic Graph)와 구조 방정식(Structural Equations)을 통해 표현합니다. - 주요 특징
- 반사실적 추론(Counterfactual Reasoning)을 가능하게 하는 형식 체계
- 통계적 상관관계와 인과관계를 수학적으로 구분
- 개입(intervention)의 효과를 ‘do-calculus’를 통해 분석 가능
- 컴퓨터 과학 및 인공지능 분야에서 널리 응용됨
- 대표 문헌
- Pearl, J., Glymour, M., & Jewell, N. P. (2016). Causal Inference in Statistics: A Primer. Wiley.
- Pearl, J. (2009). Causality. Cambridge University Press.
- Pearl, J., & Mackenzie, D. (2018). The Book of Why: The New Science of Cause and Effect. Basic Books.
2.2 잠재결과 모형 (Potential Outcome Framework, Neyman-Rubin Model)
-
개념
실험 단위가 x라는 처치(treatment)를 받을 경우와 받지 않을 경우 각각의 잠재적 결과(potential outcomes)를 상정하고, 그 차이를 인과효과로 간주합니다. - 기초 개념
- “개인이 처치를 받았을 때의 결과”와 “받지 않았을 때의 결과”는 동시에 관측될 수 없음 →
이를 “인과추론의 근본 문제(Fundamental Problem of Causal Inference)”라 부릅니다.
- “개인이 처치를 받았을 때의 결과”와 “받지 않았을 때의 결과”는 동시에 관측될 수 없음 →
- 핵심 가정: SUTVA
- Stable Unit Treatment Value Assumption은 두 가지 조건을 포함합니다:
1) 비간섭성(Non-interference) – 한 단위의 처치가 다른 단위의 결과에 영향을 주지 않아야 함
2) 일관성(Consistency) – 동일한 처치가 항상 동일한 효과를 가져야 함
- Stable Unit Treatment Value Assumption은 두 가지 조건을 포함합니다:
- 보완 기법
관찰 데이터에서는 완벽한 무작위화가 어려우므로, 다음과 같은 방법이 활용됩니다:- 도구변수(Instrumental Variables, IV)
- 경향 점수 매칭(Propensity Score Matching, PSM)
- 차이의 차이(Difference-in-Differences, DiD)
- 감도 분석(Sensitivity Analysis)
- 대표 문헌
- Rubin, D. B. (1974). Estimating Causal Effects of Treatments in Randomized and Nonrandomized Studies.
- Angrist, J. D., Imbens, G. W., & Rubin, D. B. (1996). Identification of Causal Effects Using Instrumental Variables.
- Imbens, G. W., & Rubin, D. B. (2015). Causal Inference for Statistics, Social, and Biomedical Sciences: An Introduction. Cambridge University Press.
3. 두 접근의 비교 및 상호보완성
| 항목 | 구조적 인과 모델링 (SCM) | 잠재결과 모형 (POF) |
|---|---|---|
| 대표 학자 | Judea Pearl | Donald Rubin, Guido Imbens |
| 주요 개념 | 인과 그래프, 구조 방정식, do-연산 | 처치(treatment), 잠재결과, 평균처치효과(ATE) |
| 추론 방식 | 반사실적 기반 추론, 수학적 모델링 | 확률적 추정, 통계적 균형 가정 |
| 응용 분야 | 컴퓨터과학, 인공지능, 인지과학 | 경제학, 정책평가, 의학 |
| 대표적 강점 | 개입 효과의 명시적 모델링 | 통계 추정과 검정에 강함 |
→ 두 접근은 경쟁 관계라기보다 상호보완적입니다. 분석 대상, 데이터 구조, 연구 목적에 따라 적절히 선택하거나 혼합할 수 있습니다.
4. 현실 적용과 한계
-
연구 확대:
사회과학, 정책학, 경제학을 중심으로 인과추론이 활발히 연구되고 있으며, 데이터과학과도 연결되고 있습니다. -
공간 데이터 등 새로운 영역으로 확장:
인과추론이 시간뿐 아니라 공간적 상호작용을 분석하는 데도 사용되며, 지역 간 정책 영향 분석 등에 활용 가능성이 큽니다. -
한계 인식:
- 모든 데이터가 SUTVA 가정을 만족하는 것은 아님
- 특히 교육, 사회 정책 등에서는 개인 간의 상호작용이 존재함
- 통계적 기법만으로 해결되지 않는 해석의 불확실성도 존재함
5. 자료 및 학습 참고
- 유튜브 강의
- 박지용 교수 (University of Georgia):
Causal Data Science 채널
강의자료 사이트
- 박지용 교수 (University of Georgia):
- 국내 참고 강의 및 자료
- 이권상 교수(통계학과), 이상학 교수(데이터사이언스대학원)의 강의 및 자료 참조.
6. 결론
- 인과추론은 단순한 상관관계를 넘어 개입의 효과를 분석하고 해석하는 논리적·실증적 도구입니다.
- 두 접근법(SCM과 POF)은 각자의 논리 구조와 방법론적 강점을 지니며, 연구 목적에 따라 유연하게 사용될 수 있습니다.
- 앞으로 공공정책, 데이터과학, 인공지능, 사회과학 전반에서의 핵심 역량으로 자리잡을 분야입니다.
III. (비교) 규범적 논의에서의 인과와 원인
Legal and Moral Attribution vs. Social-Scientific Causation
(형법적/도덕적 귀속과 사회과학적 인과의 비교)
1. 서론
‘인과(causation)’ 개념은 윤리학, 형법 이론, 사회과학을 포함한 다양한 학문 분야에서 핵심적인 역할을 한다. 그러나 각 분야에서 사용되는 인과 개념은 그 의미와 기능, 정당화 방식에 있어 상당한 차이를 보인다. 윤리학과 형법에서는 인과 판단이 책임, 정당성, 비난 가능성과 밀접히 연결되어 있으며, 단순한 사실적 인과를 넘어 법적 또는 도덕적 귀속(attribution)의 기준이 적용된다. 반면 사회과학에서는 인과 추론이 경험적 설명과 예측에 초점을 맞추며, 확률적 모델과 통계적 기법을 통해 체계적으로 접근된다.
본 항목은 도덕적 및 형법적 귀속에서의 인과 개념과 사회과학적 인과 개념을 비교·검토하며, 각 영역에서 ‘원인’이란 무엇을 의미하는지, 어떤 방식으로 인과성을 판정하고 활용하는지에 대한 이론적 차이와 접점을 조명한다.
2. 도덕철학에서의 인과 귀속 (Causal Responsibility)
도덕철학에서 인과는 도덕적 책임, 칭찬 또는 비난 가능성, 의무와 권리의 귀속을 판단하는 핵심 요소다. 한 행위자가 어떤 해악에 도덕적으로 책임이 있는지를 따질 때, 그 행위가 해악의 ‘원인’이 되었는지 여부는 중요한 판단 기준이 된다. 그러나 단순한 인과 관계가 있다고 해서 자동으로 책임이 발생하는 것은 아니다. 인과는 언제나 보다 넓은 평가적 틀 속에서 해석된다.
예를 들어, 브레이크 고장으로 인해 운전자가 보행자를 치는 상황을 생각해 보자. 행위는 사실적 인과를 갖지만, 철학자는 이 행위가 예측 가능했는지, 회피 가능했는지, 적절한 예방 조치를 취했는지 등을 묻는다. 이러한 질문은 인과 개념을 통제력과 의무, 합리적 기대라는 규범적 기준과 연결시킨다.
현대 도덕철학에서는 집합적 책임, 과잉결정(overdetermination), 부작위(omission)의 인과적 지위 등도 활발히 논의되며, 분산된 인과 구조 속에서의 책임 귀속 문제를 다룬다.
3. 형법 이론에서의 법적 인과 (Legal Causation)
형법 이론, 특히 독일 및 대륙법 전통을 따르는 국가들에서는 사실적 인과(factual causation)와 법적 인과(legal causation) 또는 객관적 귀속(objective imputation)을 구분한다. 이는 범죄 책임 이론의 핵심 구조를 구성하는 중요한 구분이다.
3.1 사실적 인과
사실적 인과는 일반적으로 조건설(conditio sine qua non) 또는 but-for 테스트로 판단된다.
피해가 발생했을까? 가해자의 행위가 없었다면 피해는 발생하지 않았을까?
이러한 테스트는 필수적이지만, 실제 책임 판단을 하기에는 너무 느슨하거나 과도하게 확장될 수 있다.
3.2 법적 인과와 객관적 귀속
형법은 사실적 인과에 덧붙여, 특정 결과가 피고인에게 법적으로 귀속될 수 있는지 여부를 따진다. 독일 형법 이론에서는 이를 객관적 귀속(Objektive Zurechnung)이라 하며, 다음과 같은 요건들을 요구한다:
- 행위가 법적으로 금지된 위험을 창출하였고,
- 그 위험이 결과를 통해 실현되었으며,
- 결과 발생까지의 인과 사슬이 개입 원인(Drittverursachung)에 의해 단절되지 않았을 것
이 틀은 인과 판단에 규범적 필터를 부여함으로써, 법적으로 금지된 행위만을 책임 대상으로 한정하고자 한다.
3.3 목적론적 행위 이론
또 다른 독일 형법의 전통으로는 한스 벨첼(Hans Welzel)이 제안한 목적론적 행위 이론(Finalismus)이 있다. 이 이론은 행위를 내적 목표 지향적 구조로 간주하며, 단순한 외적 인과가 아니라 의도적 행위 구조와 사회적 규범의 통합으로 이해하려 한다.
이러한 접근은 ‘인과’ 개념을 보다 본질적으로 도덕적 판단과 결합된 의미로 해석하게 한다.
4. 사회과학에서의 경험적 인과
사회과학에서의 인과 개념은 현상을 설명하거나 미래를 예측하기 위한 도구로 기능한다. 이때의 인과는 정규화된 경험적 관찰과 통계적 방법을 통해 밝혀지며, 윤리적·법적 책임과는 별개의 목적을 지닌다.
4.1 인과 추론의 대표적 방법론
현대 사회과학에서 인과 추론은 두 가지 주요 접근법에 의해 주도된다:
• 잠재결과 모형 (Potential Outcome Framework, Neyman–Rubin Model)
- 처치(treatment)를 받았을 때와 받지 않았을 때의 잠재적 결과(potential outcomes)를 비교하여 인과 효과를 정의한다.
- SUTVA(안정적 처치 값 가정), 처리 무작위성 등의 조건이 필수적이다.
• 구조적 인과 모델링 (Structural Causal Modeling, SCM)
- 유디아 펄(Judea Pearl)에 의해 제안된 이 모델은 인과 그래프(DAG)와 구조 방정식을 통해 변수 간 인과 관계를 설명한다.
- do-연산자를 사용하여 개입(intervention)의 결과를 추론할 수 있다.
4.2 매개 변수와 교란 변수
사회과학에서는 매개 메커니즘(mediation)이나 교란 변수(confounders)를 통제하는 것이 중요하다.
이를 위해 도구변수법, 경향 점수 매칭, 차이의 차이(DiD), 감도 분석 등의 기법이 활용된다.
5. 법적·도덕적 인과와 사회과학적 인과의 비교
| 항목 | 도덕 및 형법적 인과 귀속 | 사회과학적 인과 추론 |
|---|---|---|
| 목적 | 책임, 귀속, 정당화 판단 | 설명과 예측 |
| 핵심 질문 | 이 결과를 행위자에게 귀속시켜야 하는가? | X가 Y를 (얼마나) 유발했는가? |
| 방법론 | 사례 기반, 규범적 평가 | 통계, 그래프, 모델 기반 |
| 행위자의 의도 | 핵심 요소 (특히 윤리학) | 메커니즘의 일부가 아니라면 무관 |
| 부작위 | 일정 조건하에 인과로 인정 | 모델화 어려움 |
| 인과 형식 | 질적 판단, 귀속 기준 | 양적 추정, 평균 처리 효과 등 |
이 둘은 언어는 비슷하지만 기준과 기능이 근본적으로 다르며, 실제 정책이나 판례 판단에서는 종종 동시적으로 고려되어야 한다.
6. 철학적 논의
인과에 대한 철학적 논의는 데이비드 흄의 회의주의에서 현대의 반사실적 이론 및 개입주의 이론으로 이어진다.
- 하트(H.L.A. Hart)와 오노레(Tony Honoré)의 『법에서의 인과』는 법적 인과 판단은 일상적 인과 직관을 반영하지만, 규범적 고려에 의해 형성된다고 주장한다.
- 마이클 무어(Michael Moore)는 『Causation and Responsibility』에서 법과 도덕에서의 책임은 실재하는 인과적 관계에 기반해야 한다는 실재론적 입장을 옹호한다.
- 반면, 사회과학자들은 인과의 형이상학적 본질보다는 모델에 의한 추론 가능성에 집중한다.
7. 결론
‘인과’는 분야에 따라 매우 상이한 개념적 틀을 갖는다.
윤리학과 형법에서는 인과가 누가 책임져야 하는가를 따지기 위한 규범적 도구로 작동한다.
사회과학에서는 세계를 설명하고 예측하기 위한 경험적 도구로서의 인과가 강조된다.
이 두 인과 개념은 겉보기에는 유사한 용어를 사용하지만, 그 정당화 조건, 기능, 판단 기준은 서로 다르다. 그러나 이 둘을 정확히 구분하고 동시에 연결지을 수 있다면, 정책, 과학, 도덕, 법률 판단 사이의 소통을 보다 정밀하게 수행할 수 있다.
References
- Hart, H. L. A., & Honoré, Tony. Causation in the Law. Oxford University Press, 1985.
- Roxin, Claus. Strafrecht – Allgemeiner Teil, Vol. I. C.H. Beck, 2006.
- Welzel, Hans. Das Deutsche Strafrecht. de Gruyter, 1969.
- Moore, Michael. Causation and Responsibility. Oxford University Press, 2009.
- Pearl, Judea. Causality: Models, Reasoning and Inference. Cambridge University Press, 2009.
- Rubin, Donald B. (1974). “Estimating Causal Effects of Treatments in Randomized and Nonrandomized Studies.” Journal of Educational Psychology 66(5): 688–701.
- Imbens, Guido & Rubin, Donald. Causal Inference for Statistics, Social, and Biomedical Sciences. Cambridge University Press, 2015.