Angrist & Evans (1998) 사례 연구를 중심으로 — MHE Chapter 4 보충 자료
Treatment Effects: ATE, ATT, ITT, LATE
English핵심 메시지
"효과가 얼마인가?"가 아니라 "누구에 대한 효과인가?"가 핵심이다 — 같은 처치라도 대상 집단에 따라 다른 추정치(ATE, ATT, ITT, LATE)가 도출된다. 어떤 추정량을 식별하는지 이해하는 것이 올바른 해석과 정책 설계의 출발점이다.
1. Treatment Effect 추정량
ATE Average Treatment Effect (평균 처치효과)
전체 모집단에서 처치를 받았을 때와 받지 않았을 때의 평균적 결과 차이.
- 모든 개인이 처치를 받았다면 vs 모두 받지 않았다면의 비교
- 보편적 정책(예: 전 국민 의무 프로그램)을 고려할 때 관련됨
- 반사실(counterfactual)이 관측 불가 → 강한 가정이나 완벽한 RCT 필요
ATT Average Treatment Effect on the Treated (처치자 평균 처치효과)
실제로 처치를 받은 집단에서의 평균 인과효과.
- 처치자의 실제 결과 vs 만약 처치를 받지 않았다면의 결과 비교
- 자발적 프로그램 평가에서 관련됨
- 효과가 큰 사람이 선택적으로 참여하면 보통 ATT > ATE
ITT Intent-to-Treat (처치 의도 효과)
실제 처치 수령 여부와 무관하게, 처치에 배정된 것의 효과.
- Z는 처치 할당, D는 실제 처치 수령
- 항상 불편추정치 — 비순응이 있어도 무작위화를 보존
- 프로그램을 제공하는 것의 현실적 효과 반영 (비참여 포함)
- |ITT| ≤ |LATE| — ITT = LATE × 순응률이므로
LATE Local Average Treatment Effect (국소 평균 처치효과)
도구변수에 의해 처치 상태가 바뀌는 순응자(compliers)에 대한 평균 인과효과.
- 순응자에만 적용 — 항상-처치자와 비순응자 제외
- 단조성(monotonicity) 가정 필요 (거역자 없음)
- 다른 도구변수 → 다른 순응자 → 다른 LATE
- RDD도 cutoff 근처 순응자에 대한 LATE로 해석 가능
핵심 비교
| 추정량 | 대상 집단 | 주요 상황 | 방법론 |
|---|---|---|---|
| ATE | 전체 모집단 | 보편적 정책 효과 | RCT (완전 순응) |
| ATT | 처치 받은 집단 | 자발적 프로그램 평가 | DID, Matching/PSM |
| ITT | 할당받은 집단 | 비순응 있는 RCT | 축약형(Reduced form) |
| LATE | 순응자(Compliers) | IV / RDD 추정 | 2SLS, Wald 추정량 |
2. 사례 연구: Angrist & Evans (1998)
연구 질문: 셋째 자녀 출산이 여성의 노동공급을 인과적으로 감소시키는가?
식별 문제
자녀 2명 vs 3명 이상인 어머니의 단순 OLS 비교는 인과관계와 선택을 혼동한다: 자녀가 많은 여성은 본래 가정 중심적 선호가 강할 수 있어 자녀 수와 노동공급 모두에 영향을 미친다.
셋째 자녀를 위한 두 가지 도구변수
자녀가 2명 이상인 어머니를 대상으로, 셋째 자녀 출산(D) 확률에 대한 두 가지 외생적 변동 활용:
| 둘째 출산 시 쌍둥이 | 첫 두 자녀 동성 | |
|---|---|---|
| 논리 | 쌍둥이가 기계적으로 자녀 ≥3명을 만듦 | 부모가 성별 다양성을 선호 → 셋째 시도 확률 ↑ |
| 1단계 | 0.625 (매우 강함) | 0.067 (약함) |
| 타당성 | 쌍둥이 출산은 본질적으로 무작위 | 자녀 성별 구성은 무작위 |
추정 결과
| 결과변수 | OLS | Twins IV | Same-sex IV |
|---|---|---|---|
| 취업 여부 | −0.167 | −0.083 | −0.135 |
| 연간 근로주수 | −8.05 | −3.83 | −6.23 |
추정치가 다른 이유: 순응자가 다르다
각 도구변수는 서로 다른 순응자 하위집단의 효과를 식별한다:
| 특성 | 표본 평균 | Twins 비율 | Same-sex 비율 |
|---|---|---|---|
| 첫 출산 시 30세 이상 | 0.003 | 1.39 (과대대표) | 1.00 (평균적) |
| 대졸 이상 | 0.132 | 1.14 (과대대표) | 0.70 (과소대표) |
비율 > 1이면 해당 특성이 순응자 집단에서 과대대표됨을 의미.
Twins 순응자 = 쌍둥이가 아니었으면 셋째를 낳지 않았을 어머니들
- 나이 많고, 교육 수준 높고, 커리어 확립
- 2명만 계획 → 쌍둥이로 강제 3명
- → 노동공급 감소가 작음 (커리어 애착이 충격을 완충)
Same-sex 순응자 = 성별 다양성 선호로 셋째를 낳게 된 어머니들
- 젊고, 교육 수준 낮고, 커리어 초기 단계
- 가족 구성에 대한 강한 선호
- → 노동공급 감소가 큼 (낮은 커리어 애착, 높은 기회비용)
Treatment Effect 관점에서의 매핑
| 추정량 | 이 연구에서의 해석 | 값 / 상태 |
|---|---|---|
| ATE | 2자녀 모든 어머니가 셋째를 낳으면 | 직접 관측 불가; 두 LATE 사이 어딘가 |
| ATT | 실제로 셋째를 낳은 어머니에 대한 효과 | OLS(−0.167)가 추정 시도하나 선택 편의로 편향 |
| ITT | 쌍둥이/동성에 "배정"된 것의 효과 | 축약형: 예) 쌍둥이 RF 취업효과 = −0.052 |
| LATE | 도구변수 때문에 셋째를 낳은 어머니 | Twins: −0.083 | Same-sex: −0.135 |
이 연구의 핵심 교훈
- LATE ≠ ATE ≠ ATT. OLS(−0.167), Twins IV(−0.083), Same-sex IV(−0.135) 모두 같은 연구 질문에 다른 숫자를 제시.
- 다른 도구변수 → 다른 순응자 → 다른 LATE. 도구변수 선택이 누구의 효과를 추정하는지를 결정.
- 순응자 특성이 차이를 설명. 추정치 차이는 무작위가 아니라 각 순응자 집단의 인구통계학적 구성으로 체계적으로 설명됨.
- 정책적 함의가 달라진다. 취업 효과 −8% vs −17%는 완전히 다른 보육정책 결론으로 이어짐.
3. 수학적 관계
단조성 하 모집단 하위집단
도구변수는 모집단을 세 그룹으로 분할 (거역자 없음 가정):
| 그룹 | 정의 | 비율 |
|---|---|---|
| 순응자 (C) | d1i = 1, d0i = 0 | πC = E[D|Z=1] − E[D|Z=0] = 1단계 |
| 항상-처치자 (AT) | d1i = d0i = 1 | πAT = E[D|Z=0] |
| 비순응자 (NT) | d1i = d0i = 0 | πNT = 1 − E[D|Z=1] |
각 추정량의 분해
ATE: 전체 그룹의 가중평균
ATT: 순응자 + 항상-처치자
처치자 = 순응자 + 항상-처치자. 비순응자는 처치를 안 받으므로 제외.
ITT: LATE × 순응률
항상 불편추정치 (Y를 Z에 OLS). 순응률 < 1이므로 LATE보다 절대값이 작다.
LATE: 순응자만
항상-처치자와 비순응자의 효과는 완전히 배제.
특수한 경우: LATE = ATT (Bloom 1984)
항상-처치자가 없는 경우 (일방적 비순응), 즉 E[D|Z=0] = 0:
예시: JTPA 훈련 실험 — 배정 없이는 훈련 접근 불가, 훈련받은 사람 전원이 순응자. IV = ITT ÷ 순응률 = ATT.
크기 관계 요약
| 관계 | 조건 | 예시 |
|---|---|---|
| |ITT| < |LATE| | 항상 (순응률 < 1일 때) | ITT = LATE × 순응률 |
| ATT ≥ ATE (보통) | 효과 큰 사람이 선택적 참여 | 자발적 직업훈련, 대학 진학 |
| LATE = ATT | 항상-처치자 없음 | JTPA 실험 (Bloom 1984) |
| LATE₁ ≠ LATE₂ | 다른 IV → 다른 순응자 | Angrist & Evans: Twins ≠ Same-sex |
| LATE = ATE | 동질적 처치효과 | 모든 사람에게 효과가 동일한 경우 |
방법론 → 추정량 연결
| 방법론 | 추정하는 효과 | 일반화 범위 |
|---|---|---|
| RCT (완전 순응) | ATE | 넓음 |
| RCT (비순응) + IV | LATE | 순응자 한정 |
| DID | ATT | 처치군과 비슷한 집단 |
| RDD | LATE at cutoff | Cutoff 근처 한정 |
| Matching / PSM | ATT | 처치군과 비슷한 집단 |
핵심 요약
실증 연구를 읽거나 쓸 때 항상 물어야 할 질문:
- 이 방법론이 식별하는 추정량은? (ATE, ATT, 아니면 LATE?)
- 순응자는 누구인가? (IV/RDD라면 — 누구의 효과를 배우고 있는가?)
- 추정량이 정책 질문과 맞는가? (보편 프로그램 → ATE; 자발적 → ATT; 넛지 → LATE)
- 순응자가 의도한 정책 대상과 관련 있는가? (파일럿 열성 참가자 ≠ 일반 모집단)
Suhyeon Lee