Angrist & Pischke, Mostly Harmless Econometrics — Section 4.6
Chapter 4 Part 3: IV 상세
English핵심 메시지
이 절은 IV의 실전적 함정들을 다룬다: 수동 2SLS의 흔한 실수, 동료 효과(peer effects) 식별의 어려움, 2SLS와 비선형 모형(이변량 Probit)의 관계, 그리고 도구변수가 많거나 약할 때의 유한표본 편의.
4.6.1 흔한 2SLS 실수들
실수 1: 공변량 무관심
실수: 1단계와 2단계에 서로 다른 공변량을 포함하는 것.
Griliches & Mason (1972)은 2단계에 나이를 포함했지만 1단계에는 포함하지 않았다. 이는 1단계 잔차(si − ŝi)가 1단계에 포함된 변수들과만 비상관이 보장되기 때문에 잘못된 것이다.
규칙: 항상 양 단계에 동일한 외생 공변량을 포함해야 한다. 2단계에 넣을 만한 공변량이면 1단계에도 넣어야 한다.
실수 2: 금지된 회귀
실수: 비선형 1단계 적합값(예: Probit)을 2단계에 대입하는 것.
di가 이진 내생변수라면 "di가 0/1이니 1단계에 OLS 대신 Probit을 쓰자"고 생각할 수 있다.
왜 틀린가: OLS 잔차만이 정규방정식에 의해 적합값 및 공변량과의 비상관성이 보장된다. Probit 잔차는 Probit 모형이 올바르게 설정되지 않는 한 이 성질을 갖지 않으며 — 이를 검증할 수 없다.
올바른 대안:
- 표준 2SLS: 선형 1단계 사용 (1단계 함수형과 무관하게 항상 일치)
- 비선형 적합값을 도구변수로: d̂probit을 대입이 아닌 도구변수로 사용하여 표준 2SLS 수행. Probit 모형이 좋은 근사이면 효율성 향상 가능
주의: 비선형 적합값을 도구변수로 사용하면 암묵적으로 비선형성을 식별 정보로 활용하게 된다. Zi가 인과 방정식에 나타나면 모형은 미식별이어야 하지만, 비선형 1단계가 함수형을 통한 "뒷문" 식별을 만드는데 — 이는 의심스럽다.
실수 3: 금지된 비선형 2단계
이차 모형 yi = δ'Xi + ρ₁si + ρ₂si² + εi에서, 하나의 1단계에서 ŝ과 ŝ²을 대입하지 말 것. 대신 si와 si²을 각각 별도의 내생변수로 취급하여, 각자의 1단계 방정식을 세우고 적절한 2SLS를 사용해야 한다.
4.6.2 동료 효과 (Peer Effects)
유형 1: 한 변수의 집단 평균이 다른 변수의 개인 결과에 미치는 효과
예: 주(州)의 평균 교육연수(S̄jt)가 개인 임금에 영향을 미치는가? (Acemoglu & Angrist 2000)
문제: OLS와 2SLS(주 더미 사용)가 ρ의 다른 추정치를 내면, 진정한 외부효과 없이도 기계적으로 ψ̂ ≠ 0이 된다.
- 2SLS > OLS (예: 측정오차 보정): 허위 양의 외부효과
- 2SLS < OLS (예: 능력 편의 제거): 허위 음의 외부효과
→ 이런 방정식의 OLS는 동료 효과에 대해 해석하기 매우 어렵다.
유형 2: 같은 변수의 집단 평균이 개인 변수에 미치는 효과
"급우들의 평균 졸업률이 나의 졸업 여부에 영향을 미치는가?"
sij를 S̄j에 회귀하면 계수가 항상 1이다. S̄j는 말 그대로 sij를 학교 더미에 회귀한 적합값이기 때문. 이 회귀는 항진적(tautological)이며 인과관계에 대해 아무것도 말해주지 않는다.
본인 제외 평균 S̄(−i)j를 사용해도, 학교 수준 공통 충격(예: 좋은 교장)이 개인과 동료 결과 사이에 허위 상관을 만들어 문제적이다.
더 나은 접근법
결과에 선행하는 사전적(ex ante) 동료 특성을 사용:
- Ammermueller & Pischke (2006): 동료 가정의 도서 보유량 → 학생 시험 점수 (도서는 사전 결정된 가정 특성)
- Angrist & Lang (2004): 통학 버스로 온 저성취 학생 수 → 재학생 시험 점수 (표본 외부의 학생에 의해 결정)
4.6.3 제한 종속변수 재론
이변량 Probit보다 2SLS를 선호하는 이유
종속변수가 이진(예: 취업 여부)일 때, 2SLS 대신 이변량 Probit을 써야 하는가?
2SLS를 고수해야 하는 논거:
- 2SLS는 종속변수가 이진이든, 비음이든, 연속이든 상관없이 LATE를 포착
- 2SLS는 분포 가정이 필요 없음
- 2SLS는 인과효과를 직접 추정 — 잠재지수 계수에서 한계효과를 계산할 필요 없음
- 이변량 Probit은 ATE(LATE가 아닌)를 추정 가능하지만, 결합 정규성이라는 강한 가정 하에서만 가능
이변량 Probit 설정
2단계: yi = 1[Xi'β₀ + β₁di > εi]
내생성은 Corr(vi, εi) ≠ 0에서 발생.
zi ⊥ (vi, εi)와 결합 정규성을 가정하여 식별.
실증 비교: 셋째 자녀가 여성 취업에 미치는 효과
| 설정 | 2SLS | Abadie | Biprobit MFX | Biprobit ATE |
|---|---|---|---|---|
| 공변량 없음 | −0.138 | −0.138 | −0.138 | −0.139 |
| 일부 공변량 | −0.132 | −0.132 | −0.135 | −0.135 |
| + 선형 나이 항 | −0.120 | −0.121 | −0.171 | −0.171 |
강한 함수형 가정 없이 결과가 거의 동일. 그러나 나이 더미를 선형 항으로 교체하면 이변량 Probit 추정치가 −0.171로 뛰는 반면 2SLS와 Abadie는 안정적. 이는 희소 셀로의 외삽 — 비선형 모형이 도입하는 정확히 그 취약성 — 을 반영한다.
결론: 2SLS는 함수형에 강건하다. 이변량 Probit은 LATE 대신 ATE를 줄 수 있지만, 성립하지 않을 수 있는 강한 분포 가정의 대가를 치른다. 실제로는 Probit 모형이 외삽하지 않는 한 두 방법이 보통 일치한다.
4.6.4 2SLS의 편의
OLS는 불편, 2SLS는 불편이 아님
OLS는 불편추정량(어떤 표본 크기에서도 모집단 계수에 중심). 2SLS는 일치추정량일 뿐 — 대표본에서 수렴하지만 유한표본에서 체계적으로 벗어날 수 있다.
편의 공식
여기서 F는 배제된 도구변수에 대한 1단계 F-통계량.
주요 시사점
| 시나리오 | 2SLS 편의 |
|---|---|
| F → ∞ (강한 도구변수) | 편의 → 0 ✓ |
| F → 0 (1단계 없음) | 편의 → OLS 편의 (최악의 경우) |
| 도구변수 수 증가 (q 증가) | F 하락 → 편의 증가 |
편의의 원천
편의는 1단계가 알려진 것이 아니라 추정된 것이기 때문에 발생. 적합값 ŝi = Zπ̂는 2단계 오차 ε과 상관된 표본 오차(Pzη)를 포함한다. 도구변수가 약할 때 이 표본 상관이 지배적이 되어 2SLS를 OLS 쪽으로 끌어당긴다.
LIML: 편의 감소 대안
LIML (Limited Information Maximum Likelihood)은 과대식별에서도 근사적으로 중앙값-불편이며, 2SLS와 동일한 대표본 분포를 가진다.
- LIML은 본질적으로 OLS와 2SLS의 편의 보정된 선형 결합
- Stata와 SAS에서 사용 가능
- 몬테카를로 증거 (Flores-Lagunes 2007)가 다양한 시나리오에서 LIML 지지
몬테카를로 증거
| 설정 (참 β=1) | OLS 중앙값 | 2SLS 중앙값 | LIML 중앙값 |
|---|---|---|---|
| q=2 (유용 1개 + 무용 1개) | ~1.79 | 1.07 | ~1.0 |
| q=20 (유용 1개 + 무용 19개) | ~1.79 | 1.53 | ~1.0 |
| q=20 (모두 무용) | ~1.79 | ~1.79 | 매우 분산 |
LIML은 약한 도구변수가 많아도 β=1에 중심을 유지하는 반면, 2SLS는 OLS 쪽으로 끌린다. 도구변수가 모두 무관련이면 LIML의 넓은 분포가 정보 부재를 올바르게 반영한다.
실용적 권고사항
- 1단계를 보고하라. 부호, 크기, 타당성을 확인.
- F-통계량을 보고하라. 배제된 도구변수에 대한 것. 경험법칙: F > 10이면 안전 (Stock, Wright & Yogo 2002). 다만 절대적 정리는 아님.
- 적정식별 추정치를 보고하라. 가장 좋은 단일 도구변수로. 적정식별 IV는 중앙값-불편이며 과다 도구변수 문제에 면역.
- 2SLS와 LIML을 비교하라. 일치하면 안심. 불일치하면 우려 — 더 강한 도구변수를 찾아야 한다.
- 축약형을 확인하라. 축약형 회귀(y를 z에)는 OLS이므로 불편. 축약형에서 인과관계가 보이지 않으면 아마 없는 것이다.
적용: Angrist & Krueger (1991) 재검토
| 도구변수 | q | F-통계량 | 2SLS | LIML |
|---|---|---|---|---|
| 3개 QOB 더미 | 3 | 32.3 | 0.105 (0.020) | 0.106 (0.020) |
| QOB×YOB 교호작용 | 30 | 4.9 | 0.089 (0.016) | 0.093 (0.018) |
| + QOB×SOB 교호작용 | 180 | 2.6 | 0.093 (0.009) | 0.091 (0.011) |
도구변수 3개에 F=32일 때 2SLS와 LIML이 근접하게 일치. 도구변수 180개에 F=2.6일 때 F-통계량은 낮지만 LIML이 여전히 2SLS와 일치하여, 경험법칙에도 불구하고 편의가 치명적이지 않을 수 있음을 시사한다.
Part 3 요약
| 주제 | 핵심 교훈 |
|---|---|
| 공변량 무관심 | 양 단계에 동일한 공변량; 그렇지 않으면 잔차가 적합값과 상관 |
| 금지된 회귀 | 비선형 적합값을 2단계에 대입하지 말 것; 대신 도구변수로 사용 |
| 동료 효과 (유형 1) | 외부효과의 OLS 추정은 사적 수익의 OLS-IV 차이와 혼동 |
| 동료 효과 (유형 2) | 같은 결과의 집단 평균에 회귀는 항진적; 사전적 동료 특성 사용 |
| 2SLS vs. 이변량 Probit | 2SLS는 강건; Biprobit은 정규성 필요하고 공변량에 민감 |
| 2SLS 편의 | 편의 ≈ OLS 편의 / (F+1); 많고 약한 도구변수 → OLS 쪽으로 편의 |
| LIML | 2SLS의 중앙값-불편 대안; 강건성 검증용 |
| F > 10 규칙 | 도구변수 강도의 경험법칙; 절대적 정리는 아님 |
5가지 IV 점검 목록:
- 1단계를 보고하고 점검하라
- F-통계량을 보고하라 (10 이상 목표)
- 가장 좋은 도구변수로 적정식별 추정치를 보고하라
- 2SLS와 LIML을 비교하라
- 축약형을 확인하라 — 거기서 인과효과가 보이지 않으면 아마 실재하지 않는다
Suhyeon Lee