Chapter 4 Part 3: IV 상세

English

Angrist & Pischke, Mostly Harmless Econometrics — Section 4.6

핵심 메시지

이 절은 IV의 실전적 함정들을 다룬다: 수동 2SLS의 흔한 실수, 동료 효과(peer effects) 식별의 어려움, 2SLS와 비선형 모형(이변량 Probit)의 관계, 그리고 도구변수가 많거나 약할 때의 유한표본 편의.

4.6.1 흔한 2SLS 실수들

실수 1: 공변량 무관심

실수: 1단계와 2단계에 서로 다른 공변량을 포함하는 것.

Griliches & Mason (1972)은 2단계에 나이를 포함했지만 1단계에는 포함하지 않았다. 이는 1단계 잔차(si − ŝi)가 1단계에 포함된 변수들과만 비상관이 보장되기 때문에 잘못된 것이다.

규칙: 항상 양 단계에 동일한 외생 공변량을 포함해야 한다. 2단계에 넣을 만한 공변량이면 1단계에도 넣어야 한다.

실수 2: 금지된 회귀

실수: 비선형 1단계 적합값(예: Probit)을 2단계에 대입하는 것.

di가 이진 내생변수라면 "di가 0/1이니 1단계에 OLS 대신 Probit을 쓰자"고 생각할 수 있다.

왜 틀린가: OLS 잔차만이 정규방정식에 의해 적합값 및 공변량과의 비상관성이 보장된다. Probit 잔차는 Probit 모형이 올바르게 설정되지 않는 한 이 성질을 갖지 않으며 — 이를 검증할 수 없다.

올바른 대안:

  • 표준 2SLS: 선형 1단계 사용 (1단계 함수형과 무관하게 항상 일치)
  • 비선형 적합값을 도구변수로:probit을 대입이 아닌 도구변수로 사용하여 표준 2SLS 수행. Probit 모형이 좋은 근사이면 효율성 향상 가능

주의: 비선형 적합값을 도구변수로 사용하면 암묵적으로 비선형성을 식별 정보로 활용하게 된다. Zi가 인과 방정식에 나타나면 모형은 미식별이어야 하지만, 비선형 1단계가 함수형을 통한 "뒷문" 식별을 만드는데 — 이는 의심스럽다.

실수 3: 금지된 비선형 2단계

이차 모형 yi = δ'Xi + ρ₁si + ρ₂si² + εi에서, 하나의 1단계에서 ŝ과 ŝ²을 대입하지 말 것. 대신 si와 si²을 각각 별도의 내생변수로 취급하여, 각자의 1단계 방정식을 세우고 적절한 2SLS를 사용해야 한다.

4.6.2 동료 효과 (Peer Effects)

유형 1: 한 변수의 집단 평균이 다른 변수의 개인 결과에 미치는 효과

예: 주(州)의 평균 교육연수(S̄jt)가 개인 임금에 영향을 미치는가? (Acemoglu & Angrist 2000)

Yijt = αj + λt + ρsi + ψS̄jt + ujt + εijt

문제: OLS와 2SLS(주 더미 사용)가 ρ의 다른 추정치를 내면, 진정한 외부효과 없이도 기계적으로 ψ̂ ≠ 0이 된다.

  • 2SLS > OLS (예: 측정오차 보정): 허위 의 외부효과
  • 2SLS < OLS (예: 능력 편의 제거): 허위 의 외부효과

→ 이런 방정식의 OLS는 동료 효과에 대해 해석하기 매우 어렵다.

유형 2: 같은 변수의 집단 평균이 개인 변수에 미치는 효과

"급우들의 평균 졸업률이 나의 졸업 여부에 영향을 미치는가?"

sij를 S̄j에 회귀하면 계수가 항상 1이다.j는 말 그대로 sij를 학교 더미에 회귀한 적합값이기 때문. 이 회귀는 항진적(tautological)이며 인과관계에 대해 아무것도 말해주지 않는다.

본인 제외 평균 S̄(−i)j를 사용해도, 학교 수준 공통 충격(예: 좋은 교장)이 개인과 동료 결과 사이에 허위 상관을 만들어 문제적이다.

더 나은 접근법

결과에 선행하는 사전적(ex ante) 동료 특성을 사용:

  • Ammermueller & Pischke (2006): 동료 가정의 도서 보유량 → 학생 시험 점수 (도서는 사전 결정된 가정 특성)
  • Angrist & Lang (2004): 통학 버스로 온 저성취 학생 수 → 재학생 시험 점수 (표본 외부의 학생에 의해 결정)

4.6.3 제한 종속변수 재론

이변량 Probit보다 2SLS를 선호하는 이유

종속변수가 이진(예: 취업 여부)일 때, 2SLS 대신 이변량 Probit을 써야 하는가?

2SLS를 고수해야 하는 논거:

  • 2SLS는 종속변수가 이진이든, 비음이든, 연속이든 상관없이 LATE를 포착
  • 2SLS는 분포 가정이 필요 없음
  • 2SLS는 인과효과를 직접 추정 — 잠재지수 계수에서 한계효과를 계산할 필요 없음
  • 이변량 Probit은 ATE(LATE가 아닌)를 추정 가능하지만, 결합 정규성이라는 강한 가정 하에서만 가능

이변량 Probit 설정

1단계: di = 1[Xi'δ₀ + δ₁zi > vi]
2단계: yi = 1[Xi'β₀ + β₁di > εi]

내생성은 Corr(vi, εi) ≠ 0에서 발생.
zi ⊥ (vi, εi)와 결합 정규성을 가정하여 식별.

실증 비교: 셋째 자녀가 여성 취업에 미치는 효과

설정 2SLS Abadie Biprobit MFX Biprobit ATE
공변량 없음 −0.138 −0.138 −0.138 −0.139
일부 공변량 −0.132 −0.132 −0.135 −0.135
+ 선형 나이 항 −0.120 −0.121 −0.171 −0.171

강한 함수형 가정 없이 결과가 거의 동일. 그러나 나이 더미를 선형 항으로 교체하면 이변량 Probit 추정치가 −0.171로 뛰는 반면 2SLS와 Abadie는 안정적. 이는 희소 셀로의 외삽 — 비선형 모형이 도입하는 정확히 그 취약성 — 을 반영한다.

결론: 2SLS는 함수형에 강건하다. 이변량 Probit은 LATE 대신 ATE를 줄 수 있지만, 성립하지 않을 수 있는 강한 분포 가정의 대가를 치른다. 실제로는 Probit 모형이 외삽하지 않는 한 두 방법이 보통 일치한다.

4.6.4 2SLS의 편의

OLS는 불편, 2SLS는 불편이 아님

OLS는 불편추정량(어떤 표본 크기에서도 모집단 계수에 중심). 2SLS는 일치추정량일 뿐 — 대표본에서 수렴하지만 유한표본에서 체계적으로 벗어날 수 있다.

편의 공식

E[β̂2SLS − β] ≈ (β̂OLS 편의) × 1/(F + 1)

여기서 F는 배제된 도구변수에 대한 1단계 F-통계량.

주요 시사점

시나리오 2SLS 편의
F → ∞ (강한 도구변수) 편의 → 0 ✓
F → 0 (1단계 없음) 편의 → OLS 편의 (최악의 경우)
도구변수 수 증가 (q 증가) F 하락 → 편의 증가

편의의 원천

편의는 1단계가 알려진 것이 아니라 추정된 것이기 때문에 발생. 적합값 ŝi = Zπ̂는 2단계 오차 ε과 상관된 표본 오차(Pzη)를 포함한다. 도구변수가 약할 때 이 표본 상관이 지배적이 되어 2SLS를 OLS 쪽으로 끌어당긴다.

LIML: 편의 감소 대안

LIML (Limited Information Maximum Likelihood)은 과대식별에서도 근사적으로 중앙값-불편이며, 2SLS와 동일한 대표본 분포를 가진다.

  • LIML은 본질적으로 OLS와 2SLS의 편의 보정된 선형 결합
  • Stata와 SAS에서 사용 가능
  • 몬테카를로 증거 (Flores-Lagunes 2007)가 다양한 시나리오에서 LIML 지지

몬테카를로 증거

설정 (참 β=1) OLS 중앙값 2SLS 중앙값 LIML 중앙값
q=2 (유용 1개 + 무용 1개) ~1.79 1.07 ~1.0
q=20 (유용 1개 + 무용 19개) ~1.79 1.53 ~1.0
q=20 (모두 무용) ~1.79 ~1.79 매우 분산

LIML은 약한 도구변수가 많아도 β=1에 중심을 유지하는 반면, 2SLS는 OLS 쪽으로 끌린다. 도구변수가 모두 무관련이면 LIML의 넓은 분포가 정보 부재를 올바르게 반영한다.

실용적 권고사항

  1. 1단계를 보고하라. 부호, 크기, 타당성을 확인.
  2. F-통계량을 보고하라. 배제된 도구변수에 대한 것. 경험법칙: F > 10이면 안전 (Stock, Wright & Yogo 2002). 다만 절대적 정리는 아님.
  3. 적정식별 추정치를 보고하라. 가장 좋은 단일 도구변수로. 적정식별 IV는 중앙값-불편이며 과다 도구변수 문제에 면역.
  4. 2SLS와 LIML을 비교하라. 일치하면 안심. 불일치하면 우려 — 더 강한 도구변수를 찾아야 한다.
  5. 축약형을 확인하라. 축약형 회귀(y를 z에)는 OLS이므로 불편. 축약형에서 인과관계가 보이지 않으면 아마 없는 것이다.

적용: Angrist & Krueger (1991) 재검토

도구변수 q F-통계량 2SLS LIML
3개 QOB 더미 3 32.3 0.105 (0.020) 0.106 (0.020)
QOB×YOB 교호작용 30 4.9 0.089 (0.016) 0.093 (0.018)
+ QOB×SOB 교호작용 180 2.6 0.093 (0.009) 0.091 (0.011)

도구변수 3개에 F=32일 때 2SLS와 LIML이 근접하게 일치. 도구변수 180개에 F=2.6일 때 F-통계량은 낮지만 LIML이 여전히 2SLS와 일치하여, 경험법칙에도 불구하고 편의가 치명적이지 않을 수 있음을 시사한다.

Part 3 요약

주제 핵심 교훈
공변량 무관심 양 단계에 동일한 공변량; 그렇지 않으면 잔차가 적합값과 상관
금지된 회귀 비선형 적합값을 2단계에 대입하지 말 것; 대신 도구변수로 사용
동료 효과 (유형 1) 외부효과의 OLS 추정은 사적 수익의 OLS-IV 차이와 혼동
동료 효과 (유형 2) 같은 결과의 집단 평균에 회귀는 항진적; 사전적 동료 특성 사용
2SLS vs. 이변량 Probit 2SLS는 강건; Biprobit은 정규성 필요하고 공변량에 민감
2SLS 편의 편의 ≈ OLS 편의 / (F+1); 많고 약한 도구변수 → OLS 쪽으로 편의
LIML 2SLS의 중앙값-불편 대안; 강건성 검증용
F > 10 규칙 도구변수 강도의 경험법칙; 절대적 정리는 아님

5가지 IV 점검 목록:

  1. 1단계를 보고하고 점검하라
  2. F-통계량을 보고하라 (10 이상 목표)
  3. 가장 좋은 도구변수로 적정식별 추정치를 보고하라
  4. 2SLS와 LIML을 비교하라
  5. 축약형을 확인하라 — 거기서 인과효과가 보이지 않으면 아마 실재하지 않는다
← Part 2: LATE & 이질적 효과 학습 노트로 돌아가기 →
이 노트는 LLM (Claude)의 도움을 받아 작성되었습니다.