Loading [MathJax]/jax/output/CommonHTML/jax.js
본문 바로가기
카테고리 없음

인과 추론

by 테리는당근을좋아해 2025. 4. 1.

인과 모델

Tft(ut)(a)

Yfy(T,uy)(b)

 

인과 모델에서 모델링하지 않는 변수집합 ut(외부변수)가 함수 ft를 통해 처치변수 T를 유발하는 원인이 되고 (a), 처치변수 T는 다른 변수 집한 uy (또한, 모델링하지 않은 변수)와 함께 함수 fy를 통해 결과 Y를 유발 (b). 이때, uy는 단순히 처치변수만으로 결정되지 않음을 나타낸다. 또한, 등호가 아닌 화살표()를 통해 인과관계의 비가역성을 분명하게 표시한다.

 

예를 들어 가격 할인을 처치 변수, 판매량을 결과로 두었을 때, 아래와 같이 표현할 수 있다.

IsOnSalesft(ut)

AmoutSoldfy(IsOnSales,ut)

 

BusinessSizefs(us)

IsOnSalesft(BusinessSize,ut)

AmountSoldfy(IsOnSales,BusinessSize,uy)

 

우리는 인과 모델과 유사한 모델을 모델링하고 사용한 경험이 있다.

 

AmountSoldi=α+β1IsOnSalesi+β2BusinessSizei+ei

 

차이점은 인과 모델보다 더 많은 가정을 하며, 변수 간의 관계에 함수 형태(선형)를 부여한다

 

개입(Intervention)

개입은 전체 표본에 처치를 통제한 다음 전체 표본량을 측정

선택은 전체 표본에서 어떤 기준에 따라 선택된 하위 표본

 

선택은 처치에 따라 표본을 추출하고, 개입은 전체 표본의 처치 여부를 통제 한다.

 

가격을 할인한 회사의 판매량 기댓값 : E[AmountSold|IsOnSales=1](a)

가격을 할인하도록 개입한 경우의 판매량 기댓값 : E[AmountSold|do(IsOnSales=1)](b)

 

E[AmountSold|IsOnSales=1]E[AmountSold|do(IsOnSales=1)]

 

do(.) 연산자는 관측된 데이터에서 항상 얻을 수 없는 인과 추정량을 정의하는데 사용하며, 할인 여부에 따른 판매량 예제에서  do(IsOnSales=1) 인 상황을 직접 관측할 수 없다.

 

즉, do(.) 연산자는 구하려는 인과 추정량을 분명하게 표현하는 데 사용할 수 있는 이론적 개념이다.

대부분의 인과추론은 인과 추정량에 대한 이론적 표현에서 직접 관측할 수 없는 부분을 제거하기 위한 일련의 과정으로, 이를 식별(Identification)이라 한다.


do(.) 연산자의 의미

do(.) 연산자는 인과적 개입을 표현하는 이론적 연산자이다. 이는 관찰된 데이터에서는 직접적으로 얻을 수 없는, 가상의 개입 상황을 나타낸다.

  • 예를 들어, 할인 여부가 판매량에 미치는 영향을 알고 싶을 때, 할인 중인 상황할인하지 않은 상황을 비교하려면 할인이 실제로 이루어졌을 때의 판매량을 관측해야 한다. 하지만 실제로 할인 여부를 임의로 바꾸는 것은 불가능하므로, 이럴 때 do(IsOnSales=1)과 같은 가상의 개입을 사용하여 "할인을 실제로 시행했을 때의 판매량"을 이론적으로 정의할 수 있다.

인과 추정량

인과 추정량은 처치(treatment)가 결과에 미치는 영향을 수치적으로 추정하는 값이다.

  • 예를 들어, 할인 여부가 판매량에 미치는 영향을 알고 싶을 때, "할인을 한 경우의 판매량"과 "할인을 하지 않은 경우의 판매량"을 비교하고 그 차이를 인과 추정량으로 정의할 수 있다.
  • 문제는 실제로 do(IsOnSales=1) (즉, 할인을 시행한 상태)와 같은 인과적 개입을 직접 관측할 수 없다는 점이다. 실제로 관측하는 데이터는 자연 상태(예를 들어, 실제 할인 여부)에서 얻은 것들이다.

식별(Identification)

식별(Identification) 직접적으로 관측할 수 없는 인과 추정량간접적으로 추정할 수 있도록 해주는 과정을 말한다. 즉, 관측된 데이터를 이용해 이론적 개입을 추정하는 방법이다.

  • 예를 들어, 만약 "할인을 한 경우의 판매량"을 추정하려면, 선택 편향 등을 고려해야 한다. 여기서 식별 과정은 데이터를 통해 할인 여부와 판매량 사이의 실제 인과 관계를 찾을 수 있도록 해준다. 즉, 직접적으로 do(IsOnSales=1) 상황을 관측하지 않지만, 수학적 모델이나 통계적 방법을 사용하여 이 값을 추정하는 것이다.

 

 

개별 처치 효과 (ITE, Individual Treatment effect)

do(.) 연산자를 사용하면 개별 실험 대상 i에 처치가 결과에 미치는 영향인 개별 처치효과(ITE)를 표현할 수 있다.

 

τi=Yi|do(T=t1)Yi|do(T=t0)

 

  • Yi|do(T=t1): 개별 대상 i에 대해 처치 T=t1가 주어졌을 때의 잠재적 결과
  • Yi|do(T=t0): 개별 대상 i에 대해 처치 T=t0가 주어졌을 때의 잠재적 결과
  • τi : 개별 처치 효과(ITE), 즉 처치가 개별 대상 i에 미치는 실제 효과

 

인과추론의 근본적인 문제(반사실적 관계: counterfactuals) 때문에 앞의 식 중 한가지 항에 대해서만 관측할 수 있다. 따라서 이론적으로 식을 표현할 수 있어도, 반드시 데이터에서 이를 찾을 수 있다는 의미는 아니다.

 

 

잠재적 결과(Potential Outcome)

Yti=Yi|do(Ti=t)=Y(t)i

 

잠재적 결과는 "처치가 t인 상태일 때, 실험 대상 i의 결과는 Y가 될 것이다."를 의미한다.  관측할 수 있는 잠재적 결과를 사실적 결과(Factual Outcome), 관측할 수 없는 다른 한가지 결과를 반사실적 결과(Counterfactual Outcome)이라 한다. 

 

Yi=TiY1i+(1Ti)Y0i=Y0i+(Y1iY0i)Ti

 

잠재적 결과 모델은 개별 실험 단위 i에 대한 두 가지 가능한 결과 중 하나만 관측될 수 있다는 사실을 기반으로 한다. 이를 통해 잠재적 결과를 관측된 결과로 연결할 수 있다.

 

  • 처치가 있는 경우(즉, Ti=1): 결과는 Y1i (처치가 있을 때의 결과)이다.
  • 처치가 없는 경우(즉, Ti=0): 결과는 Y0i (처치가 없을 때의 결과)이다.

이 모델에서 중요한 점은 실험 단위가 동시에 두 가지 처치 상태를 경험할 수 없다는 것이다. 즉, 처치가 있거나 없거나, 두 가지 상태 중 하나만 실제로 관측된다. 그러나, 각 실험 단위에 대해 두 가지 상태(처치가 있을 때와 없을 때의 결과)가 모두 존재하는 잠재적 결과가 있다는 점을 가정한다.

 

  • Ti=1일 경우, 처치가 있을 때의 결과 Y1i가 관측된다.
  • Ti=0일 경우, 처치가 없을 때의 결과 Y0i가 관측된다.

 

각 실험 단위 i에 대해, 처치 여부를 나타내는 변수 Ti는 0 또는 1의 값을 가질 수 있다.

이때, Yi는 실제로 관측된 결과를 나타내며, Ti에 따라 처치 여부에 해당하는 잠재적 결과 중 하나가 관측된다. 따라서, Yi는 처치 여부에 따라 다음과 같이 표현할 수 있다.

 

Yi=TiY1i+(1Ti)Y0i

 

  • TiY1i:Ti=1인 경우, 즉 처치가 있었을 때 잠재적 결과 Y1i가 관측된다.
  • (1Ti)Y0i:Ti=0인 경우, 즉 처치가 없었을 때의 잠재적 결과 $Y_{0i]$가 관측된다.

 

위 식을 풀어쓰면 아래와 같이 표현할 수 있다.

 

Yi=Y0i+(Y1iY0i)Ti

 

  • 처치가 없을 때의 결과 Y0i에 처치 효과 (Y1iY0i)를 더한 값이 처치가 있을 때 관측되는 결과가 된다고 볼 수 있다.
  • 처치 효과는 Ti가 1일 때만 실제로 적용되고, Ti가 0일 때는 처치 효과가 적용되지 않기 때문에 처치가 없을 때의 결과 Y0i만 관측된다.

 

일치성 및 SUTVA

잠재적 결과 모델에는 두가지 가정이 필요하다.

 

1. 일치성

잠재적 결과가 처치와 일치성이 있어야 한다. (Ti=t일 때, Yi(t)=Y) 즉, T로 지정된 처치 외에 숨겨진 여러 가지 형태의 처치는 존재하지 않는다. 일치성은 두 가지 경우에 위배될 수 있다.

  • 여러번 처치 되었는데, 일부만 고려되었을 때
    • 예를 들어, 할인 쿠폰과 매출의 영향성을 연구할 때, 처치는 고객의 할인 쿠폰을 받았는 지, 안받았는 지에 두 가지 방식이 고려되어야 하는데, 실제로 할인을 여러번 시도했을때 일치성 가정이 위배될 수 있다.
  • 처치가 잘못 정의된 경우
    • 예를 들어, 재무 설계사의 도움이 개인 자산의 영향성에 대한 연구를 할 때, 도움이란 무엇을 의미하는가?

2. SUTVA(Stable Unit of Treatment Value Assumption 또는 No Interference)

파급 효과 또는 네트워크 효과가 있는 경우, 가정이 위배될 수 있다.

  • 예를 들어, 백신이 전염성 질환 예방에 미치는 영향을 연구할 떄, 한 사람에게 백신을 접종하면 그 사람과 가까운 다른 사람들이 처치 받지 않았더라도 해당 질병에 걸릴 확률이 낮아질 수 있다.

 

인과 추정량(Causal Estimator)

인과 추정량은 인과 추론에서 어떤 변수나 요인이 다른 변수에 미치는 영향을 추정하기 위해 사용하는 방법론이다. 인과 추론의 반사실적 문제로 인해 개별 처치 효과를 직접 구할 수 없지만, 우리는 관측된 데이터와 통계적 방법론을 통해 인과 효과를 추정할 수 있다.

 

1. 평균 처치 효과 (ATE, Average Treatment Effect)

ATE=E[τi]

ATE=E[Y1iY0i]

ATE=E[Y|do(T=1)]E[Y|do(T=0)]

 

 

댓글