(기업경제 #8) 로지트 모델(Logit Model)과 프로빗 모델(Probit Model)

기업경제학연습 제8회

오늘의 일정

로지트 모델(Logit Model)과 프로빗 모델(Probit Model)
참고 문헌:
森田果『실증분석입문』일본평론사, 2014년
니시야마 게이히코・신야 모토츠기・가와구치 다이지・오쿠이 료(奥井亮) 『계량경제학』유이카쿠(有斐閣), 2019년
J.M.Wooldridge.2020.Introductory Econometrics. A Modern Approach. Cengage.

로지트/프로빗 모델

로지트/프로빗 모형은 설명변수가 1과 0으로 표시되는 '질적 변수'일 때 사용되는 분석 기법
피설명변수가 연속변수가 아니기 때문에 OLS 등을 사용할 수 없다.
처리군에 들어갈 확률을 고려하기 위해서는 로지트/프로빗 모형이 필요하다.

피설명 변수가 '질적 변수'인 경우의 분석

'질적 변수'로 가장 빈번하게 사용되는 것은 ( 0 , 1 )만을 취하는 값을 피설명변수로 하는 경우

M&A를 할 것인가 ( = 1 )
M&A를 하지 않는지 ( = 0 )

사외이사를 도입하고 있는지 ( = 1 )
사외이사를 도입하지 않은지 ( = 0 )

선형 확률 모형

피설명변수(목적변수)로 질적 변수(=더미변수)를 사용하는 반면, 추정모델로는 선형모델(OLS)을 사용한다.
피설명변수는 ( 0 또는 1 )
예: 'M&A를 한다' = 1, 'M&A를 하지 않는다' = 0
- 설명변수 : 토빈 q
- M&A를 한다(M&A를 하지 않는다) = β₀ + β₁ × q + 오차항
피설명변수가 1과 0만을 취하기 때문에, 이 모형은 'M&A를 할 확률'을 구하는 것으로 해석할 수 있다.

선형 확률 모델

M&A 실행 확률 = 0.345 + 0.021 × q
- 예: q가 1인 기업의 경우
  0.345 + 0.021 × 1＝0.366 ( 36.6% )
  → 즉, 실행 확률이 36.6%가 되는 것이다.
이 모델의 문제점은 선형적이기 때문에 확률로 0보다 작은 값이나 1보다 큰 값을 얻을 수 있다는 점

선형 확률 모델의 문제점

많은 경우 확률분포의 누적분포함수는 직선이 아닌 곡선이 된다.
→ 선형 확률모델은 곡선을 무리하게 선형으로 회귀하는 것이기 때문에 계수 추정값에 편향이 발생할 수 있다.
선형 모형은 정의상 설명변수가 한 단위 변화했을 때의 확률 변화가 항상 일정하다고 가정한다.

로짓 및 프로빗 모델

설명변수가 어떤 값이든 피설명변수가 0에서 1의 범위에 들어맞도록 누적분포함수 F를 이용한 변형을 수행합니다.
→ 지금, y = β₀ + β₁x + u
라는 선형 회귀모형을 누적분포함수 G를 이용하여
y = G ( β₀ + β₁x + u )
로 공식화하여 y가 반드시 0과 1 사이에 들어가도록 한다.

로지트 모델(Logit model)

G로 로지스틱 분포를 이용하는 모델
G ( y ) = exp ( y ) / { 1 + exp ( y ) }
로지트 모델을 선택하는 이유로 계산이 쉽다는 점이 있었으나, 현재는 다른 방식과 별 차이가 없다.

프로빗 모델(Probit model)

G로 표준정규분포를 이용하는 모델

예시

피설명변수 : 주택담보대출 신청이 거절될 확률
설명변수 : 신청자의 월 소득(I)에 대한 월 상환액(P)의 비율(P/I 비율)의 관계를 살펴보는 모형

Pr ( deny = 1 | x = P / I ) = G ( β₀ + β₁ P / I )

Pr = 확률

거부 = 1

| = 조건부 확률

로짓 프로빗 모형의 계수 기울기

비선형 모델이기 때문에 계수 해석 시 '설명변수가 1 증가하면 확률변수가 β₁ 증가한다'고 볼 수 없다.
설명변수 x의 Δx 단위 변화가 확률 확률변수에 미치는 영향 계산 방법
1) 설명변수가 x일 때의 확률 계산
2) 설명변수가 x + Δx일 때의 확률을 계산한다.
3) 1의 결과와 2의 결과의 차이를 계산한다.
→ 한계효과(marginal effect)라고 부른다.

추정 방법

비선형 모델(로짓/프로빗 포함)에서 매개변수 추정 방법은 MLE(Maximum Likelihood Estimation : 최대우도법)
"어떤 모형과 파라미터(β)가 사용하는 샘플 데이터를 가장 잘 설명할 수 있는가"
⇔ OLS : 오차항의 제곱의 총합의 최소화
'어떤 파라미터(β)가 예측치에서 벗어나는 정도를 가장 작게 하는가'

MLE의 개념

관찰된 데이터의 조합이 일어날 확률을 우도함수(likelihood function)라는 함수로 표현
여기서 추정값은 우도함수를 최대화하는 매개변수
최대우도법이란 '관찰된 데이터의 분포 패턴에 가장 가까운(적합도가 높은) 이론 분포를 구하는 방법'

MLE의 개념

지금 모집단에 대해 σ = 1으로 정규분포라는 것은 알고 있지만, μ를 모르기 때문에 이를 추정하고 싶다.
모집단에서 5개의 표본을 무작위로 추출한다.
Y = { 1.364 , 0.235 , -0.846 , -0.285 , -1.646 }
- OLS는 '어떤 μ가 가장 작은 편차가 될 것인가'를 고려하여 파라미터를 추정한다.
- MLE는 '어떤 μ가 이러한 샘플 Y를 생성할 가능성(likelihood)이 가장 큰가'를 생각한다.

μ = -2 인 경우의 분포

σ = 1

MLE의 개념

μ = - 2 인 경우의 분포를 가정하면, 모집단에서 표본을 추출했을 때,
'1.364일 확률' '0.235일 확률'...을 계산할 수 있다.
→ Y = { 1.364 , 0.235 , -0.846 , -0.285 , -1.646 }
를 동시에 얻을 확률은,

( 1.364일 확률 ) × ( 0.235일 확률 ) × ( -0.846일 확률 ) × ( -0.285일 확률 ) × ( -1.646일 확률 )

μ를 변화시켰을 때의 분포 변화

MLE의 개념

μ = 1.5 인 경우, μ = 0 인 경우, μ = 2 인 경우, 각각의 확률 분포를 그림에 나타낸다.
→ 이 μ의 값 중에서 어느 것이 가장 가능성이 높은 값인지 구한다.

MLE의 적합도 지표

OLS의 결정계수와 유사한 개념으로 유사결정계수(pseudo R₂)가 많이 사용됩니다.
pseudo R₂ = 1 - { ( 제약이 없는 모델의 대수우도 ) / ( 제약이 있는 모델의 대수우도 ) }

= 1 - { ln 𝐿ᵤ / ln 𝐿₀ }

제약이 없는 모델 : 설명변수에 제약이 없는 모델로 대수우도 ln Lᵤ
제약이 있는 모델 : 상수항을 제외한 모든 설명변수가 전혀 영향을 미치지 않는다는 제약을 둔 모델으로 대수우도를 ln L₀

MLE의 적합도 지표

분자의 '제약 없는 모델의 대수우도'는 분석가가 사용한 모형 하에서 관찰된 데이터의 조합이 발생할 확률
분모의 '제약 모델의 대수우도'는 상수항을 제외한 모든 계수를 0으로 가정한 모델
(즉, 분석가가 사용한 모델은 전혀 의미가 없는 모델)에서 관찰된 데이터의 조합이 일어날 확률

MLE의 적합도 지표

모든 변수를 포함하는 제약 없는 모델이 상수항만 포함하는 제약 모델보다 적합도가 떨어지지 않는다.
ln Lᵤ ≥ ln 𝐿₀
단, 대수우도는 항상 음의 값을 가지므로, 절대값으로 보면
| ln Lᵤ | ≤ | ln 𝐿₀ |
예를 들어, 나중에 나오는 수치 예시에서는
ln Lᵤ = -526.4914, ln 𝐿₀ = -601.6117
→ 절대값은 | ln Lᵤ = 526.4914 | , | ln 𝐿₀ = 601.6117 |
즉, (무제약 모델의 대수적 우도) / (제약조건이 있는 모델의 대수적 우도)
ln Lᵤ / ln 𝐿₀ = -526.4914 / -601.6117 < 1

MLE의 적합도 지표

pseudo R₂ = 1 - ( ln Lᵤ / ln L₀ )

( 제약이 없는 모델의 대수우도 ) / ( 제약이 있는 모델의 대수우도 ) 는 반드시 0과 1 사이를 취한다.
모든 계수가 0이라면,
( 무제약 모델의 대수우도 ) = ( 제약 모델의 대수우도 ) 이므로 ln Lᵤ / ln L₀ = 1 이 된다,
→ pseudo R₂ = 0
추정된 계수를 이용한 설명력이 높을수록 ln Lᵤ 는 상승하여 음의 영역에서 더 0에 가까워진다.
→ pseudo R₂ 는 0에 가까워진다.

R을 이용한 프로비트 로짓 모델

프로비트 로짓 모델의 예를 보여주기 위해 다음 데이터를 사용합니다.

library ( AER )
data ( SwissLabor )

AER 패키지의 SwissLabor라는 데이터를 사용한다.
이 데이터는 1981년 스위스에서 수집된 노동시장 관련 데이터입니다.

사용 데이터

Participation：노동력에 참여했습니까? ( 1 or 0 )
income：노동 외 소득의 로그
age：연령(년을 10으로 나눈 값)
education ：공식 교육을 받은 기간
youngkids ：어린 자녀 수(7세 미만)
oldkids ： 나이가 많은 자녀 수(7세 이상)
foreign: 해당 개인이 외국인(예, 스위스인이 아님)?

R을 이용한 프로비트 모델

프로비트 모델

probit1 < -
glm ( participation ~ income + age + education + youngkids + oldkids + foreign ,
data = SwissLabor , family = binomial ( link = " probit " ) )
summary ( probit1 )

# participation => y = 1 or 0

사용하는 함수는 glm
프로비트의 경우,

family = binomial ( link = " probit " )

로 지정한다.

R을 이용한 프로비트 모델
결과는 다음과 같다.

Log Likelihood => 대수우도

R을 이용한 프로비트 모델

psuedo R2 계산하기

1) 제약 조건이 없는 모델의 대수우도(Log-likelihood)는

logLik ( probit1 ) # Log-likelihood

2) 제약조건이 있는 모델의 대수우도(Log-likelihood)는

probit1_null <- glm ( participation ~ 1 , data = SwissLabor ,
family = binomial ( link = " probit " ) )
logLik ( probit1_null )

psuedo R2는

1 - logLik ( probit1 ) / logLik ( probit1_null )

= 0.1248651

R을 이용한 프로빗 모델

각 계수의 영향력 크기를 비교하기 위해 Partial effect를 살펴본다.
→ 이를 위해서는 " mfx "라는 패키지가 필요

#install.packages ( " mfx " )
library ( mfx )

다음과 같이 한계효과를 추정한다.

probitmfx ( participation ~ income + age + education + youngkids + oldkids + foreign ,
data = SwissLabor , atmean = FALSE )

R을 이용한 프로비트 모델

psuedo R2 계산하기
→ " pscl " 패키지를 사용한다.

pR2 ( probit1 ) # psuedo R2

로 fitting null model for pseudo-r2

llh	llhNull	G2	McFadden	r2ML	r2CU
-526.4913560	-601.6116830	150.2406540	0.1248651	0.1582686	0.2114810

R을 사용한 로지트 모델

로지트 모델의 경우

logit1 < -
glm ( participation ~ income + age + education + youngkids + oldkids + foreign ,
data = SwissLabor , family = binomial ( link = " logit " ) )
summary ( logit1 )

로짓의 경우,

family = binomial ( link = " logit " ) )

또는

family = binomial

R을 이용한 로지트 모델

각 계수의 영향력의 크기를 비교하기 위해 Partial effect를 살펴본다.
→ 이를 위해서는 " mfx "라는 패키지가 필요합니다.

# install.packages ( " mfx " )
library ( mfx )

다음과 같이 한계효과를 추정한다.

logitmfx ( participation ~ income + age + education + youngki ds + oldkids + foreign ,
data = SwissLabor , atmean = FALSE )

프로빗의 한계 효과

로짓의 한계 효과

다음
- 매칭 (1)

저작자표시 (새창열림)

'WBS - 2023 Fall > 기업경제학 연습' 카테고리의 다른 글

(기업경제 #11) 불연속 회귀의 개념 (0)	2023.12.21
(기업경제 #10) 성향 점수를 사용하지 않는 매칭 \| 복원 매칭과 비복원 매칭 (0)	2023.12.14
(기업경제 #9) Matching (0)	2023.12.06
(기업경제 #7) DID \| Difference-in-Difference (차이의 차이 분석) (0)	2023.11.16
(기업경제 #6) 패널 분석 (Panel data analysis) (0)	2023.11.09
(기업경제 #5) 더미 변수를 이용한 분석 (0)	2023.11.02
(기업경제 #4) 이상치 처리 \| 선형 회귀 모델(2) (0)	2023.10.26
(기업경제 #3) 선형회귀 Model (0)	2023.10.19

FastCho

(기업경제 #8) 로지트 모델(Logit Model)과 프로빗 모델(Probit Model)

'WBS - 2023 Fall > 기업경제학 연습' 카테고리의 다른 글

티스토리툴바

(기업경제 #8) 로지트 모델(Logit Model)과 프로빗 모델(Probit Model)

'WBS - 2023 Fall > 기업경제학 연습' 카테고리의 다른 글

관련글

티스토리툴바