(기업경제 #7) DID | Difference-in-Difference (차이의 차이 분석)

기업경제학 실습: 제7회

오늘의 일정

데이터 결합
차이의 차이 분석(Difference-in-Difference: DID)
DID를 이용한 분석 예시:
동족기업 CEO 승계 이벤트로 인해 동족기업은 비동족기업에 비해 상대적으로 높은 성과를 창출할 수 있는가?

여러 데이터 결합에 대하여

여러 데이터를 가로로 결합하려면 join 함수가 편리합니다.
준비로 두 개의 서로 다른 파일을 준비합니다.

a <- data.frame (
x1 = c ( "A" , "B" , "C" ) , x2 = c ( "1" , "2" , "3" ) )

b <- data.frame (
x1 = c ( "A" , "B" , "D" ) , x3 = c ( "TRUE" , "FALSE" , "TRUE" ) )

여러 데이터 결합에 대하여

>a	x1	x2	>b	x1	x3
1	A	1	1	A	TRUE
2	B	2	2	B	FALSE
3	C	3	3	D	TRUE

여러 데이터 결합에 대하여

a와 b의 공통된 부분만 매칭하여 연결한다.

inner <- inner_join ( a , b , by = "x1" )

by = "변수명" 으로 여러 개의 데이터 일치시키기

	x1	x2	x3
1	A	1	TRUE
2	B	2	FALSE

여러 데이터 결합에 대하여

a의 모든 행을 표시하고, b와 일치하는 행도 표시한다.

left <- left_join ( a , b , by="x1" )

	x1	x2	x3
1	A	1	TRUE
2	B	2	FALSE
3	C	3	<NA>

여러 데이터 결합에 대하여

left_join의 역

right <- right_join ( a , b , by = "x1" )

	x1	x2	x3
1	A	1	TRUE
2	B	2	FALSE
3	D	<NA>	TRUE

여러 데이터 결합에 대하여

a와 b의 모든 행을 표시한다.

full <- full_join ( a , b , by = "x1" )

	x1	x2	x3
1	A	1	TRUE
2	B	2	FALSE
3	C	3	<NA>
4	D	<NA>	TRUE

여러 데이터 결합에 대하여

join 함수는 tidyverse package가 전제
tidyverse를 사용하지 않는 경우 inner_join과 동일한 결과를 얻으려면

merge_file <- merge ( a , b, by = "x1" )

	x1	x2	x3
1	A	1	TRUE
2	B	2	FALSE

여러 데이터 결합에 대하여

3사의 panel 데이터를 사용한 예시

roa <- read.csv ( " testroa.csv " )

Panel 데이터를 위해 다음 패키지를 사용합니다.

library ( plm )

Panel 데이터임을 선언

roa.p <- pdata.frame ( roa , index = c ( " ID " , " year " ) )

여러 데이터 결합에 대하여

데이터 구조 확인

pdim ( roa.p )

Balanced Panel : n = 3 , T = 6 , N = 18
→ 기업 수(n)는 3, 연도(T)는 6년 분량의 Balanced Panel

샘플을 ID별로 묶어 표준편차 계산

by_ID <- group_by ( roa.p , ID )
std_roa <- summarise ( by_ID , std_roa = sd ( ROA , na.rm = TRUE ) )

여러 데이터 결합에 대하여

데이터 확인

std_roa

여러 데이터 결합에 대하여

원본 데이터 파일에 표준편차 연결

roa2 <- inner_join ( roa.p , std_roa , by = "ID" )

DID or Difference-in-Difference

DID(차이의 차이 분석)은 경제 환경이나 정책 등의 변화의 영향을 이해하기 위한 방법으로
'유사실험(quasi-experimental)'이라고 불리는 방법이다.
경제 환경이나 정책의 변화를 '외생적' 변화로 간주하고, 그 전후로 분석 대상이 어떻게 변화했는지 검증하는 방법

문제 예시

문 : 파산비용의 하락은 부채비용에 어떤 영향을 미치는가?
이상적인 또는 불가능한 분석 방법 (=first best)
- 특정 기업군에 대해 파산비용을 낮춘다.
- 부채비율을 계산한다.
- 시계바늘을 되돌리고 동일한 기업에 대해 파산비용을 변화시키지 않고 부채비율을 계산한다.
- 두 결과를 비교한다.
여기서 '반사실(counterfactual)은 시계 바늘을 되돌리고 난 후의 현실

문제 예시

질문: 파산비용의 감소는 부채비용에 어떤 영향을 미치는가?
바람직하지만 역시 실행 불가능한 분석 방법(=second best)
- 한 기업군 중에서 무작위로 일부 기업만을 추출하여 그 기업군에만 파산비용을 변화시킨다.
- 두 그룹의 결과를 비교한다.
여기서 '반사실(counterfactual)'은 무작위로 두 개의 샘플 그룹을 만들어서 실현

자연실험

1991년 말 Delaware, 기업 파산을 보다 쉽게 하는 법 개정 실시 → 파산 비용 감소
이 법 개정은 기업의 부채비율과 무관해야 함.
만약 Delaware의 기업 부채비율이 유의미하게 높고 그것이 이 법 개정의 요인이라고 한다면,
이 법 개정은 '자연실험'이라고 할 수 없다.
이 법 개정이 자연실험이라고 할 수 있다면, 이를 이용하여 파산비용과 부채비율의 인과관계를 테스트할 수 있다.

법 개정 후 기업 간 부채비율 비교

델라웨어 주 기업과 다른 주 기업의 평균 부채비율 비교 : Cross-section(횡단면) 분석
yᵢ = β₀ + β₁ I ( treatᵢ ) + εᵢ
yᵢ : 기업 i의 1992년 부채비율
I ( treat ) = 1 : Delaware 기업이라면 1을 부여하는 더미변수 ( 1 or 0 )

법 개정 후 기업 간 부채비율 비교

여기서는 (설명변수와 오차항과는 상관관계가 없다 -> 회귀분석의 대 전제)

E ( εᵢ | I ( treatᵢ ) ) = 0

E ( yᵢ | I ( treatᵢ ) = 0 ) = β₀

E ( yᵢ | I ( treatᵢ ) = 1 ) = β₀ + β₁

E ( yᵢ | I ( treatᵢ ) = 1 ) - E ( yᵢ | I ( treatᵢ ) = 0 ) = β₁

1992년 처리군(treatment group)인 Delaware 기업과 대조군(control group)인 비 Delaware 기업 비교

법 개정 후 기업 간 부채비율 비교

여기서 문제가 되는 것은 E ( εᵢ | I ( treatᵢ ) ) = 0
만약 Delaware 기업이 다른 지역 기업에 비해 자본집약적이라면 어떻게 될까?
이 경우, 자본집약적인 기업일수록 부채비율은 일반적으로 높아지는 경향이 있다.
자본집약도는 오차항에 포함되어 있다.
→ Delaware 기업이라는 것 I ( treatᵢ ) 과 오차항 ε 가 상관관계
법 개정의 유무와 관계없이 Delaware 기업은 이 높은 자본집약도 때문에 부채비율을 높이게 될 것이다.

법 개정 후 기업 간 부채비율 비교

이는 전형적인 누락변수 편향 의 문제입니다.
본래 각 기업의 자본집약도를 CI라고 하자,
yᵢ = β₀ + β₁ I ( treatᵢ ) + β₂ CIᵢ + εᵢ
인 곳을
yᵢ = β₀ + β₁ I ( treatᵢ ) + εᵢ
운 좋게 CI를 포착하는 변수를 찾으면 좋겠지만, 항상 찾을 수 있는 것은 아니다.

법 개정 전과 후의 동일 기업 부채비율 비교

Delaware주 기업의 평균 부채비율을 법 개정 전후(1991년과 1992년)로 비교 :
시계열 분석 → 기업 간 차이(이질성) 문제 없음
yᵢₜ = β₀ + β₁ I ( Postᵢₜ ) + εᵢₜ
yᵢₜ = 기업 i의 1992년 부채비율
I ( Post ) = 1 : 1992년이면 1, 1991년이면 0을 부여하는 더미 변수

법 개정 전과 후의 동일 기업 부채비율 비교

여기서는 (오차항과 Post와의 관계가 0이면 해결됨)

E ( εᵢₜ | I ( Postᵢₜ ) ) = 0

E ( yᵢₜ | I ( Postᵢₜ ) = 0 ) = β₀

E ( yᵢ | I ( Postᵢₜ ) = 1 ) = β₀ + β₁

E ( yᵢₜ | I ( Postᵢₜ ) = 1 ) - E ( yᵢₜ | I ( Postᵢₜ ) = 0 ) = β₁

1992년 델라웨어 기업의 평균 부채비율과 1991년 델라웨어 기업의 평균 부채비율을 비교한 것이다.

법 개정 전과 후의 동일 기업 부채비율 비교

여기서 문제가 되는 것은 E ( εᵢₜ | I ( Postᵢₜ ) ) = 0
1991년과 1992년 사이에 어떤 이유(예를 들어, 금융기술의 발전)로 인해 부채의 공급이 쉬워졌다고 가정해보자.
이 경우 기술혁신의 발생은 오차항에 포함되기 때문에,
'1992년이라는 것'과 오차항 ε 가 상관관계
법 개정의 유무와 관계없이 Delaware 기업은 자금공급 측면의 변화로 인해 부채비율을 높이게 된다.
→ 누락변수 편향이 여전히 발생한다.

DID 추정

DID 추정은 Cross-section(횡단면) 분석과 시계열 분석의 장점을 결합한 것이다.
횡단면 분석에서는 각 그룹에 공통적으로 발생하는 충격(금융기술의 발전, 거시경제적 충격 등)이
추정에 미치는 영향은 없다.
시계열 분석에서는 기업 간 이질성에 따른 문제가 없다.

DID 추정

다음은 일반적인 DID 추정 모델입니다.

yᵢₜ = β₀ + β₁ I ( Treatᵢₜ ) + β₂ I ( Postᵢₜ ) + β₃ ( I ( Postᵢₜ ) x I ( Treatᵢₜ ) ) + εᵢₜ

DID 추정

피설명변수(성능)
= β0 + β1 × ( 처리 ) + β2 × ( 시점 ) + β3 × ( 처리 × 시점 ) + 오차항

( 치료 ( treat ) ) 는 ( 치료 없음 ) = 0 , ( 치료 있음 ) = 1
( 시점 ( Post ) ) 은 ( 치료 전 ) = 0 , ( 치료 후 ) = 1

DID 추정

Post : After / Before

Treat : 치료군 / 대조군

	After(1992)	Before(1991)	After-Before
치료군(Delaware 기업)	β₀ + β₁ + β₂ + β₃	β₀ + β₁	β₂ + β₃
대조군(Non-Delaware 기업)	β₀ + β₂	β₀	β₂
치료군 - 대조군	β₁ + β₃	β₁	β₃

(실적) = β₀ + β₁ × ( 치료 ) + β₂ × ( 시점 ) + β₃ × ( 치료 × 시점 ) + 오차항

DID 추정

치료군(treatment group)
- YDa : Delaware 기업의 1992년 실적
- YDb : Delaware 기업의 1991년 실적
대조군(control group)
- YNDa : Non-Delaware 기업의 1992년 실적
- YNDb : Non-Delaware 기업의 1991년 실적

DID 추정

DID estimator를 δDID라고 하면, 이것은,
δDID = ( YDa - YDb ) - ( YNDa - YNDb ) = Δ YF - Δ YNF
→ '차이의 차이'이므로 DID estimator라고 합니다.
또한 이 식을 변형하면,
δDID = ( YDa - YNDa ) - ( YDb - YNDb )
시간에 따라 변하지 않는 두 주체의 차이(고정효과)는 제거된다.

평행추세 가정

개입 이벤트가 없다면, 치료군과 대조군 간의 이벤트 전후의 변화량은 동일할 것으로 가정

DID 분석 예시

Kiel and McClain(1995) : 1978년 매사추세츠 주 North Andover에서 새로운 쓰레기 소각 시스템 건설 계획 발표
→ 1981년 실제 건설 시작
가설 : 시설과 가까운 주거지역일수록 가격이 하락할 것이다.
Rprice: 주택가격의 실질가격
Nearinc: 이웃에 시설이 있는 경우에는 1, 그 외에는 제로

DID 분석 예시

데이터 불러오기

kielmc <- read.csv ( " kielmc.csv " , header = TRUE )

head ( kielmc )
tail ( kielmc )

DID 분석 예시

1978년만 분석

result78 <- lm ( log ( rprice ) ~ nearinc , data = kielmc , subset = ( year == 1978 ) )

summary ( result78 )

추정된 계수만 표시

coeftest ( lm ( log ( rprice ) ~ nearinc , data = kielmc , subset = ( year == 1978 ) ) )

1978년만 분석

DID 분석 예시

1981년만 분석

result81 <- lm ( log ( rprice ) ~ nearinc , data = kielmc , subset = ( year == 1981 ) )

summary ( result81 )

1981년만 분석

DID 분석 예시

DID 분석

Did <- lm ( log ( rprice ) ~ nearinc * y81 , data = kielmc )
summary ( Did )

nearinc : y81 → 유의미한 결과가 나오지 않음

DID 분석 예시

제어 변수를 늘리면

Didcontr <- lm ( log ( rprice ) ~ nearinc * y81
+ age + log ( intst ) + log ( land ) + log ( area ) + rooms + baths , data = kielmc )
summary ( Didcontr )

nearinc*y81 : 유의하게 음(-)의 값 → 1981년 실제 착공 후 가격에 음(-)의 영향을 미침

Dependent variable:

초록 박스가 DID 계수로 nearinc * y81 결과I (treat) x I (Post)

DID를 이용한 분석 사례

M.Benndesen, K. M. Nielsen, F.P-Gonzalez, and D. Wolfenzon (2007)
동족기업의 CEO는 가족 중에서 선택하는 것이 좋은가, 아니면 가족과 무관한 사람을 선택해야 하는가?

구체적인 검증 방법: "CEO가 동족 간 또는 동족에서 비동족으로 교체되기 전과 후의 기업 성과가 달라지는지 테스트한다."

데이터 : 덴마크 기업(상장, 비상장 모두 포함) 사용
← 경영자의 가족 구성 등의 데이터가 풍부함

가족기업의 비용과 편익

1) 가족 중 CEO를 선택하는 것의 이점
- 금전적 인센티브 외에도 기업 가치를 높일 수 있는 인센티브가 있다.
- 장기적인 관점에서 경영을 할 수 있다.
- 다른 이해관계자로부터 신뢰를 얻기 쉽다.
2) 가족 중 CEO를 선택하는 것의 비용
- 가족의 가치와 비즈니스상의 가치가 일치하지 않는다.
- 경영자 풀의 선택지가 작아진다.

표본 기업 특징: Table 1

CEO 교체 시점에 신임 CEO가,
- 이전 CEO와 혈연관계에 있는 경우 Family
- 이전 CEO와 혈연관계가 없는 경우 Unrelated
또한, Table2에서 다음과 같은 분류도 사용한다.
- 신임 CEO가 전임 CEO와 친자관계(아들, 딸)인 경우 : Children
- 신임 CEO가 전임 CEO와 친인척 관계인 경우 : Others

표 1. CEO 승계 유형별 기업 특성

Table 1. Firm Characteristics by Type of CEO Succession

표본 기업 특징: Table 1

Family와 Unrelated 간 각 변수 간 차이가 있는지 살펴본다.
1. 총자산 대비 수치 : Family가 유의하게 작다.
2. OROA(EBIT/총자산) : Family가 유의하게 높다.
3. Net income(세후이익/총자산) : Family가 유의하게 높다.
4. Industry-adjusted OROA : Family가 유의하게 높음.

※ Industry-adjusted OROA는 각 기업의 OROA에서 해당 기업이 속한 산업의 OROA 평균치를 뺀 값

표 2. 퇴임하는 CEO의 기업 승계 및 가족 특성

Table 2. Firm Successions and Family Characteristics of Departing CEOs

CEO의 가족 구성 및 승계: Table2-A, B

퇴임하는 CEO의 배우자가 1명인 경우, 동족이 CEO를 승계 하는 비율 : 36.0
퇴임하는 CEO의 배우자가 2명인 경우, 동족이 CEO를 승계 하는 비율 : 25.2
→ 배우자가 늘어날수록 동족이 CEO를 승계하는 비율은 10.7% 하락한다.

자녀 수가 1명일 때 동족이 CEO를 승계하는 비율 비율 : 29.1%
자녀 수가 3명이었을 때 동족에게 CEO를 승계시키는 비율 비율 : 41.3%
→ 자녀 수가 1명에서 3명으로 늘어날 때 CEO를 승계시키는 비율 승계시키는 비율은 12.2%

CEO의 가족 구성 및 승계:Table2-C

C:
1) 자녀 수 중 남자아이 비율이 50% 미만인 경우 동족이 CEO를 승계하는 비율 : 28.9 %.
2) 자녀 수 중 남자아이 비율이 50% 이상인 경우 동족에게 CEO를 승계시키는 비율 : 39.7%.
→ 2) - 1) 을 계산하면, 10.8 %
→ 남자아이 비율이 높을수록 동족에게 승계할 가능성이 높아진다.

같은 계산을 자녀에게 승계하는 경우로 계산하면,
남자아이 비율이 50%를 초과할수록 동족에게 승계할 가능성은 14.3% 더 높다.
같은 계산을 친족에게 승계하는 경우로 계산하면,
남자아이 비율이 50%를 초과할수록 동족에게 승계할 가능성은 3.3% 낮다.

CEO의 첫째 자녀 성별 및 승계:Table2-D

전임 CEO의 첫째 자녀의 성별에 따라 차기 CEO가 동족으로 선출될 가능성 여부 조사

첫째 자녀가 남성인 경우 여성인 경우보다 동족이 차기 CEO로 선출될 가능성이 9.6% 더 높음
첫째 자녀가 남성인 경우 여성인 경우보다 동족 및 자녀가 차기 CEO로 선출될 가능성이 10.08% 더 높음
첫째 자녀가 남자인지 여부는 동족 및 친인척이 차기 CEO로 선출될 가능성에 영향을 미치지 않는다.

※ 덴마크의 여성 CEO 비율은 2004년 기준 25%이다.

DID

'동족에게 승계한' 기업을 처리군(treatment)
'동족에게 승계하지 않은' 기업을 대조군(control)
승계 전 시점: 0시점, 승계 후 시점: 1시점으로 할 때,
'처리 여부=동족 승계 여부'가 성과에 영향을 미치는지 여부가 분석의 초점이 된다.

분석 결과(Table 4-A)

성과지표로는 산업 조정 OROA
- CEO 교체 전 3년간 = before
- CEO 교체 후 3년간 = after
결과(1): 표본 전체적으로는 CEO 교체에 따라 0.8%의 성과 증가(유의미한 차이)
결과(2)와 결과(3) 비교: 동종기업의 CEO 교체는 다른 기업에 비해 성과가 좋을 때 발생(차이는 유의미)

분석 결과(Table 4-A)

결과 (2)와 (3)의 before와 after의 변화 비교:
- 친인척 간 CEO 교체 전후에 성과에 유의미한 변화 없음
- 친족 간 CEO 교체 전후에 성과는 유의하게 개선됨.
  → 친족 간 CEO 교체로 1.4퍼센트의 상대적 성과 감소가 나타남

CEO 승계 결정과 CEO 교체에 따른 기업 성과

CEO Succession Decisions and Firm Performance Around CEO Transitions

다음 글

프로빗 모델(Probit Model)과 로지트 모델(Logit Model)

저작자표시

'WBS - 2023 Fall > 기업경제학 연습' 카테고리의 다른 글

(기업경제 #11) 불연속 회귀의 개념 (0)	2023.12.21
(기업경제 #10) 성향 점수를 사용하지 않는 매칭 \| 복원 매칭과 비복원 매칭 (0)	2023.12.14
(기업경제 #9) Matching (0)	2023.12.06
(기업경제 #8) 로지트 모델(Logit Model)과 프로빗 모델(Probit Model) (0)	2023.11.29
(기업경제 #6) 패널 분석 (Panel data analysis) (0)	2023.11.09
(기업경제 #5) 더미 변수를 이용한 분석 (0)	2023.11.02
(기업경제 #4) 이상치 처리 \| 선형 회귀 모델(2) (0)	2023.10.26
(기업경제 #3) 선형회귀 Model (0)	2023.10.19

FastCho

(기업경제 #7) DID | Difference-in-Difference (차이의 차이 분석)

'WBS - 2023 Fall > 기업경제학 연습' 카테고리의 다른 글

티스토리툴바

(기업경제 #7) DID | Difference-in-Difference (차이의 차이 분석)

'WBS - 2023 Fall > 기업경제학 연습' 카테고리의 다른 글

관련글

티스토리툴바