본문으로 바로가기

데이터가이드

KLIPS의 데이터를 가장 효과적으로 활용할 수 있는 방법

데이터 활용

(데이터 Merge 3) 가구용 자료와 개인용 자료 Merge

  • 작성일2021.03.24
  • 조회수1,704
노동패널자료에서는 가구자료와 개인자료를 병합해서 사용해야 할 경우가 많습니다.
예컨대, 22차년도 자료를 이용하여 가구 총 소비를 종속변수로 하는 회귀분석 모형을 구성한다고 해봅시다.
그리고 설명변수를 가구총소득, 자산, 부채, 총 가구원수, 가구주의 성별, 연령, 가구주의 경제활동상태 등의 변수들로 구성해본다고 가정해봅시다.

이 때 다른 모든 변수들은 가구자료 내에서 자체적으로 구성할 수 있지만, 가구주의 경제활동상태는 개인자료에서 별도로 구성한 다음 가구자료로 붙여야 합니다.

이런 경우 다음과 같은 절차를 따르면 됩니다.

STEP 1: 개인용 자료 구성
① 각 차수별로 merge하고자 개인용 자료의 변수를 구성한다.
② 가구주의 경제활동상태만을 "keep"한다. 개인자료의 경우 ‘p**0102 = 10’인 경우가 가구주에 해당한다.

③ 각 차수별 개인용 자료를 pid 기준으로 정렬("sort")한다.
④ 기준변수 pid를 이용해 각 차수별 개인용 자료를 merge한다.

STEP 2: 가구용 자료 구성
① 각 차수별로 merge하고자 가구용 자료의 변수를 구성한다.
② 각 차수별 응답한 가구만 Keep한다. 가구용 자료의 경우 ‘hwave** = 1’인 경우가 각 차수별로 응답한 가구에 해당한다.
③ 각 차수별 가구용 자료를 hhid 기준으로 정렬("sort")한다.
④ 기준변수 hhid를 이용해 각 차수별 가구용 자료를 merge한다.

STEP 3: 가구용, 개인용 자료 merge
① merge한 가구용, 개인용 자료를 hhid 기준으로 정렬("sort")한다.
② 기준변수를 이용해 가구자료와 개인자료를 merge한다.

첨부파일은 1-22차년도의 가구주의 가구용 자료와 개인용 자료를 merge하는 Stata 통계패키지의 코드 예시입니다.
첨부파일

스크랩