본문으로 바로가기

데이터가이드

KLIPS의 데이터를 가장 효과적으로 활용할 수 있는 방법

데이터 활용

(데이터 Merge 2) 가구용 자료의 연도간 Merge

  • 작성일2021.03.24
  • 조회수1,347
가구용 자료는 가구를 분석단위로 하며, 가구의 가구소득, 가구소비, 자산, 부채, 주거지, 자녀교육 등의 정보를 담고 있습니다.
노동패널의 가구번호는 크게 당해 연도 가구번호와 원가구 번호로 구성되어져 있습니다. 가구용 자료에는 가구번호가 여러 개 존재하는데, 이는 노동조사에 “한번이라도 응답한 적이 있는 모든 가구”를 기준으로 자료가 생성되어 있기 때문입니다.

예를들어, 22차년도 가구용 자료에는 orghid98, orghid09, orghid21, hhid02-hhid22와 같이 22개의 가구번호가 있습니다.
이들은 각각 1998년 원가구번호(orghid98), 2009년 추가표본 패널고유번호(orghid09), 2018년 추가표본 패널고유번호(orghid18), 2차 가구번호(hhid02) - 22차 가구번호(hhid22)를 의미합니다.
원가구번호는 1차년도 조사당시의 가구번호를 의미하며, 1-22차 가구번호는 각 해마다 조사된 가구번호를 의미합니다. 따라서 해당연도에 조사되지 않은 가구일 경우 해당연도의 가구번호가 missing값을 가집니다.

가구용 자료의 시계열 연결을 위해서는 연구의 목적에 따라 가구번호를 사용하면 됩니다.
그러나 가구의 변동과 같은 특정상황을 분석하고자 하는 것이 아니라면, 일반적으로 원가구번호가 아닌 당해 연도 가구번호를 기준으로 merge하는 것이 대부분입니다.
여러 차수의 개인용 자료를 merge하는 과정은 다음과 같습니다.

① 각 차수별로 merge하고자 하는 변수를 구성한다.
② 각 차수별 응답한 가구만 Keep한다. 가구용 자료의 경우 ‘hwave** = 1’인 경우가 각 차수별로 응답한 가구에 해당한다.
③ 각 차수별 가구용 자료를 hhid 기준으로 정렬("sort")한다.
④ 기준변수 hhid를 이용해 각 차수별 가구용 자료를 merge한다.

첨부파일은 1-22차년도 가구용 자료를 merge하는 Stata 통계패키지의 코드 예시입니다.
첨부파일

스크랩