홈 한국노동패널조사 FAQ
한국노동패널조사

FAQ

총 게시물 33개  페이지 1 / 4
  • 질문 KLIPS-CNEF 자료를 받으시는 법
    답변
    1단계) klips@kli.re.kr 로 메일을 보내시어 User Agreement 양식을 받습니다.

    2단계) User Agreement 양식을 작성하여 이메일, 우편, 팩스 중 선택하여 보냅니다.

    이메일: klips@kli.re.kr
    우편: 세종특별자치시 시청대로 370 세종국책연구단지 경제정책동(C동) 한국노동연구원 5층 노동패널팀 501호
    팩스: 044-287-6669  

    3단계) 보내주신 양식에 대해 저희 노동패널팀에서 확인이 끝나면 오하이오 대학교의 CNEF 팀 및 신청자에  확인 사실을 공지하게 됩니다. 확인 사실을 공지받은 신청자께서는  오하이오 대학교 측에 $125 payment 를 기부 (최초 1회만 지불) 하시고 나면 오하이오 대학의 CNEF 팀에서 데이터를 신청자께 전송하게 됩니다.
    자료 수령과 관련하여 궁금한 사항이 있으시면 klips@kli.re.kr 로 문의하시면 됩니다.
    CNEF 자료와 관련하여 궁금한 사항은 http://cnef.ehe.osu.edu/ 참조하시기 바랍니다.
  • 질문 노동패널 잘 쓰는 방법?
    답변
    노동패널자료의 조사차수가 늘어나면서 자료의 한계로 인해 할 수 없었던 많은 실증연구들이 가능해졌다. 그러나 패널자료 분석에 뛰어들었던 많은 연구자들이 이내 분석을 포기하고 마는 경우가 종종 있는데, 이는 변수가 워낙 많고 자료도 복잡하기 때문이다. 19차 조사 자료에만 총 2천여개의 변수들이 개인용․가구용․부가조사용․직업력 자료를 구성하고 있다. 이 변수들 중에서 분석모형에 사용할 변수들을 일일이 찾아내야 한다. 고생 끝에 필요한 변수들을 찾아낸다 하더라도 어떤 것을 선택해야 적절한지 난감할 수 있다.

    당연한 말이겠지만 패널자료를 잘 쓰기 위해서는 인내심을 갖고 느긋하게 자료를 이리저리 만져보는 것이 필요하다. 코드북과 데이터만 갖고서는 제대로 된 분석을 하기 어렵다. 동일한 변수라도 각 연도별로 항목값이 다른 경우가 많으므로 반드시 각각의 변수에 대해 설문지를 확인해야 한다. 만일 노동패널을 처음 사용하는 연구자라면 자료를 만지기 전에 아래의 절차를 밟기를 추천한다.  

    1. 먼저 유저가이드 1장 한국노동패널소개와 3장 자료의 주요 특성 부분을 읽어본다.
    2. 자료를 열어보기 전에 먼저 설문지를 전체적으로 훑어본다. 특히 관련 문항들의 전후구조에 유의한다.
    3. 다음으로 설문지에 분석주제와 관련된 문항들이 있는지를 하나하나 체크한다.
    4. 설문지에서 체크한 문항들이 실제로 코드북의 변수값과 일치하는지를 체크한다.
      - 이때 해당 주제와 관련한 내용이 유저가이드에 언급되어 있는지를 확인한다. 유저가이드의 변수가이드와 주제별 가이드에는 연구자들이 놓치기 쉬운 데이터의 핵심 내용을 최소한으로 요약한 것이므로 참조가 될 것이다.
    5. 데이터 기초분석을 통해 관련 변수들의 빈도값이 코드북에 나와있는 빈도값과 일치하는지를 확인한다. 이때 missing값의 처리에 주의한다.




    ◎ FAQ에 사용된 예제 프로그램에 대해

      1. 아래의 예제 프로그램들은 노동패널 19차년도 Release 자료를 기초로 작성되었다. 주의할 점은 자료를 불러오기 위해서는 경로를 지정해 주어야 된다는 점이다. 아래의 예제에서는 다음과 같이 지정하였다.
          ※ SAS library명은 다음과 같다: a-data 폴더, new-새폴더.
               libname a ‘D:\15차\data\[SAS] 1-19th 자료'
               libname new ‘D:\15차\data\[SAS] 1-19th 자료\new'
      
          ※STATA 는 cd로 파일경로를 지정하고, klips 데이터는 용량이 크므로 충분한 메모리를 할당 시켰다.
               cd "D:\19차\data\[STATa10] 1-19th 자료"
               clear
               set memory 700m, permanently //klips

      2. R에서 사용된 패키지는 최초 설치 후에는 재설치 할 필요가 없다. R studio 가동 시 1회만 실행해주면 된다. 아래의 예제 프로그램들에서는 총 5개의 패키지가 사용되었다.
    "Reshape2", "dplyr", "foreign", "plyr", "gmodels".

      3. 아래의 예제 프로그램들은 단지 ‘예제’일 뿐임을 주지하기 바란다. 즉, 해당주제와 분석목적에 따라 노동패널팀 필자들과는 얼마든지 다른 정의와 구분을 토대로 프로그램을 작성할 수 있다. 프로그램의 효율성 면에서도 얼마든지 훨씬 효율적인 프로그램을 만들 수 있을 것이다.

    <한국노동패널 1~19차년도 조사자료 User's Guide 112p 참고>
  • 질문 노동패널자료를 이용하여 비정규직 규모를 추산하는 방법은?
    답변
    1. 노사정위원회 합의안에 근거한 비정규직

    우리나라의 비정규직 분류는 2002년 7월 노사정위원회에서 합의된 바에 근거한다. 즉, 고용형태가 한시적근로자, 시간제근로자, 비전형근로자에 해당하는 노동자가 비정규직으로 분류된다. 여기서 비전형근로자는 파견근로자, 용역근로자, 특수형태근로종사자, 가정내근로자, 일일(단기)근로자를 포함한다.
    한국노동패널조사는 5차(2002)년도부터 미국에서 주로 사용하는 한시적근로자뿐만 아니라 파견, 용역, 독립도급, 가내근로 등 대안적 고용형태를 측정할 수 있는 문항들을 추가하였으며, 10차(2007)년도부터는 관련 문항을 보강하여 다양한 형태의 비정규직 규모를 추산할 수 있게 되었다(고용형태 부가설문의 구조와 내용에 대한 자세한 사항은 이상호, 「노동패널 10차년도 고용형태 부가조사의 개요 및 주요 결과」, 노동리뷰 2008년 7월호를 참고.)
    통계청의 「경제활동인구 부가조사」에 따르면, 우리나라의 임금근로자 대비 비정규직 비율은 2005년 8월 36.6%에서 점차 하락하여 2016년 8월 32.8%이다. 한국노동패널조사는 이와 다소 차이를 보이고 있다. 통계청과 동일한 기준으로 추산된 한국노동패널조사의 임금근로자 대비 비정규직 비율은 2009년 31.4%에서 점증하여 2016년 35.6%이다. 수치상으로는 큰 차이를 보이고 있지 않으나 추세는 다르게 나타나고 있다. 이러한 차이는 조사방법의 차이에 기인한 것으로 보인다(자세한 내용은 노동패널자료 연구(Ⅰ) 제3장을 참조). 그러나 한국노동패널조사는 취업률, 실업률, 산업별 및 직종별 취업자 비율, 노동시간, 평균임금 등 대부분의 핵심변수들이 기준통계자료들과 큰 차이를 보이지 않고 있어 여전히 그 신뢰성이 높다고 볼 수 있다.

    2. 종사상 지위에 따른 비정규직

    한국노동패널조사에서는 또한 종사상 지위에 따른 비정규직 규모를 추산할 수 있다. 그러나 한국노동패널조사의 종사상 지위는 고용계약기간만을 기준으로 결정되는 반면, 「경제활동인구 부가조사」에서는 보다 엄격한 기준을 적용하므로 양 조사 간 차이가 존재한다. 보다 자세히 설명하자면, 「경제활동인구 부가조사」는 먼저 고용계약기간에 따라 종사상 지위를 상용직, 임시직, 일용직으로 구분한다. 이후 상용직 중에서 동일한 사내 규범의 적용 여부, 퇴직금 및 상여금 수령 여부, 부가급여 수급 여부 등을 고려할 때 차별적 대우를 받고 있는 노동자를 다시 임시직 혹은 일용직으로 재분류하고 있다.

    3. 자기 선언적 비정규직

    한국노동패널조사에서는 자기 선언적 비정규직 여부를 추가로 조사하고 있다. 자기 선언적 비정규직 여부는 응답자에게 비정규직의 정의에 대해 최소한의 정의만을 제시하고 고용형태에 대한 판단을 맡기는 것이다. 따라서 앞서 종사상 지위가 임시직 또는 일용직인 응답자들은 대부분 이에 대해 비정규직으로 응답한다. 실제로 매년 80% 이상의 자기 선언적 비정규직이 임시직 혹은 일용직인 것으로 나타나고 있다. 단, 자기 선언적 비정규직 여부는 3차(2000)년도에 조사되지 않았다.


    *====================================;
    *  SAS를 이용한 고용형태의 구성  ;
    *====================================;

    * 한시적근로자 ;
    IF p190501 = 1 THEN foe111 = 1 ; * 기간제근로자 > 한시적근로자 ;
    ELSE foe111 = 0 ;

    IF p190501 = 2 AND p190601 = 2 AND p190605 in (1,2,3,4,5,6) THEN foe112 = 1 ; * 비기간제근로자 > 한시적근로자
    ELSE IF p190501 = 2 AND p190602 = 2 THEN foe112 = 1 ; * 비기간제근로자 > 한시적근로자
    ELSE foe112 = 0 ;

    * 한시적근로자 ;
    IF foe111+foe112 > 0 THEN foe11 = 1 ;
    ELSE foe11 = 0 ;

    * 시간제근로자 ;
    IF p190315 = 1 THEN foe12 = 1 ;
    ELSE foe12 = 0 ;

    * 파견근로자 > 비전형근로자 ;
    IF p190611 = 2 THEN foe131 = 1 ;
    ELSE foe131 = 0 ;

    * 용역근로자 > 비전형근로자 ;
    IF p190611 = 3 THEN foe132 = 1 ;
    ELSE foe132 = 0 ;

    * 특수형태노동종사자 > 비전형근로자 ;
    IF p190612 = 1 THEN foe133 = 1 ;
    ELSE foe133 = 0 ;

    * 가정내근로자 > 비전형근로자 ;
    IF p190613 = 1 THEN foe134 = 1 ;
    ELSE foe134 = 0 ;

    * 일일(단기)근로자 > 비전형근로자 ;
    IF p190508 = 1 THEN foe135 = 1 ;
    ELSE foe135 = 0 ;

    * 비전형근로자 ;
    IF foe131+foe132+foe133+foe134+foe135 > 0 THEN foe13 = 1 ;
    ELSE foe13 = 0 ;

    * 노사정위원회 기준 비정규직 ;
    IF foe11 + foe12 + foe13 > 0 THEN foe1 = 1 ;
    ELSE foe1 = 0 ;

    * 종사상 지위 기준 ;
    IF p190314 = 1 THEN foe2 = 0 ;
    IF p190314 in (2,3) THEN foe2 = 1 ;

    * 자기 선언적 비정규직 여부 기준 ;
    foe3 = p190317-1 ;


    *====================================;
    *  SPSS를 이용한 고용형태의 구성  ;
    *====================================;

    compute foe111=0.
    if (p190501=1) foe111=1.
    var label foe111 '기간제 근로자'.

    compute foe112=0.
    if (p190501=2 and p190601=1 and p190602=2) foe112=1.
    if (p190501=2 and p190601=2 and (p190605=1 or p190605=2 or p190605=3 or p190605=4 or p190605=5 or p190605=6)) foe112=1.
    var label foe112 '비기간제 근로자'.

    compute foe11=0.
    if (foe111=1 or foe112=1) foe11=1.
    var label foe11 ' 한시적 근로자'.

    compute foe12=0.
    if (p190315=1) foe12=1.
    var label foe12 '시간제근로자'.

    compute foe131=0.
    if (p190611=2) foe131=1.
    var label foe131 '파견근로자'.

    compute foe132=0.
    if (p190611=3) foe132=1.
    var label foe132 '용역근로자'.

    compute foe133=0.
    if (p190612=1) foe133=1.
    var label foe133 '특수형태근로종사자'.

    compute foe134=0.
    if (p190613=1) foe134=1.
    var label foe134 '가정내근로자'.

    compute foe135=0.
    if (p190508=1) foe135=1.
    var label foe135 '일일(단기)근로자'.

    compute foe13=0.
    if (foe131=1 or foe132=1 or foe133=1 or foe134=1 or foe135=1) foe13=1.
    var label foe13 '비전형근로자'.

    compute foe1=0.
    if (foe11=1 or foe12=1 or foe13=1) foe1=1.
    var label foe1 '노사정 위원회 기준 비정규직'.

    compute foe2=0.
    if (p190314=2 or p190314=3) foe2=1.
    var label foe2 '종사상지위 비정규직'.

    compute foe3=0.
    if (p190317=2) foe3=1.
    var label foe3 '자기선언적 비정규직'.


    *====================================;
    *  Stata를 이용한 고용형태의 구성  ;
    *====================================;

    qui gen foe111=0
    qui replace foe111=1 if p190501==1
    label var foe111 "기간제근로자"

    qui gen foe112=0
    qui replace foe112=1 if p190501==2 & p190601==1 & p190602==2
    qui replace foe112=1 if p190501==2 & p190601==2 & (p190605==1 | p190605==2 | p190605==3 | p190605==4 | p190605==5 | p190605==6)
    label var foe112 "비기간제근로자"

    qui gen foe11 = 0
    qui replace foe11 = 1 if foe111+foe112 > 0
    label var foe11 "한시적근로자"

    qui gen foe12=0
    qui replace foe12=1 if p190315==1
    label var foe12 "시간제근로자"

    qui gen foe131=0
    qui replace foe131=1 if p190611==2
    label var foe131 "파견근로자"

    qui gen foe132=0
    qui replace foe132=1 if p190611==3
    label var foe132 "용역근로자"

    qui gen foe133=0
    qui replace foe133=1 if p190612==1
    label var foe133 "특수형태근로종사자"

    qui gen foe134=0
    qui replace foe134=1 if p190613==1
    label var foe134 "가정내근로자"

    qui gen foe135=0
    qui replace foe135=1 if p190508==1
    label var foe135 "일일단기근로자"

    qui gen foe13=0
    qui replace foe13 = 1 if foe131+foe132+foe133+foe134+foe135 > 0
    label var foe13 "비전형근로자"

    qui gen foe1=0
    qui replace foe1=1 if foe11+foe12+foe13>0
    label var foe1 "노사정 위원회 기준 비정규직"

    qui gen foe2=0
    qui replace foe2=1 if p190314==2 | p190314==3
    label var foe2 "종사상지위 비정규직"

    qui gen foe3=p190317-1
    label var foe3 "자기선언적 비정규직"





    *==============================================#
    *   R를 이용한 고용형태의 구성                 #
    *==============================================#

    klips19p ← read.spss(file = "C:\\Users\\KLI\\DATA\\1-19spss\\klips19p.sav", use.value.labels = FALSE, to.data.frame = TRUE )
    p19 ←klips19p

    #기간제 근로자
    table(p19$p190501)
    foe111 ← ifelse(p19$p190501 == 1, 1, 0)
    "기간제 근로자" ← foe111

    #비기간제 근로자
    foe112 ← ifelse((p19$p190501==2 & p19$p190601 ==1 & p19$p190602 ==2), 1,
                     ifelse((p19$p190501 ==2 & p19$p190601 ==2 &
                               (p19$p190605==1 | p19$p190605==2 | p19$p190605==3| p19$p190605==4| p19$p190605==5| p19$p190605==6))
                            ,1,0 ))
    "비기간제 근로자" ←foe112

    #한시적 근로자
    foe11 ← ifelse((foe111 ==1 | foe112 == 1) , 1 , 0)
    "한시적 근로자" ← foe11

    #시간제 근로자
    foe12 ← ifelse(p19$p190315 ==1, 1, 0)
    "시간제 근로자" ← foe12

    #파견 근로자
    foe131 ← ifelse(p19$p190611 == 2, 1, 0)
    "파견 근로자" ← foe131

    #용역 근로자
    foe132 ← ifelse(p19$p190611 == 3, 1, 0)
    "용역 근로자" ← foe132

    #특수형태근로종사자
    foe133 ← ifelse(p19$p190612 == 1, 1, 0)
    "특수형태근로종사자" ← foe133

    #가정내근로자
    foe134 ← ifelse(p19$p190613 == 1, 1, 0)
    "가정내근로자" ← foe134

    #일일(단기)근로자
    foe135 ← ifelse(p19$p190508 == 1, 1, 0)
    "일일(단기)근로자" ← foe135

    #비전형근로자
    foe13 ← ifelse((foe131 ==1 | foe132 ==1 | foe133 ==1 | foe134 ==1 | foe135 ==1), 1, 0)
    "비전형 근로자" ←foe13

    #노사정 위원회 기준 비정규직
    foe1 ← ifelse((foe11 ==1 | foe12 ==2 | foe13 ==1), 1, 0)
    "노사정 위원회 기준 비정규직" ←foe1

    #종사상지위 비정규직
    foe2 ← ifelse((p19$p190314 ==2 | p19$p190314 ==3), 1, 0)
    "종사상지위 비정규직" ← foe2

    #자기선언적 비정규직
    foe3 ← ifelse(p19$p190317 ==2 , 1, 0)
    "자기선언적 비정규직" ← foe3


    <한국노동패널 1~19차년도 조사자료 User's Guide 183p Q23 참고>
  • 질문 개인자료에 부업 관련 정보를 붙이고자 할 때
    답변
    개인자료에는 주업과 관련된 정보만 들어 있다. 따라서 부업 관련 정보를 필요로 할 경우 직업력을 이용해 부업 관련 정보를 찾아낸 후 이를 개인자료에 다시 붙여 이용해야 한다.

    예를 들어 19차년도에 조사된 개인의 부업을 찾는 상황을 생각해 보자. 직업력에서 아래의 세 가지 조건을 동시에 만족하는 일자리가 이들 개인의 부업이 된다.  

    ① 조사년도를 의미하는 jobwave변수가 19,
    ② 주업을 의미하는 mainjob이 0,
    ③ 일자리의 현재 지속여부를 알 수 있는 jobclass가 1, 3, 5, 7.(1, 3, 5, 7만 남기는 이유는 이들 일자리가 조사시점 현재 지속 중인 일자리이기 때문이다.)

    이상의 절차를 통해 걸러진 데이터를 개인자료와 pid를 기준으로 붙이면 된다.


    <한국노동패널 1~19차년도 조사자료 User's Guide 197p Q26 참고>
  • 질문 임금 및 소득 변수의 평균값 추이가 들락날락하고, 너무 큰 값이 나올 때
    답변
    임금, 소득 변수의 평균값을 낼 때 가장 주의해야 할 점이 무응답의 처리이다. 노동패널의 임금 및 소득 변수는 모두 6자리로 top-coding을 하며, 무응답일 경우 ‘-1’로 처리하고 있다. 따라서, 무응답을 결측치로 바꿔 처리하지 않을 경우 값이 커지거나 추이가 안 나타나는 등의 문제가 나타난다.

    노동패널팀에서 일괄적으로 무응답을 결측치로 처리하여 제공하는 것이 데이터 분석자의 입장에서 편할 수도 있겠지만, 보다 정확한 연구를 위해서는 무응답과 결측값이 완전히 다른 의미를 갖는 문제이므로 -1을 결측치로 재처리해 제공하지는 않고 있다. 또한, 아직까지 100억에 달하는 월평균임금을 보고한 사람들은 없었으므로, top-coding이 실제로 이루어진 사례는 없었다.

    임금, 소득 관련 변수를 이용할 때에는 반드시 기초통계량을 구하여 코드북에 기재된 빈도값과 일치하는지를 확인한 후 무응답 값을 처리하기를 권장한다.



    <한국노동패널 1~19차년도 조사자료 User's Guide 196p Q25 참고>
  • 질문 임금근로자의 근로시간변수에 결측치가 너무 많이 나온다면?
    답변
    이는 노동패널의 근로시간 변수를 제대로 구성하지 못했기 때문에 발생한 실수이다. 주로 "p191004 : (주된일자리)주당 평균 근무시간(임금)" 변수만을 이용하였을 때 이런 현상이 나타난다.

    노동패널에서는 유형설문을 통해 주당 근로시간을 조사한다. 유형설문에서의 근로시간 관련 항목은 임금근로자일 경우와 비임금근로자일 경우 각각 질문 형태가 다르다. 임금근로자의 경우

    ① 정규근로시간이 정해져 있는지,
    ② 정해져 있지 않을 경우 식사시간을 제외하고 일주일에 평균 몇 시간 일했는지
    ③ 정해져 있을 경우 정규근로시간이 식사시간을 제외하고 일주일에 몇 시간인지, 정규근로시간 이외에 초과로 근로하는 시간이 있었는지, 있었다면 일주일 평균 몇 시간이나 되는지를 질문하는 방식으로 구성되어 있다.

    비임금근로자일 경우 한 문항으로 간단하게 일주일에 몇 시간이나 일하는지 질문한다. 아래는 임금근로자의 근로시간 변수 생성방법 예제이다.


    *===========================;
    *    SAS 근로시간 변수 생성 ;
    *===========================;

    data p19; set a.klips19p;

    /*변수설명
    p191003 : 주된일자리 정규근로시간 여부 y/n = 1/2
    p191004 : 주된일자리 주당 평균 근로시간
    p191006 : 주된일자리 주당 정규 근로시간

    p191011 : 주된일자리 초과근로여부 y/n = 2/1
    p191012 : 주된일자리 주당 평균 초과근로시간*/

    array w[3] p191004 p191006 p191012; /*결측치 처리*/
    do i=1 to 3;
    if w[i] =-1 then w[i]=.;
    end;

    if p191003=2 then worktime=p191004;/*평균근로시간*/
    if p191003=1 and p191011=1  then worktime=p191006;
    if p191003=1 and p191011=2 then worktime=sum(of p191006, p191012); /*정규+초과근로시간*/

    /*불가능한 초과근로시간 확인*/
    proc freq; table p191004 p191006 p191012;
    proc print; where p191012>168; var pid p191012;
    run;

    data hours; set p19(keep=worktime); /*근로시간 변수 그래프*/
    proc chart data=hours; vbar worktime; title 'Hours worked per week';
    run;


    *===========================.
    *    SPSS 근로시간 변수 생성 .
    *===========================.

    get file='D:\19차\users guide\19차년도\klips19p.sav'.

    recode p191004 p191006 p191012(-1=sysmis).
    if (p191003=2) worktime=p191004.
    if (p191003=1 and p191011=1) worktime=p191006.
    if (p191003=1 and p191011=2) worktime=sum(p191006, p191012).

    GRAPH /HISTOGRAM=worktime.

    /*불가능한 초과근로시간 확인*/
    select if (p191012>168).
    list pid p191012.


    /*======================================*/
    /* stata 근로시간변수 생성              */
    /*======================================*/

    clear
    use klips19p, clear

    recode p191004 p191006 p191012(-1=.)
    egen worktime=rowtotal(p191006 p191012) if p191003==1 & p191011==2
    replace worktime=p191004 if p191003==2
    replace worktime=p191006 if p191003==1 & p191011==1

    histogram worktime

    /*불가능한 초과근로시간 확인*/

    keep if p191012>168
    tab pid p191012

    *==============================================#
    *   R 근로시간변수 생성                         #
    *==============================================#
    p19 ← read.spss(file = "C:\\Users\\KLI\\DATA\\1-19spss\\klips19p.sav", use.value.labels = FALSE, to.data.frame = TRUE )

    #변수 설명
    #p191003 : 주된일자리 정규근로시간 여부 y/n = 1/2
    #p191004 : 주된일자리 주당 평균 근로 시간
    #p191006 : 주된일자리 주당 정규 근로 시간
    #p191011 : 주된일자리 초과근로여부 y/n =2/1
    #p191012 : 주된일자리 주당 평균 초과근로시간

    #결측치 처리
    p19$p191004[p19$p191004 == (-1)] ← NA
    p19$p191006[p19$p191006 == (-1)] ← NA
    p19$p191012[p19$p191012 == (-1)] ← NA

    #평균 근로 시간
    sum ← data.frame(p19$p191006, p19$p191012)
    rowtotal ← rowSums(sum, na.rm=TRUE) #변수 활용을 위해 합을 구함

    worktime ← ifelse(p19$p191003 ==2 , p19$p191004,
                       ifelse((p19$p191003 ==1 & p19$p191011 == 1), p19$p191006,
                              ifelse((p19$p191003 ==1 & p19$p191011 ==2), rowtotal, NA)))

    summary(worktime)
    hist(worktime) #worktime 히스토그램

    #불가능한 초과근로시간 확인
    over ← filter(p19, p191012 > 168) #없음.
    over ← p19[p19$p191012 > 168, c("pid","p191012")] #pid 까지 확인하고 싶은 경우.
    table(over)


    <한국노동패널 1~19차년도 조사자료 User's Guide 192p Q24 참고>
  • 질문 노동패널자료의 정규/비정규직 비중은 왜 통계청에서 발표하는 수치와 다를까?
    답변
    노동패널자료의 신뢰성을 문제시하는 많은 사람들이 노동패널자료의 비정규직 비율이 너무 낮다는 지적을 한다. 사실 이런 지적이 근거 없는 것은 아니다. 우선, 우리나라에서 비정규직 비율을 이야기할 때 기준이 되는 통계청의 「경제활동인구조사」 비농가부문 임시일용직 비율을 보면 1999년 이후 50%를 넘어섰다가 2008년에는 44%대에 이른 반면, 노동패널자료의 임시일용직 비중은 고작해야 21~22% 수준에 머무르고 있기 때문이다.
    한편, 노동패널조사에서는 다른 조사와는 달리 주관적 판단에 의한 정규직 비정규직 여부도 측정하고 있다. 즉, ‘이 일자리에서 ____님의 고용형태는 무엇입니까?’라고 질문해서 정규직/비정규직 여부를 판단하는 것이다. 그런데, 이 질문에 대한 응답에서도 역시 21~22% 정도만이 비정규직이라고 응답하고 있다.

    아무리 조사표본의 차이를 감안하더라도 「경활조사」보다 절반이상 낮은 수준의 수치가 나타난다는 것은 언뜻 납득하기 어렵다. 그러나, 노동패널조사의 표본이 상대적으로 매우 적음에도 불구하고 취업률, 실업률, 산업별 및 직종별 취업자 비율, 근로시간, 평균임금 등 거의 대부분의 핵심변수들은 기준통계자료들과 큰 차이를 보이지 않는다. 따라서 이러한 점을 감안할 때 유독 비정규직 비율이 낮다는 것만으로 노동패널조사의 신뢰성이 떨어진다고 단정짓는 것은 섣부른 판단일 수 있다.

    이 문제에 대해 패널팀에서 제시하는 설명은 다음과 같다.

    1. 종사상 지위
    노동패널의 종사상 지위 구분은 순수하게 근로계약만을 기준으로 (임시직은 1년미만, 일용직은 1개월 미만인 근로자)로 구분되고 있다. 이에 반해 통계청의 ꡔ경제활동인구조사ꡕ는 보다 엄격한 기준을 정해서 종사상 지위를 정하고 있다. 우선, 노동패널과 같이 고용계약기간에 따라 1차적으로 상용직, 임시․일용직 여부를 구분한다. 그러나, 상용직이라고 응답했다 하더라도 고용계약기간이 정해지지 않은 근로자들의 경우 직장의 규범을 동일하게 적용 받는지 여부, 퇴직금 및 상여금 수령여부, 부가급여의 수급 여부 등을 고려하여 이 중 차별적인 적용을 받는 경우에는 임시․일용직으로 다시 재분류한다.

    이러한 조사상의 차이로 인해 노동패널과 경활조사는 동일한 이름의 ‘종사상 지위’를 조사함에도 불구하고 전혀 다른 결과를 도출한 것이다. 물론 여기에는 표본의 차이, 조사원의 전문성 등도 일부 작용했을 것이다.

    2. 자기 선언적 비정규직 측정
    종사상 지위 이외에도 3차년도를 제외한 모든 조사연도에는 이른바 ‘자기 선언적 규정’에 의해 비정규직 측정을 하고 있다. 여기서 자기선언적 규정이란 앞서 종사상 지위 기준과 마찬가지로 설문지 상에 비정규직 근로자의 정의를 ‘단기 계약직, 임시직, 일용직 근로자 등 일시적으로 취업한 근로자’라는 최소한의 가이드만 제시하고 여기에 대한 판단은 응답자에게 맡기는 것이다. 따라서 앞서 종사상 지위에서 ‘임시/일용직’이라고 응답한 사람들이 이 문항에도 ‘비정규직’이라고 응답할 가능성이 매우 높다. 실제로 노동패널 자료를 분석해보면 이 문항에서 ‘비정규직’이라고 응답한 사람들의 80%이상이 종사상 지위에서 임시․일용직으로 나타났다(노동패널 홈페이지 : 리서치브리프 No1. 「한국노동패널 5차년도 조사의 비정규직 규모와 실태」참조).

    3. 다양한 형태의 비정규직 측정.
    이러한 문제점을 해결하기 위해서 노동패널은 5차년도 조사부터 보다 정확하고 객관적이며, 비교가능한 방식으로 비정규직을 측정하기 위해 새로운 설문을 도입하였다. 즉, 통계청의 비정규직 측정을 위한 부가조사문항을 반영하여 미국에서 주로 사용하는 한시근로자(contingent work)뿐만 아니라, 파견, 용역, 독립도급, 가내근로 등 대안적 고용형태(alternative employment arrangement) 등을 측정할 수 있게 된 것이다. 이들 문항에 대해 분석한 결과 통계청의 부가조사 분석결과와 거의 비슷한 비중을 보이고 있다. 또한 10차년도 조사부터는 고용형태 설문 Set이 도입되어 다양한 형태의 비정규직 정의를 구성할 수 있게 되었다. (고용형태 부가설문의 구조와 내용에 대한 자세한 사항은 이상호, ꡔ노동패널 10차년도 고용형태 부가조사의 개요 및 주요 결과ꡕ, 노동리뷰 2008년 7월호를 참고.)

    4. 노동패널 비정규직 측정의 특징
    따라서 종사상 지위가 통계청 조사와 그 비중에 있어서 상당한 차이가 난다고 하나 이는 조사 설계상의 오류라기보다는 용어 기준에 의한 차이가 크다고 볼 수 있는 것이다. 노동패널에서는 퇴직금, 부가급여 등 일자리 특성에 대해 상세한 조사를 한다. 따라서 이들 요인을 통제할 때 완전히 동일하지는 않겠지만 통계청 조사와 거의 비슷한 종사상 지위 비중이 산출될 수 있다. 더구나, 위에서 언급한 여러 가지 기준들을 다양하게 적용한다면 오히려 보다 풍부한 분석결과를 도출하고 새로운 함의를 찾을 수 있을 것이다.

    이상의 설명을 뒷받침하기 위해 몇 가지 기준을 적용하여 17차년도 자료를 이용해 비정규직 규모를 산출해보았다. 아래 표를 보면 우선, 종사상 지위만을 기준으로 하였을 때 비정규직 비율은 26.8%로 나타났다. 두 번째 기준으로 일용대기 + 파견 + 용역 + 독립도급 + 가내 + 시간제 + 단기계약의 경우 21.3%로 나타났다. 세 번째, 앞의 두 기준 중 하나라도 해당되는 경우는 32.0%로 나타났고, 네 번째, 기준2에 장기임시직을 포함하였을 경우 38.6%로 나타났다. 물론 이러한 비율이 통계청의 경활조사 결과와 완전히 동일한 기준에서 산출된 것이라고는 볼 수 없겠지만 대략적인 수준에서의 비교는 가능할 것이다.
  • 질문 경제활동상태 변수 만들기
    답변
    경제활동상태의 정의에 대해서는 이미 "Ⅳ. 변수 가이드"에서 이미 소개한 바 있다. 여기서는 예제를 통해 경제활동상태를 구성하는 방법을 살펴보자. 아래 예제는 19차년도 개인자료를 이용한 경제활동상태의 구성이다.

    여기서 유의할 점은 개인의 종사상지위와 경제활동상태가 반드시 일치하지 않을 수 있다는 점이다. 개인의 종사상 지위는 유형설문에서 이루어지는 반면, 취업/미취업 여부, 그리고 경제활동상태는 취업자공통과 미취업자공통 설문을 통해 구성된다(FAQ Q20 참조).

    이 경우 개인의 경제활동상태는 기본적으로 취업자 및 미취업자 공통 설문변수를 기준으로 만들 것을 권고한다.


    *====================================;
    *  SAS를 이용한 경제활동상태의 구성  ;
    *====================================;

    data p19; set a.klips19p;

    /*현재 일자리의 종사상 지위 */
    /* 임금근로자 1=상용, 2=임시, 3=일용 , 4=고용주/자영업자, 5=무급가족종사자*/
    empst=p190314;

    /*현재 경제활동 상태 */
    econst=3; /* 비경제활동인구*/
    if p190201=1 then econst =1; /* 취업자 */
    if p192801=1 and p192806=1 then econst=2; /* ILO 기준 실업자*/
    proc freq; table empst econst;
    run;


    *====================================.
    *  SPSS를 이용한 경제활동상태의 구성 .
    *====================================.

    get file='D:\19차\users guide\19차년도\klips19p.sav'.

    /*현재 일자리의 종사상 지위 */
    /* 임금근로자 1=상용, 2=임시, 3=일용 , 4=고용주/자영업자, 5=무급가족종사자*/
    compute empst=p190314.

    /*현재 경제활동 상태 */
    compute econst=3. /* 비경제활동인구*/
    if (p190201=1) econst =1. /* 취업자 */
    if (p192801=1 and p192806=1) econst=2. /* ILO 기준 실업자*/
    fre empst econst.


    /*======================================*/
    /* stata를 이용한 경제활동상태의 구성   */
    /*======================================*/

    clear
    use klips19p, clear

    /*현재 일자리의 종사상 지위 */
    /* 임금근로자 1=상용, 2=임시, 3=일용 , 4=고용주/자영업자, 5=무급가족종사자*/
    gen empst=p190314

    /*현재 경제활동 상태 */
    gen econst=3 /* 비경제활동인구*/
    replace econst=1 if p190201==1  /* 취업자 */
    replace econst=2 if p192801==1 & p192806==1  /* ILO 기준 실업자*/

    tab1 empst econst


    *==============================================#
    *   R를 이용한 경제활동상태의 구성             #
    *==============================================#

    klips19p ← read.spss(file = "C:\\Users\\KLI\\DATA\\1-19spss\\klips19p.sav", use.value.labels = FALSE, to.data.frame = TRUE )
    p19 ←klips19p

    #현재 일자리의 종사상 지위.
    #임금근로자 1=상용, 2=임시, 3=일용, 4=고용주/자영업자, 5=무급가족종사자.
    empst ← p19$p190314
    #결측값 -1이 있으므로 NA 로 바꿔준다.
    empst[empst==(-1)] ← NA

    #현재 경제활동 상태
    econst ← ifelse(p19$p190201 ==1 , 1,
                     ifelse((p19$p192801 == 1 & p19$p192806 == 1), 2, 3))

    table(empst)
    table(econst)

    ## 원하는 경우 gmodels 패키지의 Crosstable 을 통해 빈도수와 퍼센티지를 알 수 있다.
    install.packages("gmodels")
    library(gmodels)
    CrossTable(empst,econst)



    <한국노동패널 1~19차년도 조사자료 User's Guide 180p Q22 참고>
  • 질문 종사상 지위, 임금/비임금 근로 구분의 기준
    답변
    1. 종사상 지위의 구분
    노동패널자료에서 종사상 지위 즉, 상용․임시․일용․자영업자/고용주․가족종사자를 구분하는 조사항목은 유형설문에 있다. 유형마다 문항의 형태는 조금씩 다르다.

    유형 1, 2는 지난 조사와 비교해 상용직․임시직․일용직 여부가 바뀌었는지를 묻는다.
    유형 3, 4도 지난 조사와 비교해 종사상 지위가 바뀌었는지를 묻는다.
    유형 5, 6은 현재 종사상 지위가 무엇인지를 묻는다.
    유형 7, 8도 현재 종사상 지위가 무엇인지를 묻는다.

    유형 1~4는 지난 조사로부터 이어져온 일자리이므로 "지난 조사와 비교해 변했는지"만을 질문하면 충분하다. 유형 5~8은 새로 시작한 일자리이므로 현재 종사상 지위를 질문해야 한다. 분석을 위해 종사상 지위 변수가 필요할 때에는 "p190314 : (주된일자리)종사상지위-현재(또는 최종)" 변수를 이용하면 된다. 직업력을 이용할 경우 "j150 : 종사상의 지위-현재(또는 최종)"을 이용하면 된다. 유형 1~4에 응답한 경우 이전년도로부터 관련 자료를 가져와 채워 놓았다.

    2. 임금/비임금의 구분
    임금/비임금 근로를 구분할 경우 유형설문을 통해 조사된 종사상 지위 변수 외에도 취업자 개인 설문지를 통해 조사되는 "p190211 : (공통)취업형태" 변수를 이용할 수 있다. 이 변수는 "문4 그렇다면 ____님께서 하시는 이 일은 다음 중 어디에 해당됩니까?"에 대한 응답이다. 그런데, 취업자 개인 설문을 통해 조사되는 취업형태 변수와 유형설문을 통해 조사되는 종사상 지위 변수가 일치하는 응답을 주어야 하지만, 불행히도 그렇지 못한 문제가 있다. 이는 한국노동패널조사와 같은 미시자료를 다룰 때 가장 빈번하게 부딪히는 "응답의 비일관성" 문제이다. 자영업과 임금근로의 경계가 불분명한 일자리들이 상당히 존재하는 것이 현실이어서, 이런 현실이 그대로 설문조사에 투영되는 경우라고 볼 수 있다. 이를 클리닝 과정에서 최소화하기 위해 노력하고 있지만, 아직까지 완전히 제거되지 못하고 있다. 따라서 노동패널팀에서는 임금/비임금 근로를 구별할 때에는 취업형태(p190211) 변수보다는 종사상 지위(p190314) 변수를 이용하는 것을 권하고 있다. 이렇게 하는 것이 일자리 관련 변수를 조금이라도 더 확보하여 결측치(missing value)를 줄이는 방법이다.


    <한국노동패널 1~19차년도 조사자료 User's Guide 178p Q21 참고>
  • 질문 개인의 인적특성(성별, 연령, 학력) 변수들이 필요할 때
    답변
    개인의 학력, 성별, 연령, 가구주와의 관계 등 인적특성 정보는 가구설문지를 통해 조사하고 있다. 그렇지만, 가구설문지를 통해 조사된 이와 같은 인적특성 항목들은 개인, 신규, 부가자료에도 붙여서 함께 제공하고 있으므로, 이들 자료를 이용하여 분석할 때에는 개인의 인적특성 변수를 가구자료로부터 추출하여 붙이기 위해 고생할 필요가 없다.

    다만, 개인 및 신규 설문지는 15세 이상인 가구원들에게만 배포되므로, 15세 미만 학령기 아동의 인적 특성과 같은 주제에 관심이 있을 경우에는 가구자료를 이용해 개인정보를 추출하여야 한다(FAQ Q11을 이용). 가구자료의 개인정보 관련변수는 19차년도 가구자료 기준으로 h190201부터 h190775까지이다.


    <한국노동패널 1~19차년도 조사자료 User's Guide 177p Q20 참고>
게시물 검색