본문으로 바로가기

연구제안 및 문의하기

함께하는 KLIPS, 소통하는 KLIPS, 열린 KLIPS

FAQ

SAS, SPSS, Stata 패키지 간 파일변환

  • Date2016.02.03
  • Hit8,075
노동패널 자료는 SAS 9.1, SPSS 13.0, Stata 9.0 이상의 버전에서 만들어졌다. 만일 SPSS나 Stata 사용자라면 낮은 버전의 패키지를 사용하더라도 자료를 불러오거나 다른 패키지로 전환할 때 별도의 주의가 필요 없다. 그러나, SAS의 경우 각 버전마다 데이터파일의 확장자가 다르기 때문에 이를 확인한 후에 변환해야 한다. 만일 이런 문제가 없는데도 자료를 불러올 수 없다면 자료에 에러가 발생한 것이므로 다시 자료를 수령해야 한다.

SAS, SPSS나 Stata이외에 다른 통계패키지를 사용하는 연구자들은 우선 데이터를 ASCII파일이나 data파일로 바꾼 후, 다시 해당 패키지 파일로 바꾸어야 할 것이다. 요즘에는 많은 통계패키지들이 SAS, SPSS, Stata간에 파일을 변환해주는 기능을 갖고 있기 때문에 이런 작업들이 필요 없는 경우가 대부분이다. R을 사용하는 경우에는 다음과 같은 두 가지 방법으로 노동 패널 데이터를 불러올 수 있다.

1. R studio를 이용하는 경우, 상단 메뉴바의 File → Import Data Set → ‘From Spss’, ‘From SAS’, ‘From STATA’ 메뉴를 통해 쉽게 데이터 파일을 불러올 수 있다.

2. R studio를 이용하지 않거나 명령어로 데이터를 불러오고 싶을 때는 ‘foreign’패키지를 통해 불러올 수 있다.

install.packages("foreign") # foreign 패키지를 설치해준다.
library(foreign) # foreign 패키지를 실행한다.

그 다음 read.*** 명령어를 통해 원하는 파일을 불러온다.



① SPSS 데이터 불러오기(read.spss)

klips19h←read.spss(file="C:\\Users\\KLI\\DATA\\1-19spss\\klips19h.sav", use.value.labels = FALSE, to.data.frame = TRUE)

② SAS 데이터 불러오기(read.ssd)

klips19h←read.ssd(file="C:\\Users\\KLI\\DATA\\1-19sas\\klips19h.ssd", use.value.labels = FALSE, to.data.frame = TRUE)

③ STATA 데이터 불러오기(read.dta)

klips19h←read.dta(file="C:\\Users\\KLI\\DATA\\1-19stata\\klips19h.dta", use.value.labels = FALSE, to.data.frame = TRUE)

괄호 안의 첫 번째 인자는 데이터 파일의 경로를 나타낸다. R의 경우 폴더를 구분할 때 역슬래시(\)가 아닌 슬래시(/)나 2개의 역슬래시(\\)를 이용한다. use.value.labels 는 spss 에서 불러오는 파일의 입력값에 붙은 레이블을 그대로 불러오는지를 정하는 옵션이다. 일반적으로 FALSE로 놓는 것이 편리하다. to.data.frame 은 데이터를 data frame형태로 불러올지 matrix 형태로 불러올지를 정하는 옵션이다. 일반적으로 R은 data frame 형태로 작업이 이루어지므로 TRUE로 놓는 것이 편리하다.

<한국노동패널 1~19차년도 조사자료 User's Guide 115p Q2 참고>

스크랩