YP 조사개요

 

자료 정제 절차

청년패널 조사수행을 통해 수집된 원시자료는 2차례에 걸쳐 정제됨. 실사기관에서 1차로 정제한 자료를 한국고용정보원에서 2차로 정제해 원시자료를 확인함. 1, 2차 자료 정제 과정에서 실사기관과 한국고용정보원은 상호 피드백을 통해 자료의 오류를 최소화하고 정확성을 제고함. 또한, 원시자료 정제 프로세스를 통해 발견된 모든 오류와 정제내용은 상세히 기록해 다음해 설문지 및 CAPI 프로그램 개발에 반영함

조사를 수행한 실사기관에서 수행하는 1차 자료 정제과정에서는 횡단면 자료 정제, 직산업 AS 및 코딩, 자격증/학과/전공 등 응답코딩, 텍스트 입력 오류 수정 등 자료 전반에 걸친 기초적인 데이터 확인 작업을 실시함.

2차 자료 정제과정은 한국고용정보원에서 실시하고 있으며 응답의 종단면적인 일관성을 검토함. 자료의 시계열 분석을 위해서 종단면적인 자료 정제가 반드시 필요하며, 응답의 일관성 확인이 필요할 경우 실사기관으로 패널 응답을 재확인하도록 지시함

정제과정
1차 정제 2차 정제
실사기관 (성과품 납품) 한국고용정보원

횡단면 자료 정제

직산업 AS 및 코딩

기타 항목 코딩

자격증 코딩

학과전공 코딩

복수응답 변수 변환

텍스트 입력 오류 수정

기초적 종단면 자료 정제

1차 정제 결과 확인

심층적 종단면 자료 정제

(필요시 패널응답 재확인)

 

자료 정제 방법

(1) 횡단면 자료 정제

횡단면 자료정제의 경우 당해 연도 설문지에 기반해 당해연도 응답 간의 논리적 오류가 없는지 파악함. 특히, 응답 간의 논리적 오류는 과거 데이터 정제 과정에서 발견한 주요 오류 발생 유형을 정리하여, 발생 빈도가 높은 항목에 대한 집중 확인을 실시함

(2) 종단면 자료 정제

종단면 자료정제는 패널별 과거 응답과의 비교를 통해 응답의 일관성을 시계열 선상에서 비교함. 예를 들어, 지난조사 시점에 나와야 하는 응답이 현조사에서 나왔다거나, 지난조사에서 재적상태와 현조사에서의 재적상태가 연속성이 없는 경우 등 종단면 자료 정제 시 과거 응답과 현재 응답 사이의 논리적 오류를 확인 함. 과거 자료 정제 시 논리적 오류가 발견된 유형을 정리해 오류 발생 빈도가 높은 항목에 대한 우선적인 검토를 실시함

청년패널 자료 정제 리스트
  • ① 설문지 이동경로 상 응답해야 했으나 응답하지 않은 것은 없는지 확인 (응답누락)
  • ② 설문지 이동경로 상 응답하지 말았어야 했는데 응답한 것은 없는지 확인
  • ③ 설정된 응답값 범위를 넘어서는 응답은 없는지 확인
  • ④ 설정된 응답값의 범위 내이지만, 앞뒤 응답과 비교해 지나치게 크거나 작은 값은 아닌지 확인
  • ⑤ 주요 경로에 따른 조사 여부 확인, 즉 변수값 존재여부 확인
  • ⑥ 소득, 근로 시간, 사교육비, 직업교육 훈련비 등 금액 문항에 대한 논리적 이상치 확인
  • ⑦ 개방형 질문(open 문항) 입력분에 대해서는 오·탈자 등을 검토