본문 바로가기
  • 자주하는질문
  • 데이터 이용자

데이터 이용자

  1. [소개] 한국의료패널조사는 무엇인가요?

    1. 한국의료패널 조사는 매년 동일한 7,000~8,000 가구를 대상으로 의료이용 행태 및 의료비 지출에 대해 조사하는 국내 최초의 의료패널조사입니다. 조사자료는 개인정보보호를 위해 식별 가능한 개인정보를 제거하여 공개하고 있습니다.
  2. [표본설계] 한국의료패널의 조사 대상은 어떻게 선정하나요?

    1. 한국의료패널은 조사목적상 전국규모의 대표성을 유지하기 위해 2005년 인구주택총조사 90% 조사구중 섬조사구, 특수시설, 기숙시설을 제외한 조사구를 추출틀로 사용하고 있습니다. 전체 조사구 수는 약 350개 조사구로서 전국 약 8,000가구와 그 가구에 속해 있는 가구원을 대상으로 하였습니다. 자세한 내용은 한국의료패널 홈페이지의 "조사설계 > 표본추출"을 참고하시기 바랍니다.
  3. [데이터 제공] 한국의료패널 데이터는 어디서 받을 수 있나요?

    1. 한국의료패널 홈페이지의 "데이터정보 > 데이터" 또는 "데이터 공지사항"에서 "데이터 활용동의서" 다운로드 및 작성 하여 담당자에게 이메일 혹은 팩스로 전송하신 후, "한국의료패널 데이터"를 이메일로 받아 활용하실 수 있습니다. 자세한 사항은 한국의료패널 홈페이지(http://www.khp.re.kr)의 "홈>데이터 정보 > 데이터"를 참고하시기 바랍니다.
  4. [데이터 제공] 올해 조사된 패널데이터는 언제 받을 수 있나요?

    1. 한국의료패널은 2개의 조사차수 데이터를 이용해 연간데이터를 구축하기 때문에 조사에서 데이터 공개까지 약 2년 의 시간이 필요합니다.
  5. [데이터 제공] 학술대회 논문작성용으로 제공하는 데이터를 미리 받아볼 수 있나요?

    1. 학술대회 논문작성용 데이터는 7월에 제공하고, 이때 제공되는 데이터는 학술대회 논문작성용으로만 사용하실 수 있습니다. 학술대회 논문작성용 데이터가 공개된 이후 오류 수정 및 데이터 재검토 과정을 거쳐 다음해 5월 말~6월 초에 정식버전 데이터가 공개됩니다.
  6. [데이터 제공] 다운로드 받은 데이터는 어떻게 구성되어 있나요?

    1. 각 연도별 설문영역별로 여러 개의 데이터셋으로 구성되어 있으며, SAS, SPSS, STATA 형식으로 제공합니다. 엑셀이나 TXT 파일로 분석을 원하시는 경우 전달해드린 데이터 형식을 변환하여 사용하셔야 합니다. 또한 코드북과 설문지, 유저가이드도 함께 받아보실 수 있습니다.
  7. [데이터 제공] 정식버전에서 공개하지 않고 있는 비공개 변수는 별도로 요청하면 제공 가능한가요?

    1. 비공개 변수는 원칙상 제공하지 않습니다. 개인정보 또는 표본 대표성, 공개 부적합 변수구조 등의 문제로 비공개 변수는 제공하기 어려움이 있으니 양해부탁드립니다.
  8. [데이터 제공] 질환별 의료비에 대한 값을 받을 수 있나요? 또는 질환별 의료비를 산출할 수 있는 데이터셋을 따로 요청할 수 있나요?

    1. 통계결과표는 기초분석 보고서나 심층분석 보고서 등을 참고하시기 바라며, 공개용 데이터 외 분석용 데이터를 따로 제공하고 있지 않으니 연구자가 직접 분석에 맞게 데이터를 구성하여 사용하셔야 합니다. 양해부탁드립니다.
  9. [데이터 > 가중치] 분석할때 반드시 가중치를 사용하여야 합니까?

    1. 연구 특성에 따라 다를 수 있으므로 연구 목적과 관련 연구를 참고하여 사용 여부를 결정하고, 결과에는 가중치 적용 여부를 제시할 필요가 있습니다.
  10. [데이터 > 가중치] 2010~2014년 자료를 사용한 종단분석을 하고 있습니다. 어떤 가중치를 사용하여야 하나요?

    1. 종단가중치는 가구원에만 부여되어 있으므로 2010년~2014년 가구원 종단분석을 위해서는 개인 종단 가중치 또는 모노톤 종단 가중치를 사용하면 됩니다.
      2010년~2014년의 종단면의 횡단 특성(연도별 평균, 분위수 등)을 위해서는 종단 가중치를 사용하는 것이 유리하고, 연도별 추이 혹은 차이를 보기 위해서는 모노톤 종단 가중치를 사용하는 것이 유리합니다.
      단, 모노톤 종단 가중치는 2008년부터 연속응답한 개인에게 부여되어 있으므로 이점을 염두에 두고 사용하시면 됩니다.
  11. [데이터 > 가중치] 분석시 STRATA와 CLUSTER에 어떤 값을 넣어야 하나요?

    1. 한국의료패널의 표본추출은 2005년 인구주택총조사 90% 전수자료를 토대로 전국 16개 광역시도와 동읍면을 층화변수로 한 확률비례 2단계 층화집락추출방법으로 실시되었습니다.
      그러나 현재 공개자료에는 가중치 변수만 포함되어 있고, 층과 집락에 대한 변수는 제공하고 있지 않습니다.
      분석시 STRATA와 CLUSTER에 대한 옵션을 생략하고 진행하시기 바라며, 표본추출에 관련된 전체 변수가 제공되고 있지 않은 점 양해 부탁드립니다.
  12. [데이터 > 가중치] 가중치를 적용한 분위수와 일반 분위수는 어떤 차이가 있나요?

    1. 가중치를 사용하지 않는 분석일 때 TOTAL_Q 변수로 사용하셔야 분위수별 N이 동일하고, 가중치를 사용하는 분석이라면 W_TOTAL_Q 변수로 사용하셔야 분위수별 N이 동일하여 소득분위수에 대한 의미가 있습니다.
  13. [데이터 > 의료이용] 의료이용 데이터가 제공되는 기준 연도는 언제입니까?

    1. 2018년 연간데이터의 경우 2018년 1월 1일~2018년 12월 31일까지 발생한 의료이용 데이터를 제공합니다.
  14. [데이터 > 가구소득] 가구소득(분위)은 어떻게 작성되고, 개인소득(분위)은 어디서 확인하나요?

    1. 가구소득(의 소득분위)은 (HH 데이터셋에서 확인하실 수 있고,) 가구원수를 고려한 균등화소득으로 가구소득분위를 산출하여 제공하고 있습니다.
      개인소득의 소득분위는 IND 데이터셋에서 확인하실 수 있고, 개인소득 값은 INCOME_IND 데이터셋에서 확인하실 수 있습니다.
  15. [데이터 > 만성질환] 만성질환(삭제) 데이터에서 왜 한 가구원이 여러번 중복되어 있나요?

    1. 한국의료패널 자료는 통상적인 조사설문과 달리 각 개인의 의료이용 건별로 자료가 구축된다는 점이 특징입니다. 일반적인 설문조사에서는 한 행에 한 응답자 자료가 기재되지만 한국의료패널은 보다 상세한 정보를 제공하기 위해 각 개인이 이용한 의료이용건별로 자료를 구축합니다. 따라서 응답자 중 event가 다수인 가구원 즉, 의료이용을 3회 한 경우, '3개의 행'으로 자료가 누적되어 기록됩니다. event 단위인 데이터는 만성질환(cd), 응급(er), 입원(in), 외래(ou), 민간보험(phi, phr)이 있습니다.
  16. [간행물] 한국의료패널 조사 자료를 학술논문 출간을 위해 활용할 수 있습니까?

    1. 가능합니다. 다만 데이터 다운로드 시 작성하셨던 "한국의료패널 데이터 활용동의서" 내용대로 본 한국의료패널 조사 자료를 활용하여 연구결과를 게재하거나 출판시, 연구방법이나 데이터 소개부문에 한국의료패널 데이터를 활용했다는 내용을 반드시 명기해 주셔야 합니다. 또한 출간 후에는 발간 논문을 알려주셔야 합니다.(하며, 출간 후에는 원문을 보내주시거나 게재지 등의 정보를 알려주시기 바랍니다.)
  17. [간행물] 학술대회 보고서를 받아보고 싶습니다.

    1. 학술대회 보고서는 한국의료패널 홈페이지(http://www.khp.re.kr)의 "연구자료>학술대회 보고서"에서 다운로드 받으실 수 있습니다.
  18. [간행물] 기초분석 보고서 등 간행물은 어디서 볼 수 있나요?

    1. 한국의료패널 기초분석 보고서는 한국의료패널 홈페이지의 "연구자료>보고서"에서 확인 하실 수 있습니다. 그밖의 한국보건사회연구원에서 발간된 자료들은 한국보건사회연구원(http://www.kihasa.re.kr) 홈페이지나 전자도서관 검색을 통해 온라인으로 열람이 가능합니다. 또한 온라인 열람이 아닌 실제 책을 받아보시고 싶으신 경우에는 한국경제서적, 영풍문고(종로점), 교보문고(광화문점), 서울문고(종로점), Yes24, 알라딘에서 구입 가능합니다.