본문 바로가기

K-직장인의 삶/🌆사업개발 이야기

BD & MA & 마케터 활용툴 (1) HIRA BIG DATA ⓐ

반응형

안녕하세요, 여러분! 🙋‍♀️

 

오늘은 제약·바이오 업계의 보물창고이자 나침반이라 불리는 HIRA(건강보험심사평가원) 빅데이터에 대해 이야기해 보려 해요.

"데이터... 복잡하고 어려워 보여..."라고 생각하셨던 분들도 걱정 마세요!

이 데이터가 무엇이고, 어떤 정보를 담고 있으며, 특히 제약·바이오 기업에게 왜 중요한지 알기 쉽게 설명해 드릴게요. 🗺️✨


1. HIRA 빅데이터란 무엇인가요? (정의와 중요성) 🤔

HIRA 빅데이터는 건강보험심사평가원이 보유한 국민건강보험 및 의료급여 청구·심사 데이터를 통합해 구축한 방대한 보건의료 데이터입니다. 우리나라 국민들이 병원, 약국 등을 이용할 때 발생하는 모든 의료 정보(어떤 질병으로, 어떤 진료를 받고, 어떤 약을 처방받았는지 등)가 여기에 담겨 있죠.

이 데이터는 전 국민의 의료 이용 행태를 반영하기 때문에, 대한민국 보건의료 현황을 가장 정확하고 상세하게 파악할 수 있는 유일무이한 자료원입니다. 제약·바이오 기업에게는 시장분석, 신약 개발 방향 설정, 사업 개발(BD) 전략 수립을 위한 핵심적인 근거가 됩니다. 정말 강력한 무기라고 할 수 있죠! 💪

 

✔️ HIRA URL 주소:

https://opendata.hira.or.kr/home.do

 

보건의료빅데이터개방시스템

건강보험심사평가원에서 보유하고 있는 다양한 보건의료데이터를 국민에게 개방합니다. 서비스 소개 바로가기 --> 이전 일시정지 시작 다음

opendata.hira.or.kr

 


 

2. HIRA 빅데이터, 어떤 정보를 담고 있나요? (데이터 종류) 📋

HIRA 빅데이터는 다음과 같은 주요 정보들을 포함하고 있어요. 🩺

  • 진료내역 정보: 환자 정보(성별, 연령, 거주지 등), 질병명, 진료 행위, 의약품 처방 및 조제 정보(어떤 약이 얼마나 사용되었는지), 수가 정보(가격) 등이 담겨 있습니다.
  • 요양기관 정보: 병원, 의원, 약국 등 의료기관의 종류, 규모, 위치, 전문과목 정보까지 포함돼요.
  • 질 평가 정보: 특정 질환에 대한 의료기관별 질 평가 결과 데이터도 확인할 수 있습니다.
  • 보건의료 통계 및 브리프: 심평원에서 주기적으로 발행하는 통계 자료 및 분석 보고서도 매우 유용합니다.

위 세 항목을 가장 많이 사용한답니다 :)


 

3. HIRA 빅데이터, 어떻게 사용할 수 있나요? (접근 방법 및 서비스) 💻

HIRA 빅데이터는 개인 정보 보호를 위해 철저한 심사 절차와 보안 환경을 통해 제공됩니다. 접근 방식은 크게 두 가지로 나눌 수 있어요. 🧐

가. 보건의료빅데이터개방시스템 (www.opendata.hira.or.kr) 웹사이트 🌐

누구나 쉽게 접근 가능한 '공개 자료' 및 '맞춤형 정보'의 창구입니다.

  • HIRA 통계성 자료 (K-health.info): 특정 질환의 환자 수, 진료비 추이, 약품 소비량 등 일반적인 통계 자료를 웹사이트에서 바로 조회하고 다운로드할 수 있어요.
  • HIRA 빅데이터 브리프: 특정 질병이나 보건의료 현안에 대한 심평원의 분석 보고서로, 전문 연구자가 아니더라도 데이터를 쉽게 이해할 수 있도록 자세히 설명되어 있습니다.
  • OPEN API 서비스: 공공데이터포털을 통해 신청하면, 개발자가 API를 활용해 데이터를 자동으로 연동하고 분석할 수 있습니다.

나. 맞춤형 연구분석 및 원격분석시스템 🔬

제약·바이오 기업이나 연구기관이 특정 목적을 가지고 대용량의 세부 데이터(가명정보)를 분석하고자 할 때 활용하는 핵심 채널입니다.

  • 이용 절차: 상세한 연구 계획서를 제출해 심사를 받고, 승인되면 보안이 강화된 '원격분석시스템(Secure Zone)'에 접속해 데이터를 직접 분석합니다. 외부로 데이터 반출은 엄격히 금지됩니다.
  • 주요 활용 시점:
    • 신약 출시 전 시장 규모 정밀 분석: 특정 질환의 유병률, 치료 패턴 등을 파악해 시장을 정밀하게 분석합니다.
    • Market Access 전략 수립: 약가 등재를 위한 경제성 평가의 기초 자료를 만들 때 활용합니다.
    • R&D 방향성 설정: 미충족 의료 수요를 확인하고, 신약 개발의 기회를 탐색할 때 사용합니다.

 

4. HIRA 빅데이터, 무엇을 보고 어떤 분석을 할 수 있나요? 📈

HIRA 빅데이터를 활용하면 다음과 같은 다양한 인사이트를 얻을 수 있습니다. 💡

  • 질병 역학 및 환자군 분석: 특정 질병의 유병률, 환자 수 추이, 환자 특성(성별, 연령 등)을 파악해 시장 규모를 분석할 수 있어요.
  • 의약품 사용 패턴 및 처방 분석: 특정 질환에서 어떤 약이 얼마나 많이 처방되는지, 신제품 출시 후 시장 침투율은 어떤지 등을 분석해 마케팅 전략을 세울 수 있습니다.
  • 의료기관 이용 행태 및 진료비 분석: 환자들이 어떤 병원을 주로 이용하고, 진료비 추이는 어떤지 등을 분석해 재정 효율성을 평가할 수 있습니다.
  • 환자 여정(Patient Journey) 분석: 환자가 진단부터 치료까지 어떤 과정을 거치는지 분석해 미충족 의료 수요를 찾아낼 수 있습니다.

✅ 위와 같이 질병 분류 (3단상병, 4단 상병)에 따라, 그리고 해당하는 질병별 입원/외래, 성별/연령, 요양기관종, 소재지 별로 통계를 조회할 수 있습니다.

✅ '항목조회' 버튼을 활용하여 알고 싶은 질병을 넣은 뒤, 기간을 설정하고 검색버튼을 눌러보세요! 아래와 같이 질병 추이와 환자 특성에 따른 분류를 한눈에 확인할 수 있답니다!

 

★참고!

✨ HIRA 데이터 검색 핵심 개념: 3단상병 vs 4단 상병 & 심사 연도 vs 진료년월

HIRA 빅데이터는 '청구 데이터'를 기반으로 하기 때문에, 질병 코드와 시간 개념이 특수하게 정의되어 있어요.

1. 질병 코드: 3단상병 vs 4단 상병 (질병 분류의 깊이)

우리나라에서 질병을 분류하는 기준은 '한국표준질병·사인분류(KCD)'입니다. 이는 WHO의 국제질병분류(ICD)를 기반으로 해요.
3단상병과 4단상병은 이 KCD 코드의 분류 단계를 의미합니다.
가. 3단상병 (질병 소분류, Small Classification)
  • 의미: KCD 코드 중 '소분류'에 해당하는 단계로, 3단(세 자리)으로 구성된 질병 코드입니다. 좀 더 포괄적이고 일반적인 질병군을 나타냅니다.
  • 예시:
    • E11: 제2형 당뇨병 (어떤 합병증을 동반했는지는 포함하지 않음)
    • I10: 본태성(원발성) 고혈압 (구체적인 유형을 구분하지 않음)
    • J06: 상기도의 급성 감염, 상세불명
  • 특징:
    • 대략 1,800여 종의 질병 소분류가 있습니다 .
    • HIRA 보건의료빅데이터 개방시스템에서 '질병 소분류 통계(3단상병)' 서비스로 조회할 수 있습니다  .
  • 언제 사용하면 좋을까요?
    • 특정 질병의 전반적인 발생 현황, 유병률, 총 진료비 추이 등 넓은 범위의 통계를 파악할 때 유용합니다. (예: "우리나라에서 당뇨병 환자는 얼마나 될까?")
나. 4단상병 (질병 세분류, Detailed Classification)
  • 의미: KCD 코드 중 '세분류'에 해당하는 단계로, 4단(세 자리 + 소수점 이하 한 자리 또는 영문)으로 구성된 질병 코드입니다. 훨씬 더 구체적이고 세분화된 질병 상태나 합병증까지 포함합니다.
  • 예시:
    • E11.2: 합병증을 동반한 제2형 당뇨병 (구체적인 합병증을 포함)
    • I10.0: 본태성(원발성) 고혈압 (악성)
    • J06.9: 상세불명의 급성 상기도 감염
  • 특징:
    • 대략 1만여 종 이상의 질병 세분류가 있습니다 .
    • HIRA 보건의료빅데이터 개방시스템에서 '질병 세분류 통계(4단상병)' 서비스로 조회할 수 있습니다 .
  • 언제 사용하면 좋을까요?
    • 특정 환자군을 매우 정교하게 정의할 때, 질병의 진행 단계, 합병증 유무, 특정 치료 대상 환자 등을 분석할 때 필수적입니다. (예: "신장 합병증을 동반한 제2형 당뇨병 환자군 대상의 신약 개발 타당성 분석")
    • BD나 R&D에서 특정 신약의 타겟 환자군(TPP)을 정확하게 파악하고자 할 때 주로 사용합니다.
🌟 3단 vs 4단 상병, 선택 가이드:
  • 3단 상병: 거시적인 시장 트렌드, 질병의 전체적인 규모 파악에 적합합니다.
  • 4단 상병: 특정 신약의 임상적 적응증에 맞는 정확한 타겟 환자군을 식별하고, 세부적인 치료 패턴을 분석할 때 반드시 사용해야 합니다.

2. 시간 개념: 심사년도 vs 진료년월 (데이터 확정 시점 vs 서비스 제공 시점)

HIRA 데이터는 병원이 진료 후 보험공단에 청구하고, 심평원이 이를 심사하여 확정하는 과정을 거칩니다. 이 과정 때문에 '진료가 실제로 이루어진 시점'과 '진료비가 확정되어 데이터로 반영된 시점'이 다르게 됩니다.
가. 진료년월 (진료연월)
  • 의미: 요양기관에서 환자에게 의료 서비스(진료)가 실제로 제공된 연월을 의미합니다. (예: 2024년 5월에 병원에 방문하여 진료를 받았다면 진료년월은 2024년 5월)
  • 특징:
    • 환자의 실제 의료 이용 행태, 질병 발생 시점, 계절성 질환의 트렌드 등 현실에서 일어난 현상을 가장 정확하게 반영합니다.
    • 하지만 데이터는 진료가 발생한 직후 바로 공개되지 않습니다. 요양기관이 청구하고 심평원이 심사하는 행정 처리 과정(약 3~6개월)이 필요하므로, 조회 시점 기준으로 최근 8개월 전까지의 자료만 조회 가능합니다 .
  • 언제 사용하면 좋을까요?
    • 특정 질환의 발생 추이, 유행성 질병의 시기별 환자 수 변화 등 '실제 환자들이 언제 병원에 왔는지'를 기준으로 분석할 때 사용합니다. (예: "코로나19 유행 시기별 실제 환자수 변화")
    • 신약 출시 직후의 실제 처방 패턴 변화를 실시간에 가깝게 추적할 때 유용합니다.
나. 심사년도 
  • 의미: 요양기관이 건강보험공단에 진료비를 청구하고, 건강보험심사평가원이 심사를 완료하여 해당 진료비가 '확정'된 연도를 의미합니다. (예: 2023년 12월 진료분이라도 2024년 3월에 심사가 확정되면 심사년도는 2024년)
  • 특징:
    • 진료년월에 비해 최신성(Recency)은 떨어지지만, '완결성(Completeness)'이 높습니다. 특정 심사년도의 데이터는 해당 연도에 심사가 확정된 모든 진료비를 포함하므로 누락 없이 모든 데이터가 포함되어 있다는 장점이 있습니다.
    • 심평원 보건의료빅데이터 개방시스템에서는 심사년도별 자료를 '익년도 5월 말'에 조회 가능하다고 명시하고 있습니다 . (예: 2023년 심사년도 자료는 2024년 5월 말에 확정 공개)
  • 언제 사용하면 좋을까요?
    • 전체적인 재정 통계, 연간 진료비 총액, 특정 약제의 연간 총 사용량/사용액 등 '확정된 재무 통계'를 분석할 때 주로 사용합니다. (예: "지난해 건강보험 진료비 총액은 얼마인가?")
    • 정부 정책의 재정적 영향을 분석하거나, 과거 데이터를 기반으로 한 장기 트렌드 분석에 적합합니다.
🌟 심사년도 vs 진료년월, 선택 가이드:
  • 진료년월: 최근의 변화나 실제 발생 현상을 실시간에 가깝게 파악하고 싶을 때 (예: "우리 약이 출시된 이후 실제 환자들의 월별 처방량 변화는?")
  • 심사년도: 완결성이 중요하고, 과거의 전체적인 추세나 확정된 총액을 파악하고 싶을 때 (예: "작년 한 해 동안 특정 질환에 사용된 총 약품비는?")

 


 

5. BD 직무에서 HIRA 빅데이터 활용 시점 및 예시 💼

✅ BD(사업 개발) 담당자에게 HIRA 빅데이터는 마치 나침반이자 보물지도와 같습니다. 💰

  • 시장 기회 발굴: 특정 질환의 환자 수는 늘고 있지만 치료 대안이 부족한 분야를 파악해 신규 투자 및 라이선싱 유망 분야를 탐색합니다.
    • 예시: "만성 신장병 환자 중 특정 단계에서 투약되는 약물이 매우 제한적이네? 이 부분에 미충족 수요가 있을 것 같다!"
  • 신제품 Sales Forecast (판매 예측): 신약이 출시되었을 때 잠재 환자군 규모와 경쟁 약물 사용량 등을 분석해 신약의 매출을 예측하고 사업 계획을 수립합니다.
    • 예시: "우리 신약이 타겟하는 특정 암 환자군의 실제 유병률을 보니, 출시 후 3년 내 시장 점유율 10% 달성이 가능할 것 같아!"
  • Market Access 전략 수립: 약가 등재를 위한 '경제성 평가'에 필요한 데이터를 HIRA 데이터를 기반으로 구축합니다.
    • 예시: "기존 약제 대비 우리 신약의 비용-효과성을 증명하려면, 실제 진료 현장에서의 부작용 관리 비용이 얼마나 줄어드는지 HIRA 데이터로 보여줄 수 있어."

 

 

 

HIRA 빅데이터는 제약·바이오 업계의 핵심 경쟁력입니다. 이 데이터를 잘 활용하는 능력은 BD 직무의 핵심 역량 중 하나가 될 거예요. 오늘 내용이 여러분의 업무에 큰 도움이 되기를 바랍니다! 다음에도 유익한 정보로 돌아올게요! 👋

 

여러분의 관심과 질문이 더 나은 콘텐츠를 만드는 원동력입니다!

이 글이 도움이 되셨다면 공유와 공감&구독 부탁드립니다.  🙌

 

 

 

 

 

Copyright ⓒ Verdianverve All Rights Reserved.
본 블로그의 모든 글과 이미지의 저작권은 Verdianverve에 있으며, 무단 복제, 배포 및 2차 가공을 금지합니다.

 

반응형