췌장암 진단 의료 영상

췌장암 진단 의료 영상

본 데이터는 온라인 안심존 데이터입니다.
데이터셋명 췌장암 진단 의료 영상
데이터 분야 헬스케어 데이터 유형 이미지
구축기관 국립암센터 데이터 관련 문의처 담당자명 우상명
가공기관 전화번호 1588-8110
검수기관 이메일 wsm@ncc.re.kr
구축 데이터량 3만 구축년도 2020년
버전 1.0 최종수정일자 2021.06.30
소개 의료 지식베이스 기반 췌장암 예측진단 및 치료 과정에서 의료 영상 인식 분야에 활용할 수 있는 영상‧이미지 학습 데이터셋 구축
주요 키워드 조기 진단, 딥러닝 인공지능, 영상데이터, 이미지데이터
저작권 및 이용정책 본 데이터는 과학기술정보통신부가 주관하고 한국지능정보사회진흥원이 지원하는 '인공지능 학습용 데이터 구축사업'으로 구축된 데이터입니다 [데이터 이용정책 상세보기]
데이터설명서 자료보기 구축활용가이드 자료보기
샘플데이터 교육활용동영상 영상보기
저작도구 다운로드 AI모델 다운로드
데이터 변경이력
버전 일자 변경내용 비고
1.0 2021.06.30 데이터 최초 개방  
구축 목적
  • 췌장암 진단 및 치료 과정에서 필요한 의료 이미지 데이터셋 구축
  • 의료 영상의 판독 결과와 진단 및 치료에 영향을 주는 임상 정보 등을 어노테이션한 학습용 데이터셋 구축
  • 구축된 AI데이터를 이용하여 의료 단계별 의사결정에 직간접적 영향을 줄 수 있는 AI모델 제시
활용 분야
  • 국가차원의 의료 지식베이스 및 이용환경 제공으로 간암, 담낭암, 췌장암 관련 지능정보산업 활성화, 의료 질 향상, 우리나라의 데이터 경제를 가속화 하는데 기여
  • 공공 및 민간의 지능정보기술 개발 촉진과 지능정보산업 육성을 위한 지능정보 데이터 인프라 구축 및 이용환경 제공
  • 췌장암의 진단에 중요한 다양한 진단 영상과 임상 자료를 추가한 인공지능 학습용 데이터 구축
  • 인공지능 학습용 데이터 구축 및 췌장암 표준화 영상 진단법 개발
  • 질환의 진단과 예후 등의 임상 인자를 예측할 수 있는 모델 제작
소개
  • 췌장암 진단 인공지능기술의 개발 확산을 위해 특정 질환의 영상 이미지 및 임상정보와 전문의의 진단정보 등이 포함된 학습용 데이터셋 의료 지식 베이스 구축

     

간암 진단을 위한 의료 영상 소개 이미지
구축 내용 및 제공 데이터량
  • 췌장암의 DICOM 영상파일과 어노테이션 PNG파일, 임상정보의 JSON 파일을 수집
  • 어노테이션을 통해 악성(malignant), 양성(benign), 정상(normal)로 구분
데이터 구성 표
데이터셋 목표수량(건수) 구축수량(건수)
췌장암 데이터셋 Malignant 9,500 22,260
Benign 8,500 19,493
Normal 12,000 66,486
대표도면
  • 좌측 : dcm파일, 우측 : 병변 라벨링한 png파일

     

    대표도면
  • 임상정보 json 파일

     

    임상정보 Json 파일
필요성
  • 고차원 의료영상(CT, MRI 등) 급증과 의료진의 부족
  • 의료영상 분석 및 진단 보조 솔루션 개발의 도입과 복부 장기에 대한 분야의 적용 제한
  • 기반구축 지원의 필요성 - 해외는 다양한 분야에서 인공지능 기술 개발에 활용할 인공지능 학습 데이터 및 학습 환경 등 기반 인프라가 활성화되어 있음. 반면, 국내의 경우 개인정보 침해, 저작권, 초상권 등 다양한 이슈로 양질의 데이터 개방 및 활용은 여전히 어려운 상황임
  • 간담도 췌장암의 진단 향상 및 오진율 감소를 위한 영상진단 인공지능 학습용 데이터 구축 필요
    - 일반적인 검진에서 진단이 어렵고, 오진 가능성이 높아 췌장암 진단을 위해서는 장기간의 시간과 훈련이 필요하며 치료비용의 부담 또한 증가함.
    - 영상검사 사용 증가에 따른 췌장 병변 발견 부담이 증가하였으며, 이에 따라 객관적이고 정확하며 표준화된 영상 검사 해석법이 필요함
데이터 구조
  • 데이터 구성
    - DICOM 영상 파일, PNG 어노테이션 파일, JSON 임상 정보 파일

     

    1. 폴더 구조데이터 구성 - 폴더 구조

     

    - 폴더명 항목폴더명 항목

     

    - 폴더명 세부 항목폴더명 세부 항복

     

    2. DICOM 파일 구성
    - M : 필수요소, M* : 조건하 필수요소, U : 부가정보DICOM 파일 구성

     

    3. 어노테이션(PNG) 구성
    - 나뉘어진 개별 Mask의 구분이 PNG 내 Bit로 구분되어 기록됨
    - PNG 내 8비트 활용 개별 마스크 매핑
    - DICOM 파일 1개에 대해서 1개의 PNG 파일이 매핑됨.
    - PNG 파일의 전체크기는 DICOM 파일 크기와 일치시켜, 어노테이션한 위치를 고정으로 가져감.
    - PNG 파일내 특정 분류 값 표현을 하도록 정의하며, Gray scale을 사용함.
    - PET-CT의 경우, DICOM 파일만 제공.
    - 췌장 정상 CT의 경우, DICOM 파일 1개에 대해서 어노테이션 되지 않은 1개의 PNG파일이 매핑됨.
    - 암종별 카테고리에 따른 지정된 bit 자리를 사용함.
    어노테이션(PNG) 구성 표
    8bit - (RGB) 췌장 (Pancreas)
    000000 (0,0,0) - (transparency)
    800000 (128,0,0) NORMAL
    008000 (0,128,0) BENIGN1
    808000 (128,128,0) BENIGN2
    000080 (0,0,128) BENIGN3
    800080 (128,0,128) MALIGNANT1
    008080 (0,128,128) MALIGNANT2
    808080 (128,128,128) MALIGNANT3

     

    4. 임상정보(JSON) 구성
    - 필수항목
    ・ 대분류 (정상, 악성, 양성)
    ・ 중분류 (normal, benign1~5, malignant)
    ・ 모달리티(CT, MR, PET-CT, (E)US)
    ・ 성별

     

    - 부가항목
    ・ 기본정보 (나이, 인종, 신장, 체중)
    ・ 혈액검사 CA19-9 (날짜, 방법, 레벨)
    ・ 추가진단 (췌장염, 타질병)
    ・ 췌장낭종 (진단분류, 위치, 장경, mural nodule, 수술방법)
    ・ 췌장암 (조직학적 분류, 병기, Tstage, 위치, 장경, 수술방법)
    ・ 전이여부 (위치, 치료여부, 특이사항)
    ・ 영상진단정보 (촬영일, 판독문)
    ・ 수술 (날짜, 병리결과지)
    ・ 기타
데이터셋 구축 담당자
수행기관(주관) : 국립암센터
수행기관(주관)
책임자 전화번호 대표이메일 담당업무
우상명 1588-8110 wsm@ncc.re.kr · 지식베이스 구축 총괄
수행기관(참여)
수행기관(참여)
기관명 담당업무 기관명 담당업무
연세대학교 산학협력단 · 췌장암 지식베이스 세부 책임 고려대학교 산학협력단 · 췌장암 영상 지식베이스 구축
(의료법인)길의료재단 · 췌장암 영상 지식베이스 구축 연세대학교 원주산학협력단 · 췌장암 영상 지식베이스 구축
전북대학교병원 · 췌장암 영상 지식베이스 구축 경북대학교병원 · 췌장암 영상 지식베이스 구축
인피니트헬스케어 · 인공지능 학습용 Imaging Platform 구축 및 어노테이션 저작도구 개발 서울대학교 산학협력단 · 췌장암 분할 AI 모델 및 응용서비스 개발
피노맥스 · 췌장의 악성 종양 구분 및 확인, 췌장 악성 위험도 A.I 알고리즘 개발