담낭암 진단 의료 영상 소개
기본탭
본 데이터는 온라인 안심존 데이터입니다.
데이터셋명 | 담낭암 진단 의료 영상 | |||
---|---|---|---|---|
데이터 분야 | 헬스케어 | 데이터 유형 | 이미지 | |
구축기관 | 국립암센터 | 데이터 관련 문의처 | 담당자명 | 이미영(국립암센터) |
가공기관 | 국립암센터 컨소시엄 | 전화번호 | 031-920-0740 | |
검수기관 | 국립암센터 컨소시엄 | 이메일 | leemyyoung@ncc.re.kr | |
구축 데이터량 | 3만 | 구축년도 | 2020년 | |
버전 | 1.0 | 최종수정일자 | 2021.06.30 | |
소개 | 담낭암 진단 및 치료 과정에서 필요한 영상‧이미지 데이터 | |||
주요 키워드 | 조기 진단, 딥러닝 인공지능, 영상데이터, 이미지데이터 | |||
저작권 및 이용정책 | 본 데이터는 과학기술정보통신부가 주관하고 한국지능정보사회진흥원이 지원하는 '인공지능 학습용 데이터 구축사업'으로 구축된 데이터입니다 [데이터 이용정책 상세보기] | |||
데이터설명서 | 자료보기 | 구축활용가이드 | 자료보기 | |
샘플데이터 | 교육활용동영상 | 영상보기 | ||
저작도구 | 다운로드 | AI모델 | 업데이트 중 |
데이터 변경이력
버전 | 일자 | 변경내용 | 비고 |
---|---|---|---|
1.0 | 2021.06.30 | 데이터 최초 개방 |
구축 목적
- 담낭암 진단 및 치료 과정에서 필요한 의료 이미지 데이터셋 구축
- 의료 영상의 판독 결과와 진단 및 치료에 영향을 주는 임상 정보 등을 어노테이션한 학습용 데이터셋 구축
- 구축된 AI데이터를 이용하여 의료 단계별 의사결정에 직간접적 영향을 줄 수 있는 AI모델 제시
활용 분야
- 국가차원의 의료 지식베이스 및 이용환경 제공으로 간암, 담낭암, 췌장암 관련 지능정보산업 활성화, 의료 질 향상, 우리나라의 데이터 경제를 가속화 하는데 기여
- 공공 및 민간의 지능정보기술 개발 촉진과 지능정보산업 육성을 위한 지능정보 데이터 인프라 구축 및 이용환경 제공
- 담낭암의 진단에 중요한 다양한 진단 영상과 임상 자료를 추가한 인공지능 학습용 데이터 구축
- 담낭암 조기 진단에 유용한 지표를 찾는 딥러닝 인공지능 모델 제작
소개
- 담낭암 진단 인공지능기술의 개발 확산을 위해 특정 질환의 영상 이미지 및 임상정보와 전문의의 진단정보 등이 포함된 학습용 데이터셋 의료 지식 베이스 구축

구축 내용 및 제공 데이터량
- 담낭암의 DICOM 영상파일과 어노테이션 PNG파일, 임상정보의 JSON 파일을 수집
- 어노테이션을 통해 악성(malignant), 양성(benign), 정상(normal)로 구분
데이터셋 | 목표수량(건수) | 구축수량(건수) | |
---|---|---|---|
담낭암 데이터셋 | Malignant | 95,000 | 24,197 |
Benign | 14,500 | 127,661 | |
Normal | 6,000 | 35,635 |
대표도면
- 좌측 : dcm파일
중앙 및 우측 : png파일 – 병변 및 장기 라벨링 - 임상정보 json 파일
필요성
- 고차원 의료영상(CT, MRI 등) 급증과 의료진의 부족
- 의료영상 분석 및 진단 보조 솔루션 개발의 도입과 복부 장기에 대한 분야의 적용 제한
- 기반구축 지원의 필요성 : 해외는 다양한 분야에서 인공지능 기술 개발에 활용할 인공지능 학습 데이터 및 학습 환경 등 기반 인프라가 활성화되어 있음. 반면, 국내의 경우 개인정보 침해, 저작권, 초상권 등 다양한 이슈로 양질의 데이터 개방 및 활용은 여전히 어려운 상황임
- 간담도 췌장암의 진단 향상 및 오진율 감소를 위한 영상진단 인공지능 학습용 데이터 구축 필요
- 전이 및 재발율이 높아 정확한 진단이 매우 중요함
- 조직 체취가 불가하여 영상 검사법이 중요하나, 복부 초음파 검사나 CT진단 시 암 침범 전도 평가와 양성질환과의 감별이 어려움. 또한 불필요한 담낭 절제 수술로 의료비의 증가뿐 아니라 환자 개인의 건강에도 악영향을 끼치게 됨.
- 따라서 담낭암 조기 진단 및 오진율을 낮추기 위해서는 현재의 진단 방법들을 이용하여 담낭암 조기 진단에 유용한 지표를 찾는 딥러닝 인공지능 모델이 필요함.
데이터 구조
- 데이터 구성
- DICOM 영상 파일, PNG 어노테이션 파일, JSON 임상 정보 파일폴더구조 표 폴더구조 대상정보 파일명칭 정의 영상정보
DICOM{Identifier}_{Index}.dcm
Mask 폴더
어노테이션
Mask{Identifier}_{Index}.png
metadata 폴더
부가정보
판독문{Identifier}_{Index}.json
폴더명 항목표 항목 내용 항목 내용 ProjectCode 프로젝트 코드 (암종) Category 카테고리 CaseID 케이스번호 Seq 영상내 순번 Modality 촬영장비 코드 SopInstanceUID DICOM SOP유일키 폴더명 세부 항목1 Category 카테고리 명칭 Normal 정상 Benign1 cholelithiasis Benign2 polyp Benign3 adenomyomatosis Benign4 cholesterolosis Benign5 A. cholecystitis Malignant Malignant 폴더명 세부 항목2 프로젝트코드 프로젝트명 LV Liver - 간암 GB Gallbladder - 담낭암 PC Pancreas - 췌장암 폴더명 세부 항목3 Modality Code Modality CT Computer
TomographyMR Magnetic Resonance
ImagingUS Ultra Sound Image ES Endoscopy(EUS) PT Positron Emission
Tomography
- M : 필수요소, M* : 조건하 필수요소, U : 부가정보DICOM 파일 구성 IOD CT MR US Patient M M M 익명화 적용 General Study M M M General Series M M M Frame of Reference M M U General Equipment M M M General Image M M M* Image Plane M M - Image Pixel M M M* Device U U U SOP Common M M M*
- PNG 내 특정위치 값 표현
- 장기부위와 병변부위를 나누어 어노테이션하여, 정상은 장기부위만, 양성/악성은 장기부위와 병변부위를 어노테이션함
- 악성과 양성의 경우, DICOM 파일 1개에 대해서 최대 2개의 PNG 파일이 매핑됨(CT, MR, US, EUS).
- 정상의 경우, DICOM 파일 1개에 대해서 1개의 PNG 파일이 매핑됨(CT).
- PET-CT의 경우, DICOM 파일만 제공.
- 나뉘어진 개별 Mask의 구분이 PNG 내 색상값으로 구분되어 기록됨어노테이션(PNG)구성 표 2진수 진단명 HEX 00000000 Transparency 마스킹 없음 #000000 00000001 Bodypart Object(장기부위) #800000 00000010 Benign 1 (cholelithisis) #008000 00000100 Benign 2 (polyp) #000080 00001000 Benign 3 (adenomyomatosis) #808080 00100000 Benign 4 (cholesterolosis) #0087d7 01000000 Benign 5 (A. cholecystitis) #5f8700 10000000 Malignant #af00d7
- 필수항목
・ caseID
・ DICOM정보 (모달리티, 영상일자)
・ 어노테이션이미지 (원본파일경로)
・ 진단정보(악성,양성,정상/ normal,benign1-5,malignant/ 영상판독결과)
・ 대상자정보 (성별, 나이, 인종, 키, 몸무게)
・ 어노테이션이미지 (장기마스킹경로, 병변마스킹경로)
수행기관(주관) : 국립암센터
책임자 | 전화번호 | 대표이메일 | 담당업무 |
---|---|---|---|
우상명 | 031-920-0740 | wsm@ncc.re.kr | · 지식베이스 구축 총괄 |
수행기관(참여)
기관명 | 담당업무 | 기관명 | 담당업무 |
---|---|---|---|
고려대학교 산학협력단 | · 담낭암 지식베이스 세부 책임 | (의료법인)길의료재단 | · 담낭암 영상 지식베이스 구축 |
연세대학교 산학협력단 | · 담낭암 영상 지식베이스 구축 | 연세대학교 원주산학협력단 | · 담낭암 영상 지식베이스 구축 |
경북대학교병원 | · 담낭암 영상 지식베이스 구축 | 전북대학교병원 | · 담낭암 영상 지식베이스 구축 |
SQI소프트 | · 어노테이션툴 개발, 담낭암 데이터셋 획득, 라벨링·검수 단계별 데이터 검증 및 진도관리 | 에프에이솔루션 | · 담낭암 진단 예측 모형 및 응용서비스 개발 |