콘텐츠로 건너뛰기 메뉴로 건너뛰기 푸터로 건너뛰기
데이터를 불러오고 있습니다
데이터를 저장하고 있습니다
본 데이터는
온라인 안심존 데이터 ?

온라인 안심존 : 보안이 보장된 온라인 네트워크를 통해 집, 연구실, 사무실 등 어디서나 접속하여 데이터에 접근하고 분석

입니다.
#조기 진단 # 딥러닝 인공지능 # 영상데이터 # 이미지데이터

담낭암 진단 의료 영상

담낭암 진단 의료 영상
  • 분야헬스케어
  • 구분 안심존(온라인)
  • 유형 이미지
구축년도 : 2020 갱신년월 : 2021-06 조회수 : 1,539 다운로드 : 11

※ 내국인만 데이터 신청이 가능합니다.

  • 데이터 변경이력

    데이터 변경이력
    버전 일자 변경내용 비고
    1.0 2021-06-30 데이터 최초 개방

    소개

    담낭암 진단 및 치료 과정에서 필요한 영상·이미지 데이터

    구축목적

    담낭암 진단 및 치료 과정에서 필요한 의료 이미지 데이터셋 구축
    의료 영상의 판독 결과와 진단 및 치료에 영향을 주는 임상 정보 등을 어노테이션한 학습용 데이터셋 구축
    구축된 AI데이터를 이용하여 의료 단계별 의사결정에 직간접적 영향을 줄 수 있는 AI모델 제시
  • 구축 내용 및 제공 데이터량

    • 담낭암의 DICOM 영상파일과 어노테이션 PNG파일, 임상정보의 JSON 파일을 수집
    • 어노테이션을 통해 악성(malignant), 양성(benign), 정상(normal)로 구분
    데이터 구성 표
    데이터셋 목표수량(건수) 구축수량(건수)
    담낭암 데이터셋 Malignant 95,000 24,197
    Benign 14,500 127,661
    Normal 6,000 35,635
  • 저작도구 설명서 및 저작도구 다운로드

    저작도구 설명서 다운로드 저작도구 다운로드
  • AI 모델 상세 설명서 다운로드

    AI 모델 상세 설명서 다운로드 AI 모델 다운로드
  • 데이터 성능 점수

    측정값 (%)
    기준값 (%)

    데이터 성능 지표

    데이터 성능 지표
    번호 측정항목 AI TASK 학습모델 지표명 기준값 점수 측정값 점수
    1 담낭질환진단 Image Classification CNN 개선모형 (Inception + LSTM) AUC-ROC 0.9 단위없음 0.92 단위없음

    ※ 데이터 성능 지표가 여러 개일 경우 각 항목을 클릭하면 해당 지표의 값이 그래프에 표기됩니다.

    ※ AI모델 평가 지표에 따라 측정값의 범위, 판단 기준이 달라질 수 있습니다. (ex. 오류율의 경우, 낮을수록 좋은 성능을 내는 것으로 평가됩니다)

  • 설명서 및 활용가이드 다운로드

    데이터 설명서 다운로드 구축활용가이드 다운로드

    데이터 변경이력

    데이터 변경이력
    버전 일자 변경내용 비고
    1.0 2021.06.30 데이터 최초 개방  

    구축 목적

    • 담낭암 진단 및 치료 과정에서 필요한 의료 이미지 데이터셋 구축
    • 의료 영상의 판독 결과와 진단 및 치료에 영향을 주는 임상 정보 등을 어노테이션한 학습용 데이터셋 구축
    • 구축된 AI데이터를 이용하여 의료 단계별 의사결정에 직간접적 영향을 줄 수 있는 AI모델 제시

    활용 분야

    • 국가차원의 의료 지식베이스 및 이용환경 제공으로 간암, 담낭암, 췌장암 관련 지능정보산업 활성화, 의료 질 향상, 우리나라의 데이터 경제를 가속화 하는데 기여
    • 공공 및 민간의 지능정보기술 개발 촉진과 지능정보산업 육성을 위한 지능정보 데이터 인프라 구축 및 이용환경 제공
    • 담낭암의 진단에 중요한 다양한 진단 영상과 임상 자료를 추가한 인공지능 학습용 데이터 구축
    • 담낭암 조기 진단에 유용한 지표를 찾는 딥러닝 인공지능 모델 제작

    소개

    • 담낭암 진단 인공지능기술의 개발 확산을 위해 특정 질환의 영상 이미지 및 임상정보와 전문의의 진단정보 등이 포함된 학습용 데이터셋 의료 지식 베이스 구축

       

    담낭암 의료 영상-소개 이미지

    구축 내용 및 제공 데이터량

    • 담낭암의 DICOM 영상파일과 어노테이션 PNG파일, 임상정보의 JSON 파일을 수집
    • 어노테이션을 통해 악성(malignant), 양성(benign), 정상(normal)로 구분
    데이터 구성 표
    데이터셋 목표수량(건수) 구축수량(건수)
    담낭암 데이터셋 Malignant 95,000 24,197
    Benign 14,500 127,661
    Normal 6,000 35,635

    대표도면

    • 좌측 : dcm파일 
      중앙 및 우측 : png파일 – 병변 및 장기 라벨링담낭암 진단 의료 영상-대표도면-좌측: dcm파일 중앙및 우측: png 파일-병변 및 장기 라벨링

       

    • 임상정보 json 파일담낭암 진단 의료 영상-대표도면-임상정보 json파일 이미지

       

    필요성

    • 고차원 의료영상(CT, MRI 등) 급증과 의료진의 부족
    • 의료영상 분석 및 진단 보조 솔루션 개발의 도입과 복부 장기에 대한 분야의 적용 제한
    • 기반구축 지원의 필요성 : 해외는 다양한 분야에서 인공지능 기술 개발에 활용할 인공지능 학습 데이터 및 학습 환경 등 기반 인프라가 활성화되어 있음. 반면, 국내의 경우 개인정보 침해, 저작권, 초상권 등 다양한 이슈로 양질의 데이터 개방 및 활용은 여전히 어려운 상황임
    • 간담도 췌장암의 진단 향상 및 오진율 감소를 위한 영상진단 인공지능 학습용 데이터 구축 필요
      - 전이 및 재발율이 높아 정확한 진단이 매우 중요함
      - 조직 체취가 불가하여 영상 검사법이 중요하나, 복부 초음파 검사나 CT진단 시 암 침범 전도 평가와 양성질환과의 감별이 어려움. 또한 불필요한 담낭 절제 수술로 의료비의 증가뿐 아니라 환자 개인의 건강에도 악영향을 끼치게 됨.
      - 따라서 담낭암 조기 진단 및 오진율을 낮추기 위해서는 현재의 진단 방법들을 이용하여 담낭암 조기 진단에 유용한 지표를 찾는 딥러닝 인공지능 모델이 필요함.

    데이터 구조

    • 데이터 구성
      - DICOM 영상 파일, PNG 어노테이션 파일, JSON 임상 정보 파일

       

      1. 폴더 구조담낭암 진단 의료 영상-데이터 구조-데이터 구성-1. 폴더 구조

       

      - 폴더명 항목담낭암 진단 의료 영상-데이터 구조-데이터 구성-1. 폴더 구조-폴더명 항목

       

      - 폴더명 세부 항목담낭암 진단 의료 영상-데이터 구조-데이터 구성-1. 폴더 구조-폴더명 세부 항목

       

      2. DICOM 파일 구성
      - M : 필수요소, M* : 조건하 필수요소, U : 부가정보담낭암 진단 의료 영상-데이터 구조-데이터 구성-2. DICOM 파일 구성

       

      3. 어노테이션(PNG) 구성
      - PNG 내 특정위치 값 표현
      - 장기부위와 병변부위를 나누어 어노테이션하여, 정상은 장기부위만, 양성/악성은 장기부위와 병변부위를 어노테이션함
      - 악성과 양성의 경우, DICOM 파일 1개에 대해서 최대 2개의 PNG 파일이 매핑됨(CT, MR, US, EUS).
      - 정상의 경우, DICOM 파일 1개에 대해서 1개의 PNG 파일이 매핑됨(CT).
      - PET-CT의 경우, DICOM 파일만 제공.
      - 나뉘어진 개별 Mask의 구분이 PNG 내 색상값으로 구분되어 기록됨담낭암 진단 의료 영상-데이터 구조-데이터 구성-3. 어노테이션(PNG) 구성

       

      4. 임상정보(JSON) 구성
      - 필수항목
      ・ caseID
      ・ DICOM정보 (모달리티, 영상일자)
      ・ 어노테이션이미지 (원본파일경로)
      ・ 진단정보(악성,양성,정상/ normal,benign1-5,malignant/ 영상판독결과)

       

      - 부가항목
      ・ 대상자정보 (성별, 나이, 인종, 키, 몸무게)
      ・ 어노테이션이미지 (장기마스킹경로, 병변마스킹경로)담낭암 진단 의료 영상-데이터 구조-데이터 구성-4. 임상정보(JSON) 구성-부가항목 예시 이미지
  • 데이터셋 구축 담당자

    수행기관(주관) : 국립암센터
    수행기관(주관)
    책임자명 전화번호 대표이메일 담당업무
    우상명 031-920-0740 wsm@ncc.re.kr · 지식베이스 구축 총괄
    수행기관(참여)
    수행기관(참여)
    기관명 담당업무
    고려대학교 산학협력단 · 담낭암 지식베이스 세부 책임
    (의료법인)길의료재단 · 담낭암 영상 지식베이스 구축
    연세대학교 산학협력단 · 담낭암 영상 지식베이스 구축
    연세대학교 원주산학협력단 · 담낭암 영상 지식베이스 구축
    경북대학교병원 · 담낭암 영상 지식베이스 구축
    전북대학교병원 · 담낭암 영상 지식베이스 구축
    SQI소프트 · 어노테이션툴 개발, 담낭암 데이터셋 획득, 라벨링·검수 단계별 데이터 검증 및 진도관리
    에프에이솔루션 · 담낭암 진단 예측 모형 및 응용서비스 개발
    데이터 관련 문의처
    데이터 관련 문의처
    담당자명 전화번호 이메일
    이미영(국립암센터) 031-920-0740 leemyyoung@ncc.re.kr
보건의료 데이터 개방 안내

보건의료 데이터는 온라인 및 오프라인 안심존을 통해 개방됩니다.

안심존이란 안심존 이용메뉴얼 안심존 이용신청
  • 인터넷과 물리적으로 분리된 온라인·오프라인 공간으로 의료 데이터를 포함하여 보안 조치가 요구되는 데이터를 다운로드 없이 접근하고 분석 가능
    * 온라인 안심존 : 보안이 보장된 온라인 네트워크를 통해 집, 연구실, 사무실 등 어디서나 접속하여 데이터에 접근하고 분석
    * 오프라인 안심존 : 추가적인 보안이 필요한 데이터를 대상으로 지정된 물리적 공간에서만 접속하여 데이터에 접근하고 분석

    1. AI 허브 접속
      신청자
    2. 안심존
      사용신청
      신청자신청서류 제출*
    3. 심사구축기관
    4. 승인구축기관
    5. 데이터 분석 활용신청자
    6. 분석모델반출신청자
  • 1. 기관생명윤리위원회(IRB) 심의 결과 통지서 [IRB 알아보기]
    2. 기관생명윤리위원회(IRB) 승인된 연구계획서
    3. 신청자 소속 증빙 서류 (재직증명서, 재학증명서, 근로계약서 등 택1)
    4. 안심존 이용 신청서 [다운로드]
    5. 보안서약서 [다운로드]
    ※ 상기 신청서 및 첨부 서류를 완비한 후 신청을 진행하셔야 정상적으로 절차가 이루어집니다.

  • 신청 및 이용관련 문의는 safezone1@aihub.kr 또는 02-525-7708, 7709로 문의

데이터셋 다운로드 승인이 완료 된 후 API 다운로드 서비스를 이용하실 수 있습니다.

API 다운로드 파일은 분할 압축되어 다운로드 됩니다. 분할 압축 해제를 위해서는 분할 압축 파일들의 병합이 필요하며 리눅스 명령어 사용이 필요합니다.

리눅스 OS 계열에서 다운로드 받으시길 권장하며 윈도우에서 파일 다운로드 시 wsl(리눅스용 윈도우 하위 시스템) 설치가 필요합니다.

※ 파일 병합 리눅스 명령어

find "폴더경로" -name "파일명.zip.part*" -print0 | sort -zt'.' -k2V | xargs -0 cat > "파일명.zip"

- 해당 명령어 실행 시, 실행 경로 위치에 병합 압축 파일이 생성됩니다.

- 병합된 파일 용량이 0일 경우, 제대로 병합이 되지 않은 상태이니 "폴더경로"가 제대로 입력되었는지 확인 부탁드립니다.

※ 데이터셋 소개 페이지에서 다운로드 버튼 클릭하여 승인이 필요합니다.