질병진단 이미지(유방암)

질병진단 이미지(유방암)

데이터셋명 질병진단 이미지(유방암)
데이터 분야 헬스케어 데이터 유형 이미지
구축기관 국립암센터 데이터 관련 문의처 담당자명 황보율
가공기관 전화번호 031-920-0570
검수기관 이메일 healthcare_ai@ncc.re.kr, yyjo0430@ncc.re.kr
구축 데이터량 3만 구축년도 2019년
버전 1.0 최종수정일자 2019.12.31
소개 유방암 이미지 (6,000장), 양성 (6,000장), 정상 (18,000장) dicom 이미지 파일과 Annotation 정보 json 파일, 임상/병리 기록 excel 파일 등의 의료 지식베이스를 구축한 이미지 데이터 제공
주요 키워드 유방촬영, 정상유방, 양성종양, 유방암, 질환 예측 데이터, 임상 기록, 병리 기록, 의료 지식베이스, 수술 후 병리 변수, 종양병기
저작권 및 이용정책 본 데이터는 과학기술정보통신부가 주관하고 한국지능정보사회진흥원이 지원하는 '인공지능 학습용 데이터 구축사업'으로 구축된 데이터입니다. [데이터 이용정책 상세보기]
데이터설명서 자료보기 구축활용가이드 자료보기
샘플데이터 교육활용동영상
저작도구 다운로드 AI모델
데이터 변경이력
버전 일자 변경내용 비고
1.0 2019.12.31 데이터 최초 개방  
구축목적
  • 유방촬영 관련 인공지능 개발 촉진, 유방촬영 영상 판독의 정확도 향상과 비용 절감
활용분야
산업분야

 

  • 유방촬영 영상 보조 소프트웨어로써 촬영된 영상 이미지를 업로드하면 악성 종양으로 예상되는 곳에 표시하여 정보 제공

 

연구분야

 

  • 병변 segmentation, 질환 예측 등에 데이터 활용성 증대
사례
  • 건양대병원 의료 빅데이터 분석 '데이터톤' 진행
구축량
  • 유방암 데이터 7,500명 (총 30,000장)
상식 데이터 구축내용 표 (구축년도,데이터종류,포함내용,제공방식)
  환자수 (명) 영상이미지 (개)
정상유방 4,500 18,000
양성종양 1,500 6,000
유방암 1,500 6,000
합계 7,500 30,000
  • 유방촬영영상
ㅇㄹ
<유방촬영영상 이미지 인공지능 학습용 데이터 구조 예시>
필요성
  • 해외는 다양한 분야에서 인공지능 기술 개발에 활용할 인공지능 학습 데이터 및 학습 환경 등 기반 인프라가 활성화 되어 있음
  • 반면, 국내의 경우 개인정보 침해, 저작권, 초상권 등 다양한 이슈로 양질의 데이터 개방 및 활용은 여전히 어려운 상황임
  • 의료 산업 발전을 위한 인공지능 관련 신생기업들의 활성화를 위한 효율적이고 체계적인 의료 지식베이스 구축이 필요
구축내용
  • 유방암 데이터
    - 유방암 이미지 (6,000장), 양성 (6,000장), 정상 (18,000장) dicom 이미지 파일과 Annotation 정보 json 파일, 임상/병리 기록 excel 파일등의 의료지식베이스
데이터 구조
  • 유방암 데이터
경로 파일명 내용
/malign /0XXXX LMLO.dcm
RMLO.dcm
RCC.dcm
LCC.dcm
- dicom 형식
/benign /1XXXX
/normal /2XXXX
/json   Cancer_0xxxx.json - Json 형식의 annotation 정보(malignant case에 한함)
/   meta.xlsx - 검사장비, BI-RADS category, 종양 위치 (malignant case에 한함), TN-Stage (malignant case에 한함)

 

상식 데이터 구축내용 표 (구축년도,데이터종류,포함내용,제공방식)
데이터명 변수명 내용
공통추출변수 (정상/ 양성/악성) group 양성/악성/정상에 대한 그룹 정보
recvid 비식별후에 대체번호로 부여된 환자 ID
manufacturer 검사장비
manufacturerModelName 검사장비 모델
both1 BIRADS category (양쪽)
left1 BIRADS category (좌)
right1 BIRADS category (우)
수술후 병리 변수 (악성만 해당) spr_loca_cmnt 악성 종양의 위치 (ex. breast left/right)
invs_size_vl 악성 종양의 크기 (1cm 단위로 카테고리로, 반올림)
htlg_type_cmnt 조직형 진단 (IDC, ILC, DICS, others)
path_t_stag 종양의 병기 (ex. 1, 2, 3, 4)
상식 데이터 구축내용 표 (구축년도,데이터종류,포함내용,제공방식)
컬럼명 상세내역
user_id 수행 영상판독 전문의 ID
case_id 해당 유방촬영 이미지 ID
view_location 유방촬영영상 위치 (RCC, RMLO, LCC, LMLO)
lesion_id 악성병변 ID
contour coordinate 악성병변 coordinates list
discard_yn 해당 영상에 문제가 있어서 사용하지 못하게 될 케이스임을 표시하는 용도
데이터 구축 담당자
수행기관(주관) : 국립암센터

 

 
책임자명 전화번호 대표이메일 담당업무
황보율 031-920-0570 healthcare_ai@ncc.re.kr, yyjo0430@ncc.re.kr · 사업총괄 및 유방촬영영상 구축
수행기관(참여)
 
 
기관명 담당업무 기관명 담당업무
㈜루닛 · 저작도구 및 인공지능 모델 개발 ㈜필라테크 · 유방촬영영상 전처리
㈜헬스허브 · 유방촬영영상 어노테이션