질병진단 이미지(유방암) 소개
본 데이터는 오프라인 안심존 데이터입니다.
데이터셋명 | 질병진단 이미지(유방암) | |||
---|---|---|---|---|
데이터 분야 | 헬스케어 | 데이터 유형 | 이미지 | |
구축기관 | 국립암센터 | 데이터 관련 문의처 | 담당자명 | 이재동(국립암센터) |
가공기관 | 전화번호 | 031-920-0572 | ||
검수기관 | 이메일 | healthcare_ai@ncc.re.kr | ||
구축 데이터량 | 3만 | 구축년도 | 2019년 | |
버전 | 1.0 | 최종수정일자 | 2019.12.31 | |
소개 | 유방암 이미지 (6,000장), 양성 (6,000장), 정상 (18,000장) dicom 이미지 파일과 Annotation 정보 json 파일, 임상/병리 기록 excel 파일 등의 의료 지식베이스를 구축한 이미지 데이터 제공 | |||
주요 키워드 | 유방촬영, 정상유방, 양성종양, 유방암, 질환 예측 데이터, 임상 기록, 병리 기록, 의료 지식베이스, 수술 후 병리 변수, 종양병기 | |||
저작권 및 이용정책 | 본 데이터는 과학기술정보통신부가 주관하고 한국지능정보사회진흥원이 지원하는 '인공지능 학습용 데이터 구축사업'으로 구축된 데이터입니다. [데이터 이용정책 상세보기] | |||
데이터설명서 | 자료보기 | 구축활용가이드 | 자료보기 | |
샘플데이터 | 교육활용동영상 | |||
저작도구 | 다운로드 | AI모델 |
데이터 변경이력
버전 | 일자 | 변경내용 | 비고 |
---|---|---|---|
1.0 | 2019.12.31 | 데이터 최초 개방 |
구축목적
- 유방촬영 관련 인공지능 개발 촉진, 유방촬영 영상 판독의 정확도 향상과 비용 절감
활용분야
산업분야
- 유방촬영 영상 보조 소프트웨어로써 촬영된 영상 이미지를 업로드하면 악성 종양으로 예상되는 곳에 표시하여 정보 제공
연구분야
- 병변 segmentation, 질환 예측 등에 데이터 활용성 증대
사례
- 건양대병원 의료 빅데이터 분석 '데이터톤' 진행
구축량
- 유방암 데이터 7,500명 (총 30,000장)
환자수 (명) | 영상이미지 (개) | |
---|---|---|
정상유방 | 4,500 | 18,000 |
양성종양 | 1,500 | 6,000 |
유방암 | 1,500 | 6,000 |
합계 | 7,500 | 30,000 |
- 유방촬영영상

필요성
- 해외는 다양한 분야에서 인공지능 기술 개발에 활용할 인공지능 학습 데이터 및 학습 환경 등 기반 인프라가 활성화 되어 있음
- 반면, 국내의 경우 개인정보 침해, 저작권, 초상권 등 다양한 이슈로 양질의 데이터 개방 및 활용은 여전히 어려운 상황임
- 의료 산업 발전을 위한 인공지능 관련 신생기업들의 활성화를 위한 효율적이고 체계적인 의료 지식베이스 구축이 필요
구축내용
- 유방암 데이터
- 유방암 이미지 (6,000장), 양성 (6,000장), 정상 (18,000장) dicom 이미지 파일과 Annotation 정보 json 파일, 임상/병리 기록 excel 파일등의 의료지식베이스
데이터 구조
- 유방암 데이터
경로 | 파일명 | 내용 | |
---|---|---|---|
/malign | /0XXXX | LMLO.dcm RMLO.dcm RCC.dcm LCC.dcm |
- dicom 형식 |
/benign | /1XXXX | ||
/normal | /2XXXX | ||
/json | Cancer_0xxxx.json | - Json 형식의 annotation 정보(malignant case에 한함) | |
/ | meta.xlsx | - 검사장비, BI-RADS category, 종양 위치 (malignant case에 한함), TN-Stage (malignant case에 한함) |
데이터명 | 변수명 | 내용 |
---|---|---|
공통추출변수 (정상/ 양성/악성) | group | 양성/악성/정상에 대한 그룹 정보 |
recvid | 비식별후에 대체번호로 부여된 환자 ID | |
manufacturer | 검사장비 | |
manufacturerModelName | 검사장비 모델 | |
both1 | BIRADS category (양쪽) | |
left1 | BIRADS category (좌) | |
right1 | BIRADS category (우) | |
수술후 병리 변수 (악성만 해당) | spr_loca_cmnt | 악성 종양의 위치 (ex. breast left/right) |
invs_size_vl | 악성 종양의 크기 (1cm 단위로 카테고리로, 반올림) | |
htlg_type_cmnt | 조직형 진단 (IDC, ILC, DICS, others) | |
path_t_stag | 종양의 병기 (ex. 1, 2, 3, 4) |
컬럼명 | 상세내역 |
---|---|
user_id | 수행 영상판독 전문의 ID |
case_id | 해당 유방촬영 이미지 ID |
view_location | 유방촬영영상 위치 (RCC, RMLO, LCC, LMLO) |
lesion_id | 악성병변 ID |
contour coordinate | 악성병변 coordinates list |
discard_yn | 해당 영상에 문제가 있어서 사용하지 못하게 될 케이스임을 표시하는 용도 |
데이터 구축 담당자
수행기관(주관) : 국립암센터
책임자명 | 전화번호 | 대표이메일 | 담당업무 |
---|---|---|---|
황보율 | 031-920-0570 | healthcare_ai@ncc.re.kr | · 사업총괄 및 유방촬영영상 구축 |
수행기관(참여)
기관명 | 담당업무 | 기관명 | 담당업무 |
---|---|---|---|
㈜루닛 | · 저작도구 및 인공지능 모델 개발 | ㈜필라테크 | · 유방촬영영상 전처리 |
㈜헬스허브 | · 유방촬영영상 어노테이션 |