질병진단 이미지

질병진단 이미지 AI데이터

Mammography and Fundus Image AI Training Dataset

'19년 구축량
  • 유방암 데이터 7,500명 (총 30,000장)
상식 데이터 구축내용 표 (구축년도,데이터종류,포함내용,제공방식)
  환자수 (명) 영상이미지 (개)
정상유방 4,500 18,000
양성종양 1,500 6,000
유방암 1,500 6,000
합계 7,500 30,000
  • 안저질환 데이터 (총 4,500장)
상식 데이터 구축내용 표 (구축년도,데이터종류,포함내용,제공방식)
  메타데이터 (개) 영상 (장)
일반_정상 2,179 2,179
일반_녹내장 1,019 1,019
광각_정상 613 613
광각_당뇨성망막병증 502 502
광각_황반변성 853 853
광각_망막정맥폐쇄 234 234
합 계 5,400 5,400
대표 도면
  • 유방촬영영상
ㅇㄹ
<유방촬영영상 이미지 인공지능 학습용 데이터 구조 예시>
  • 안저촬영영상

 

df

필요성
  • 해외는 다양한 분야에서 인공지능 기술 개발에 활용할 인공지능 학습 데이터 및 학습 환경 등 기반 인프라가 활성화 되어 있음
  • 반면, 국내의 경우 개인정보 침해, 저작권, 초상권 등 다양한 이슈로 양질의 데이터 개방 및 활용은 여전히 어려운 상황임
  • 의료 산업 발전을 위한 인공지능 관련 신생기업들의 활성화를 위한 효율적이고 체계적인 의료 지식베이스 구축이 필요
구축내용
  • 유방암 데이터
    - 유방암 이미지 (6,000장), 양성 (6,000장), 정상 (18,000장) dicom 이미지 파일과 Annotation 정보 json 파일, 임상/병리 기록 excel 파일등의 의료지식베이스
  • 안저질환 데이터
    - 총 4,500장의 이미지 파일(jpg)과 메타데이터(.xlsx) 등의 의료 지식베이스
     · 망막촬영(일반안저영상): 정상소견 1,500장, 녹내장소견 1,000장
     · 망막촬영(광각안저영상): 정상소견 600장, 당뇨성망막병증 700장, 황반변성 500장, 정맥폐쇄 200장
데이터 구조
  • 유방암 데이터
df
< 유방촬영영상 이미지 인공지능 학습용 데이터 구조 예시 >

 

상식 데이터 구축내용 표 (구축년도,데이터종류,포함내용,제공방식)
데이터명 변수명 내용
공통추출변수 (정상/ 양성/악성) group 양성/악성/정상에 대한 그룹 정보
recvid 비식별후에 대체번호로 부여된 환자 ID
manufacturer 검사장비
manufacturerModelName 검사장비 모델
both1 BIRADS category (양쪽)
left1 BIRADS category (좌)
right1 BIRADS category (우)
수술후 병리 변수 (악성만 해당) spr_loca_cmnt 악성 종양의 위치 (ex. breast left/right)
invs_size_vl 악성 종양의 크기 (1cm 단위로 카테고리로, 반올림)
htlg_type_cmnt 조직형 진단 (IDC, ILC, DICS, others)
path_t_stag 종양의 병기 (ex. 1, 2, 3, 4)
상식 데이터 구축내용 표 (구축년도,데이터종류,포함내용,제공방식)
컬럼명 상세내역
user_id 수행 영상판독 전문의 ID
case_id 해당 유방촬영 이미지 ID
view_location 유방촬영영상 위치 (RCC, RMLO, LCC, LMLO)
lesion_id 악성병변 ID
contour coordinate 악성병변 coordinates list
discard_yn 해당 영상에 문제가 있어서 사용하지 못하게 될 케이스임을 표시하는 용도
  • 안저질환 데이터
상식 데이터 구축내용 표 (구축년도,데이터종류,포함내용,제공방식)
테이블명 컬럼명 데이터타입 비고
Metadata 일련번호 char 질환 별 일련번호
이미지파일명 char 이미지파일명
일반/광각 char 일반/광각 영상 구분
정상/질환코드 char 정상과 질환 구분
레이저치료 char DMR의 경우 레이저 치료 유무
좌/우 char 시신경유두 방향
촬영장비 char 찰영장비명
활용예시
산업분야

 

  • 유방촬영 영상 보조 소프트웨어로써 촬영된 영상 이미지를 업로드하면 악성 종양으로 예상되는 곳에 표시하여 정보 제공

 

연구분야

 

  • 병변 segmentation, 질환 예측 등에 데이터 활용성 증대
데이터 구축 담당자
수행기관(주관) : 국립암센터

 

 
책임자명 전화번호 대표이메일 담당업무
황보율 031-920-0570 healthcare_ao@ncc.re.kr · 사업총괄 및 유방촬영영상 구축
수행기관(참여)
 
 
기관명 담당업무 기관명 담당업무
㈜루닛 · 저작도구 및 인공지능 모델 개발 ㈜필라테크 · 유방촬영영상 전처리
㈜헬스허브 · 유방촬영영상 어노테이션 건양대학교 병원 · 안저촬영영상 구축
· 저작도구 개발 및 라벨링
㈜에임즈 · 인공지능 모델 개발 ㈜인피니그루 · 인공지능 모델 개발
가이드라인 다운로드