Loading...

소개

데이터 명

유방촬영영상과 안저촬영영상 이미지 인공지능 학습용 AI데이터

Disease Diagnosis Images

’19년 구축 목표

  • 유방암 데이터 (총 30,000장)

- 정상 4,500명 (18,000장)

- 양성종양 1,500명 (6,000장)

- 악성종양 1,500명 (6,000장)

 

  • 안저질환 데이터 (총 4,500장)

- 일반안저영상(2,500장):

· 정상소견 1,500장

· 녹내장소견 1,000장

- 광각안저영상(2,000장)

· 정상소견 600장

· 당뇨성 망막변증 700장

· 황반변성 500장

· 정맥폐쇄 200장

1차 공개 구축양

1차 목표 전체의 30%

  • 유방암 데이터: 9,840/30,000장 (약 33%)

- 정상 1583/4,500명 (6,332/18,000장)

- 양성종양 552/1,500명 (2,208/6,000장)

- 악성종양 485/1,500명 (1,940/6,000장)

  • 안저질환 데이터: 1589/4,500장 (약 35%)

- 일반안저영상:

· 정상소견 950/1,500장

· 녹내장소견 250/1,000장

- 광각안저영상

· 정상소견 112/600장

· 당뇨성 망막변증 143/700장

· 황반변성 97/500장

· 망막정맥폐홰 37/200장

대표 도면

  • 유방촬영영상

그림. 유방촬영영상 이미지 인공지능 학습용 데이터 구조 예시

  • 안저촬영영상

그림. 안저촬영영상 이미지 인공지능 학습용 데이터 구조 예시

필요성

  • 해외는 다양한 분야에서 인공지능 기술 개발에 활용할 인공지능 학습 데이터 및 학습 환경 등 기반 인프라가 활성화 되어 있음
  • 반면, 국내의 경우 개인정보 침해, 저작권, 초상권 등 다양한 이슈로 양질의 데이터 개방 및 활용은 여전히 어려운 상황임
  • 의료 산업 발전을 위한 인공지능 관련 신생기업들의 활성화를 위한 효율적이고 체계적인 의료 지식베이스 구축이 필요

구축내용

  • 유방암 데이터

- 유방암 진단 이미지 (6,000장), 양성 (6,000장), 정상 (18,000장) dicom 이미지 파일과 어노테이션 정보 json 파일, 임상/병리 기록 excel 파일 등의 의료 지식베이스와 인공지능 판독 시범 모델 개발

 

그림. 유방촬영영상 이미지 인공지능 학습용 데이터 구축 내용

 

  • 안저질환 데이터

- 총 4,500장의 이미지 파일(dicom, jpg)과 메타데이터 등의 의료 지식베이스와 인공지능 판독 시범 모델 개발

· 망막촬영(일반안저영상): 정상소견 1,500장, 녹내장소견 1,000장

· 망막촬영(광각안저영상): 정상소견 600장, 당뇨성망막병증 700장, 황반변성 500장, 정맥폐쇄 200장

 

그림. 안저촬영영상 이미지 인공지능 학습용 데이터 구축 내용

데이터 구조

  • 유방암 데이터

테이블명

컬렴명

데이터타입

비고

영상자료

영상이미지 id

char(10)

환자 대체키 id로 비식별화

4-view 유방촬영영상 위치

char(1)

RCC, RMLO, LCC, LMLO

레이블

char(1)

악성, 양성, 정상

유방 병변 단위 레이블

binary

RCC, RMLO 유방촬영 영상에서 병변이 관찰된 경우, right

임상정보

촬영시점의 나이

number

 

성별

binary

남자, 여자

국적

char(10)

 

유방촬영 최초 영상촬영 일시

date

 

유방촬영 추적 영상촬영 일시

date

 

bi-rads 판독 카테고리 (최초)

char(2)

1, 2, 3, 4a, 4b, 4c, 5

bi-rads 판독 카테고리 (추적)

char(2)

1, 2, 3, 4a, 4b, 4c, 5

조직검사 일시

date

 

병리검사 (검사코드)

char(5)

 

병리검사 (검사명)

varchar (10)

 

병리검사 (검사상태)

char (5)

 

병리검사 (검사소견)

varchar(255)

 

...

...

...

유방촬영영상의 기기정보

varchar(20)

모델명, 모델번호

어노테이션

임상의 id

char(10)

영상자료 테이블 영상이미지 id 참조(fk)

유방촬영영상 이미지 id

varchar

 

유방촬영영상 위치

char(1)

RCC, RMLO, LCC, LMLO

악성 병변 id

 

 

contour_list

 

악성 병변 annotation coordinate (x, y)

  • 안저질환 데이터

테이블명

컬렴명

데이터타입

비고

MST_PROJECT

프로젝트코드

char(8)

not null

삭제플래그

char(1)

default: ‘N’

프로젝트명

varchar(100)

 

라벨링횟수

number(2)

default: 1

이미지디렉토리

varchar(255)

 

등록자 ID

char(10)

default: ‘SUPERUSER’

WRK_LABELLING RESULT

프로젝트코드

char(8)

not null

사용자 ID

char(10)

not null

라벨링차수

number(2)

not null

이미지 ID

char(20)

not null

타겟코드

number(1)

not null

라벨값

number(2)

not null

등록일시

date

default: current_date

수정일시

date

 

활용예시

  • 연구분야

- 병변 segmentation, 질환 예측 등에 데이터 활용성 증대

 

  • 산업분야

-- 유방촬영 영상 보조 소프트웨어로써 촬영된 영상 이미지를 업로드하면 악성 종양으로 예상되는 곳에 표시하여 정보 제공

데이터셋 다운로드

질병진단 이미지 다운로드

별도 방법으로 공개 예정

데이터 구축 담당자

주관기관

책임자명

전화번호

대표이메일

국립암센터

황보율

031-920-0570

healthcare_ai@ncc.re.kr

샘플데이터 다운로드 페이지