질병진단(유방암 조직, 부비동) 이미지 AI 데이터
기본탭
구축목적
- 유방암,부비동염 진단을 위한 의료 인공지능 모델 개발에 활용 가능한 부비동 X-ray 영상과 유방조직 이미지 및 메타데이터의 의료 지식베이스 공개
활용분야
- 유방조직 이미지의 유방암 진단보조 인공지능 서비스를 탑재한 디지털 병리 솔루션 개발
- 부비동 X-ray 이미지의 부비동염 진단보조 인공지능 서비스를 탑재한 솔루션 개발
주요 키워드
- 의료영상, 유방병리, 부비동 방사선, 진단보조
소개
- 유방암 진단을 위한 의료 지식베이스 데이터셋으로 4,000케이스의 조직 병리검사 이미지 100,000장과 메타데이터 4,000개 구축을 목표로함
- 부비동염 진단을 위한 의료 지식베이스 데이터셋으로 부비동 X-ray 8,000케이스와 메타데이터 8,000개 구축을 목표로 함
구축 내용 및 제공 데이터량
유방암 조직 이미지
- 유방병리 영상이미지 4,000케이스 (100,000장)
- 악성(malignant): 3,000케이스 (75,000장)
- 비악성(non-malignant): 1,000케이스 (25,000장) - 20x배율의 512 x 512 pixel size 이미지 파일(png)
부비동 X-ray 이미지
- 부비동 X-ray 이미지 8,000케이스 (dicom 형식)
- Normal : 7,000케이스
- Mucosal thickening : 650케이스
- Air fluid : 200케이스
- Haziness : 150케이스
메타데이터
- 유방암 조직: 각 케이스별로 병리 이미지와 연령대, 검사장비 기기정보(제조사명, 모델명), 종양의 병기의 메타데이터 파일(xlsx)
- 부비동: X-ray 이미지 파일명 성별, 연령대, 검사 일자, 기기정보(제조사명)의 메타데이터 파일(xlsx)
대표도면
필요성
유방암 조직
- 전 세계적으로 의료에서 가장 핵심적인 질환은 현재는 암질환이며, 암에 의한 사망은 전체 사망의 26.5% (2018년 통계청)를 차지하며, 여성에서 유방암은 전 세계적으로 매년 200만명 이상이 발생
- 유방암의 조기진단은 사회 경제적으로 매우 중요한 문제이며 조직검사는 병리과 전문의 판독을 통하여 암 진단의 여부가 결정
- 유방조직 이미지를 이용하여 의료 인공지능 학습용 지식베이스를 구축하고 암 진단 보조 인공지능 모델을 개발하여 조기진단을 통한 의료비 절감 및 진단의 오진율을 감소하여 의료서비스 질 향상가능
부비동
- 부비동이 세균에 감염돼 발생하는 질환을 ‘부비동염’ 또는 ‘축농증’이라고 하며, 상악동에서 가장 빈번하게 발생됨
- 부비동염이 의심될 경우 1차적으로 X-ray를 이용해서 검사를 진행하지만, 진단 정확도가 70% 정도이고 이후 정밀 검사나 수술 계획을 위해 추가로 CT 검사를 시행
- 부비동 X-ray 이미지를 이용하여 의료 인공지능 학습용 지식베이스를 구축하고, 진단 보조 인공지능 모델을 개발하여 조기진단을 통한 의료비 절감 및 진단의 오진율을 감소하여 의료서비스 질 향상가능
데이터 구조
[유방암 조직 메타데이터]
컬럼명 | 데이터타입 | null | 예시 |
---|---|---|---|
익명화 환자ID | char | N | S00005745 |
연령대 | char | N | 1 : 19 2 : 20~29, 3 : 30~39, 4 : 40~49, 5 : 50~59, 6 : 60~69, 7 : 70~79, 8 : 80~89, 9 : 90 이상 |
검사일시 | date | N | 1999.01.01. |
검사장비 제조사 | char | Y | 3DHistech |
검사장비 모델명 | char | Y | P1000t |
GRP | char | N | 0 : malignant 1 : non-malignant |
종양의 병기 | char | Y | 1a |
[부비동 메타데이터]
컬럼명 | 데이터타입 | null | 예시 |
---|---|---|---|
이미지파일명 | char | N | 00000001_0_1.dcm |
성별 | char | N | 0 : 남자 1 : 여자 |
연령대 | date | N | 1 : 19 2 : 20~29, 3 : 30~39, 4 : 40~49, 5 : 50~59, 6 : 60~69, 7 : 70~79, 8 : 80~89, 9 : 90 이상 |
검사일시 | char | N | 1999-01-01 |
제조사명 | char | Y | Samsung Electronics |
데이터셋 구축 담당자
수행기관(주관) : 국립암센터
책임자명 | 전화번호 | 대표이메일 | 담당업무 |
---|---|---|---|
황보율 | 031-920-0572 | healthcare_ai@ncc.re.kr | · 사업총괄, 데이터 설계, 원천데이터 수집 및 정제, 데이터검수 |
수행기관(참여)
기관명 | 담당업무 | 기관명 | 담당업무 |
---|---|---|---|
인피니트 헬스케어 |
· 데이터가공 | 딥노이드 | · 저작도구 개발, AI 모델 개발 |
건양대학교병원 | · 데이터 설계, 원천데이터 수집 및 정제, 데이터 검수 | 딥네츄럴 | · 데이터가공, 크라우드 소싱 |
유비즈정보기술 | · 저작도구개발 | 마인즈앤컴퍼니 | · AI 모델 개발 |
오엠인터렉티브 | · 응용서비스 개발 | 네어비즈니스플랫폼 | · 데이터 활용 |
논문 인용 정보