구강 질환 진단 의료 영상 소개
기본탭
본 데이터는 온라인 안심존 데이터입니다.
데이터셋명 | 구강 질환 진단 의료 영상 | |||
---|---|---|---|---|
데이터 분야 | 헬스케어 | 데이터 유형 | 이미지 | |
구축기관 | 삼성생명공익재단 삼성서울병원 | 데이터 관련 문의처 | 담당자명 | 허재성(아주대학교병원) |
가공기관 | 아주대학교 산학협력단 | 전화번호 | 031-219-5337 | |
검수기관 | 아주대학교 산학협력단 | 이메일 | jsclinic@naver.com | |
구축 데이터량 | 1.2만 | 구축년도 | 2020년 | |
버전 | 1.0 | 최종수정일자 | 2021.06.30 | |
소개 | 구강질환 진단 의사결정을 돕는 AI 기술 개발을 위한 치과용 의료영상 데이터 | |||
주요 키워드 | 비식별화, 객체인식, 이미지, 객체 라벨링, 인식객체, 파노라마 영상 데이터, AI 기반 자동 크롭기능 | |||
저작권 및 이용정책 | 본 데이터는 과학기술정보통신부가 주관하고 한국지능정보사회진흥원이 지원하는 '인공지능 학습용 데이터 구축사업'으로 구축된 데이터입니다 [데이터 이용정책 상세보기] | |||
데이터설명서 | 자료보기 | 구축활용가이드 | 자료보기 | |
샘플데이터 | 교육활용동영상 | 영상보기 | ||
저작도구 | 다운로드 | AI모델 | 다운로드 |
데이터 변경이력
버전 | 일자 | 변경내용 | 비고 |
---|---|---|---|
1.0 | 2021.06.30 | 데이터 최초 개방 |
구축 목적
- 구강 내시경 이미지 데이터와 임상 정보를 결합하여 악성 종양을 판별할 수 있는 인공지능을 훈련하기 위한 데이터셋
활용 분야
- 구강 내시경 이미지를 정확하게 구별할 수 있는 AI 판독 모델 개발
소개
- 아주대학교병원, 서울대학교(본원, 보라매병원), 세브란스병원, 국립암센터 에서 운영하고 있는 의료데이터베이스(EMR, PACS)에서 데이터베이스 쿼리를 통해, 구강암 진단을 위해 촬영된 내시경 영상 및 해당 영상의 임상정보(pathology report)를 추출하여 원천 데이터를 확보. 이를 기반 으로 학습용 데이터 구축하며 인공지능 기반 구강 영상 판독 모델 개 발을 진행
구축 내용 및 제공 데이터량
- 1. 데이터 구축 내용
1) 구강 내시경 영상 : 내시경 촬영한 이미지 파일(EMR,PACS의 저장 이미지)
2) 이미지의 메타데이터 : 이미지 일련번호 / 질환의 분류 (정상/양성/악성) / 촬영부위 / 병리 소견 / 해상도
- 2. 데이터 구축 수량
구분 | 합계 | 정상 | 양성 | 악성 | ||
---|---|---|---|---|---|---|
설암 | 설암이외 암종 | 악성 합계 | ||||
사례(환자)수 | 3,086 | 1,626 | 960 | 467 | 391 | 849 |
구강 내시경 이미지 | 12,400 | 5,511 | 3,290 | 1,962 | 1,637 | 3,599 |
레이블된 이미지 | 12,400 | 5,511 | 3,290 | 1,962 | 1,637 | 3,599 |
대표도면
- 1. 정상 구강 내시경 이미지
- 2. 양성 구강 내시경 이미지
- 3. 악성 구강 내시경 이미지
필요성
- 구강암을 포함한 구강질환의 진단에 있어서 내시경 촬영이 간편하고 효과적인 방법이나 이를 정확히 판독할 수 있는 능력을 갖춘 전문의는 부족함
- 구강암은 양성 구강 점막 질환을 호소하는 환자에 비해 빈도가 높지 않아 경험이 많은 의사의 수가 상대적으로 제한됨
- 구강 영상의 인공지능 기반 1차 진단 방법개발은 진료의 질을 향상시키고 사회경제적인 비용을 감소시킬 수 있음
데이터 구조
- 1. 데이터 구성
기본 포맷 : JPG + JSON
- 구강 내시경 장비 기본 표준인 JPG 영상을 기준으로 사용
- 어노테이션 데이터 (JSON 포맷): 진단 정보 / 촬영 부위 / 병리 소견 / 이미지의 해상도
- 2. 어노테이션 포맷 (JSON)
어노테이션 표 분류 한글명 영문명 타입 필수
여부비교 image 이미지 일련번호 image_id integer Y 이미지 파일명 filename string 환자ID_이미지일련번호_해부학적부위_진단
(예 : A1_2_T_C.jpg)이미지 넓이 width integer 이미지 높이 height integer metainfo 촬영부위의 해부학적 위치 anatomical_site string Tongue(혀), Palate(구개),
Buccal mucosa (볼 점 막), Others병리소견 pathologic_findings string 병원에서 시행한 조직 검사의 병리 레포트의
내용category 진단명 라벨 category_id string Y N: Normal(정상),
B: Benign(양성),
C: Cancer(악성)
데이터셋 구축 담당자
수행기관(주관) : 삼성생명공익재단 삼성서울병원
책임자명 | 전화번호 | 대표이메일 | 담당업무 |
---|---|---|---|
팽준영 | 02-3410-2413 |
mobilehealth@aumc.ac.kr |
· 구강 내시경 데이터 수집 · 데이터 구축 총괄 · 데이터 품질 관리 ·학습용 데이터 저작 도구 개발 |
수행기관(참여)
기관명 | 담당업무 | 기관명 | 담당업무 |
---|---|---|---|
서울대학교 병원 | · 구강 내시경 데이터 수집 | 연세대학교 산학협력단 | · 구강 내시경 데이터 수집 |
보라매병원 | · 구강 내시경 데이터 수집 | 국립암센터 | · 구강 내시경 데이터 수집 |
마인즈앤컴퍼니 | · AI 모델 개발 | 딥내추럴 | · 크라우드 소싱 (비식별화) |
오엠인터액티브 | · 온라인 시범 서비스 개발 |