※온라인 안심존 : 보안이 보장된 온라인 네트워크를 통해 집, 연구실, 사무실 등 어디서나 접속하여 데이터에 접근하고 분석
-
데이터 변경이력
데이터 변경이력 버전 일자 변경내용 비고 1.1 2023-12-29 데이터 최종 개방 1.0 2023-04-30 데이터 개방(Beta Version) 데이터 히스토리
데이터 히스토리 일자 변경내용 비고 2025-01-06 메타데이터 정보 수정 데이터 구축량 2024-01-05 산출물 전체 공개 소개
분만 기간 동안 산모의 자궁 수축 변화 양상 및 태아의 심음 등을 모니터링 하여 산모의 이상 진통이나 기타 이상을 관찰하는 검사인 태아 심박동 모니터링으로부터 획득한 데이터
구축목적
태아 심박동 검사 모니터링 이미지를 통해 태아 상태 진단 분류 및 이상 시점 탐지를 위한 인공지능 학습용 데이터 구축
-
메타데이터 구조표 데이터 영역 헬스케어 데이터 유형 이미지 데이터 형식 png 데이터 출처 컨소시엄 참여 병원 라벨링 유형 분류 태그(태아 상태 응급 여부), 바운딩 박스(태아 심박동 모니터링 이미지 내 이상시점) 라벨링 형식 JSON 데이터 활용 서비스 태아 이상 조기 경고 시스템, 태아 상태 파악 및 예후 예측 서비스 데이터 구축년도/
데이터 구축량2022년/49,794 -
• 데이터 구축 규모
데이터 구축 규모 과제번호 과제명 데이터 유형 데이터 설명 데이터 건수 27 태아 신생아 데이터 원천데이터(PNG) 원본이미지 24,597 바운딩박스 이미지 24,597 라벨링데이터(JSON) 라벨 데이터 24,597 메타데이터(JSON) 전자의료기록정보 24,597 이미지 어노테이션정보 24,597
• 데이터 분포
- 다양성(통계)다양성(통계) 항목명 속성명 비율 태아 남녀 성비 남아 52.36% 여아 47.64% 태아 체중별 분포 0이상 ~ 500미만 0.00% 500 이상 ~ 1000 미만 0.69% 1000 이상 ~ 1500 미만 4.41% 1500 이상 ~ 2000 미만 9.81% 2000 이상 ~ 2500 미만 18.46% 2500 이상 ~ 3000 미만 25.57% 3000 이상 ~ 3500 미만 28.22% 3500 이상 ~ 4000 미만 11.04% 4000 이상 ~ 4500 미만 1.64% 4500 이상 0.16% 산모 연령대별 분포 10대 0.15% 20대 10.74% 30대 76.64% 40대 12.41% 50대 이상 0.07% 산모 출산횟수 분포 0회 54.35% 1회 34% 2회 9.28% 3회 1.85% 4회 0.36% 5회 이상 10회 미만 0.09% 10회 이상 0.02% 9999 0.13% 산모 임신횟수 분포 0회 0.00% 1회 40.08% 2회 33.63% 3회 15.82% 4회 6.43% 5회 이상 10회 미만 3.83% 10회 이상 0.07% 9999 0.15%
- 다양성(요건)다양성(요건) 항목명 속성명 비율 태아 심박동 카테고리 분포 Category 1 72.72% Category 2 + Category 3 27.28% 태아 상태별 분포 비응급 53.71% 응급 46.29% 태아 종류별 분포 단태아 83.95% 다태아 16.05% -
-
AI 모델 상세 설명서 다운로드
AI 모델 상세 설명서 다운로드 AI 모델 다운로드학습 모델 데이터 명 태아 심박동 모니터링 데이터 학습 모델 태아 이상 시점 탐지 모델 모델 YOLOv5 성능 지표 이상 시점 IOU 0.7 이상 개발 내용 구축된 학습데이터의 이미지 내 이상시점 특징을 학습하여 Object Detection 기반 모델인 YOLOv5를 사용하여 이미지 내 태아의 이상 시점을 탐지하는 모델 개발 응용서비스 - 종이 기록지 스캔 이미지 데이터에 딥러닝을 적용하여 이상 발생 시점을 검출하고 태아 심박동 및 자궁 수축 데이터의 원활한 활용을 지원 (예시 및 유의사항) - 태아 이상 발생 시점을 검출하여 관리 및 조기 치료 등에 대한 지침을 수립하고 의사 결정을 지원 학습 모델 데이터 명 태아 심박동 모니터링 데이터 학습 모델 태아 상태 진단 분류 모델 모델 XGBoost 성능 지표 태아 상태 분류 성능 F1-score 0.7 이상 개발 내용 전자 의료 기록과 태아 심박동 및 자궁수축도 데이터를 활용해 태아 상태 응급 여부를 예측하는 tree 기반의 XGBoost 모델 개발 응용서비스 - 태아 심박동 및 자궁 수축, 전자 의료기록 데이터 등을 이용하여 사람이 쉽게 인지하기 힘든 미세한 비정상적인 패턴을 인공지능 모델을 통해 감지함으로써 태아의 상태 파악하고 임신 예후를 진단 (예시 및 유의사항) - 검사자간 결과 해석 간극을 줄이고, 응급과 비응급 케이스들을 후향적으로 분석 -
데이터 성능 점수
측정값 (%)기준값 (%)데이터 성능 지표
데이터 성능 지표 번호 측정항목 AI TASK 학습모델 지표명 기준값 점수 측정값 점수 1 태아 상태 진단 분류 성능 Text Classification XGBoost F1-Score 0.7 점 0.857 점 2 태아 이상 시점 탐지 성능 Object Detection YOLO v5 IoU 70 % 77.1 %
※ 데이터 성능 지표가 여러 개일 경우 각 항목을 클릭하면 해당 지표의 값이 그래프에 표기됩니다.
※ AI모델 평가 지표에 따라 측정값의 범위, 판단 기준이 달라질 수 있습니다. (ex. 오류율의 경우, 낮을수록 좋은 성능을 내는 것으로 평가됩니다)
-
설명서 및 활용가이드 다운로드
데이터 설명서 다운로드 구축활용가이드 다운로드• 태아 심박동 모니터링 이미지 데이터
- 원천데이터(PNG)
- 라벨데이터(JSON)
① 바운딩 박스(태아 심박동 모니터링 이미지 내 이상시점)
② 분류태그(태아 상태 응급 여부)
• FHR 데이터
• TOCO 데이터
• 산모 및 태아 전자 의료 기록 데이터• 어노테이션 포맷
- 라벨링 데이터라벨링 데이터 No. 항목명 타입 필수여부 비고 1 ID string Y 2 BaseLine number Y 3 Baseline_Variability string Y 0:absent 1:minimal 2:moderate 3:marked 4 Acceleration string Y 1: Yes 2:No 5 Early_deceleration string Y 0:NO 1: YES 6 Late_deceleration string Y 0: 없음 1:1회 2:2회이상 7 Variable_deceleration string Y 0: 없음 1:1회 2:2회이상 8 Prolonged_deceleration string Y 0:NO 1: YES 9 Sinosoical_pattern string Y 0:NO 1: YES 10 CA string Y 0:CA1 1:CA2 2:CA3 11 Abnormality string Y 12 Bbox array N [[x1,y1,x2,y2,width,height]] 13 Emergency string Y 0: 비응급 1: 응급 - 메타 데이터 (EMR)
메타 데이터 (EMR) No. 항목명 타입 필수여부 비고 1 ID string Y 2 Mother.de-identification_ID string Y 3 de-identification_ID string Y 4 Mother.MEASURE_DATE number Y yyyymm 5 Mother.Birth Date number Y yyyymm 6 Father.Birth Date number N yyyymm 9999:unknown 7 Mother.Height number Y 9999:unknown 8 Mother.Weight number Y 9999:unknown 9 Mother.ABO type string Y 9999:unknown 10 Mother.RH type string Y 1:+ 2:- 9999:unknown 11 Mother.Gravida number Y 9999:unknown 12 Mother.Para number Y 9999:unknown 13 Mother.SBP number Y 9999:unknown 14 Mother.DBP number Y 9999:unknown 15 Mother.GHTN string Y 1.Yes 2:No 9999:unknown 16 Mother.Hypertension string Y 1:Yes 2:No 9999:unknown 17 Mother.GDM string Y 1:Yes 2:No 9999:unknown 18 Mother.DM string Y 1:Yes 2:No 9999:unknown 19 Mother.pre-eclampsia string Y 1: pre-eclmpsia 2: eclampsia 3.해당없음 9999:unknown 20 Delivery string Y 1:자연분만 2:제왕절개 3:제왕절개후자연분만(VBAC) 9999:unknown 21 GA.wks number Y 9999:unknown 22 GA.day number Y 9999:unknown 23 FetalDistress string Y 1:Yes 2:No 9999:unknown 24 FGR string Y 1:Yes 2:No 9999:unknown 25 Placenta.Complication string Y 1:전치태반 2:태반조기박리 3:기타 4:해당없음 9999:unknown 26 Placenta.Weight number N 9999:unknown 27 Cervix number N 9999:unknown 28 Birth Date number Y yyyymm 29 Sex string Y 1:남아 2:여아 30 Weight number Y 9999:unknown 31 Height number Y 9999:unknown 32 HC number Y 9999:unknown 33 APGAR.1min number Y 9999:unknown 34 APGAR.5min number Y 9999:unknown 35 UA.pH number N 9999:unknown 36 UA.BE number N 9999:unknown 37 UA.pO2 number N 9999:unknown 38 UA.pCO2 string N 9999:unknown 39 NICU.Adm string Y 1:Yes 2:No 9999:unknown 40 Intubation string Y 1:Yes 2:No 9999:unknown 41 Jaundice string Y 1:Yes 2:No 9999:unknown 42 prematurity string Y 1:Yes 2:No 9999:unknown 43 LBW string Y 1:Yes 2:No 9999:unknown 44 Anomaly string Y 1:Yes 2:No 9999:unknown 45 Anomaly1 string Y 1:Yes 2:No 9999:unknown 46 Anomaly2 string Y 1:Yes 2:No 9999:unknown 47 Anomaly3 string Y 1:Yes 2:No 9999:unknown 48 Anomaly4 string Y 1:Yes 2:No 9999:unknown 49 Anomaly5 string Y 1:Yes 2:No 9999:unknown 50 Anomaly6 string Y 1:Yes 2:No 9999:unknown 51 Anomaly7 string Y 1:Yes 2:No 9999:unknown 52 Anomaly8 string Y 1:Yes 2:No 9999:unknown 53 Fetal_Monitor string N 54 twins string Y 0: 단태아, 1: 다태아
- 메타 데이터 (annotation person)메타 데이터 (annotation person) No. 항목명 타입 필수여부 비고 1 code string Y 2 category string Y 3 original_image array Y 4 refine_image array Y 5 twins string Y "False":단태아 "True":다태아 6 data array N 6-1 data.partial_image object N 6-2 data.partial_time_min string N 6-3 data.fhr string N 6-4 data.toco string N 6-5 data.interval_sec string N 6-6 data.baseline string N 6-7 data.baseline_var string N 0:absent 1:minimal 2:moderate 3:marked 6-8 data.accel string N 1: Yes 2:No 6-9 data.decel string N 0:absent 1:earlydeceleration있음 2:latedeceleration있음 3:variabledeceleration있음 4:prolongeddeceleration있음 5:sinosoicalpattern있음 6-10 data.cervix string N -
데이터셋 구축 담당자
수행기관(주관) : 아주대학교 산학협력단
수행기관(주관) 책임자명 전화번호 대표이메일 담당업무 김미란 031-219-5300 kmr5300@ajou.ac.kr 데이터 확보, 추출, 검증, 인공지능 모델 개발과 검증, 홍보 활동 등 전 단계 관리 감독 수행기관(참여)
수행기관(참여) 기관명 담당업무 네오컨버전스 이미지 데이터 정제 및 라벨링 도구 개발 및 교육, 크라우드 워커 관리, 데이터 관리 코스모티어 총괄보조 및 진도관리, 데이터 전처리 및 2차 정제 피트케어 데이터 라벨링, S/W도구 개발 위세아이텍 인공지능 모델 개발, 모델 학습 및 검증, 데이터품질관리 데이터 관련 문의처
데이터 관련 문의처 담당자명 전화번호 이메일 김미란 031-219-5300 kmr5300@ajou.ac.kr
-
인터넷과 물리적으로 분리된 온라인·오프라인 공간으로 의료 데이터를 포함하여 보안 조치가 요구되는 데이터를 다운로드 없이 접근하고 분석 가능
* 온라인 안심존 : 보안이 보장된 온라인 네트워크를 통해 집, 연구실, 사무실 등 어디서나 접속하여 데이터에 접근하고 분석
* 오프라인 안심존 : 추가적인 보안이 필요한 데이터를 대상으로 지정된 물리적 공간에서만 접속하여 데이터에 접근하고 분석 -
- AI 허브 접속
신청자 - 안심존
사용신청신청자신청서류 제출* - 심사구축기관
- 승인구축기관
- 데이터 분석 활용신청자
- 분석모델반출신청자
- AI 허브 접속
-
1. 기관생명윤리위원회(IRB) 심의 결과 통지서 [IRB 알아보기] [공용IRB 심의신청 가이드라인]
2. 기관생명윤리위원회(IRB) 승인된 연구계획서
3. 신청자 소속 증빙 서류 (재직증명서, 재학증명서, 근로계약서 등 택1)
4. 안심존 이용 신청서 [다운로드]
5. 보안서약서 [다운로드]
※ 상기 신청서 및 첨부 서류를 완비한 후 신청을 진행하셔야 정상적으로 절차가 이루어집니다. -
신청 및 이용관련 문의는 safezone1@aihub.kr 또는 02-525-7708, 7709로 문의
데이터셋 다운로드 승인이 완료 된 후 API 다운로드 서비스를 이용하실 수 있습니다.
API 다운로드 파일은 분할 압축되어 다운로드 됩니다. 분할 압축 해제를 위해서는 분할 압축 파일들의 병합이 필요하며 리눅스 명령어 사용이 필요합니다.
리눅스 OS 계열에서 다운로드 받으시길 권장하며 윈도우에서 파일 다운로드 시 wsl(리눅스용 윈도우 하위 시스템) 설치가 필요합니다.
※ 파일 병합 리눅스 명령어
find "폴더경로" -name "파일명.zip.part*" -print0 | sort -zt'.' -k2V | xargs -0 cat > "파일명.zip"
- 해당 명령어 실행 시, 실행 경로 위치에 병합 압축 파일이 생성됩니다.
- 병합된 파일 용량이 0일 경우, 제대로 병합이 되지 않은 상태이니 "폴더경로"가 제대로 입력되었는지 확인 부탁드립니다.
※ 데이터셋 소개 페이지에서 다운로드 버튼 클릭하여 승인이 필요합니다.
오프라인 데이터 이용 안내
본 데이터는 K-ICT 빅데이터센터에서도 이용하실 수 있습니다.
다양한 데이터(미개방 데이터 포함)를 분석할 수 있는 오프라인 분석공간을 제공하고 있습니다.
데이터 안심구역 이용절차 및 신청은 K-ICT빅데이터센터 홈페이지를 참고하시기 바랍니다.