콘텐츠로 건너뛰기 메뉴로 건너뛰기 푸터로 건너뛰기
데이터를 불러오고 있습니다
데이터를 저장하고 있습니다
본 데이터는
온라인 안심존 데이터 ?

온라인 안심존 : 보안이 보장된 온라인 네트워크를 통해 집, 연구실, 사무실 등 어디서나 접속하여 데이터에 접근하고 분석

입니다.
#헬스케어 의료

영유아 행동 영상 데이터

영유아 행동 영상
  • 분야헬스케어
  • 구분 안심존(온라인)
  • 유형 비디오 , 이미지
구축년도 : 2021 갱신년월 : 2024-01 조회수 : 7,780 다운로드 : 55

※ 내국인만 데이터 신청이 가능합니다.

  • 데이터 변경이력

    데이터 변경이력
    버전 일자 변경내용 비고
    1.2 2024-01-09 원천데이터 및 라벨링데이터 수정
    1.1 2023-07-17 원천데이터 및 라벨링데이터 수정
    1.0 2022-07-28 데이터 최초 개방

    데이터 히스토리

    데이터 히스토리
    일자 변경내용 비고
    2024-01-09 데이터 통계, 활용 AI 모델 및 코드 내용 수정
    2022-07-28 콘텐츠 최초 등록

    소개

    부모의 주관적인 평가에 의존하는 현재 기술에 대해 영유아 발달평가의 기준점을 제공하고 한국 영유아 발달선별검사(K-DST) 기준에 의한 4~71개월 영유아를 대상으로 대근육, 소근육 행동 영상 데이터셋 확보

    구축목적

    주관적인 평가에 의존하는 현재의 평가기술의 문제점 해결을 목표로 하며, 객관적인 데이터를 확보함으로써 영유아 발달평가의 기준점을 제공하여 정확한 발달 평가가 이루어질 수 있도록 인공지능 서비스를 구축함
  • 데이터 통계

    1) 데이터 구축 규모
     영유아의 발달 장애를 선별하고 진단하기 위한 행동 동영상 데이터 확보
     영유아 발달 분석을 위한 영상 내 주요 행동 및 행동 분류 인공지능 데이터 구축
     - 가공 기준으로 최소 500시간 이상
     - 연령, 성별, 지역 등 인구학적 특성을 고려한 다양성 확보
     

    데이터 분포

    1) 정제 기준 500시간의 데이터 목표(500시간 확보에 필요한 1,000시간 내외 원시 데이터 수집)
    2) 서울 25%, 광역시(6개) 25%, 도(10개)&특별자치도 50%
    3) 성별은 동일하게 구성
    4) 월령별 분포는 4~19개월 : 20~35개월 : 36~53개월 : 54~71개월 = 1 : 2 : 4 : 3 로  배분함
    5) 발달평가별 결과는 빠른 수준 : 또래 수준 : 추적검사 요망 : 심화평가 권고(지체)

    (대근육) 36 : 44 : 18 : 2 
    (소근육) 41 : 41 : 14 : 4

    로 배분함

     

    • 수집 데이터

    수집항목 수집방법 시간 비고
    대/소근육 행동, 인지발달 직접촬영 400시간 카메라
    크라우드 수집 100시간 스마트폰
    500시간  

     

    • 발달평가 부여 기준
    K-DST검사는 월령별 문항(이하 정식문항)이 대근육(8개), 소근육(8개) 각각 있습니다. 이 월령별 문항으로 아동의 발달평가가 이루어지는 점은 맞습니다. 
    이번 사업에서는 코어문항(4개)을 명시하였습니다. 
    행동평가는 총체적인 접근과 일관성이 있는 응답을 고려하여 행동 평가의 총점을 통한 점수화 하였습니다.
    해당 검사 시의 발생 상황을 고려하여 평가를 하였습니다.
    - 낯가리는 상황
    - 촬영 당일 교사는 아이가 가능하다고 하는데 아이가 하지 않은 경우(면담) 
    - 전체 검사 중에 순간적인 실시 등 을 고려하여 평균적인 점수입니다.

     

    아래와 같은 기준으로 행동평가와 발달평가를 4개 행동 기준으로 부여하여 일관성을 유지하였습니다.

    발달수준 행동평가
    빠른 수준 3점
    또래수준 2점
    추적검사요망 1점
    심화평가 0 ~ 1점
    (검사3개 이상 진행 할 경우 1점)

     

    • 한국영유아발달선별검사 K-DST선별 세부문항(대소근육항목별)

    월령(기준) 수집문항 (대근육) 수집문항 (소근육) 
    4-19개월 앉혀주면 손을 짚지 않고 안전하게 앉아 있다 장난감을 손에 쥐여 주면 흔든다 
    양손과 무릎으로 긴다 두개의 물건을 양손에 각각 따로 쥔다
    정지되어 있는 공을 발로 찬다 (색)연필과 종이를 주면 선을 이리저리 그리며 낙서를 한다
    제자리에서 양발을 모아 동시에 깡충 뛴다 블록을 두 개 쌓는다
    20-35개월 난간을 붙잡지 않고 한 계단에 양발을 모은 뒤 한발씩 계단을 올라 간다 유아용 가위를 주면 실제로 종이를 자르지는 못해도 한손으로 종이를 잡고 다른 손으로는 가위 날을 벌리고 오므리며 종이를 자르려고 시도한다
    아무것도 붙잡지 않고 한 계단에 양발을 모은 뒤 한발씩 계단을 내려간다 수평선을 그리는 시범을 보여주면 흉내 내어 그린다 
    서 있는 자세에서 팔을 들어 머리 위로 공을 앞으로 던진다 엄지와 다른 손가락으로 (색)연필, 크레용 등을 잡는다 
    아무것도 붙잡지 않고 한발로 1초간 서 있는다  숟가락을 바르게 들어(음식물이 쏟아지지 않도록) 입에 가져 간다.
    36-53개월 아무것도 붙잡지 않고 한발로 3초 이상 서 있는다 사각형 (십자가, 동그라미)을 그려진 것을 보여주면 사각형 (십자가, 동그라미)을 그린다
    한발로 두세 발자국 뛴다 가위로 직선을 따라 똑바로 오린다
    제자리에서 두발을 모아 멀리뛰기를 한다 엄지손가락과 다른 네 손가락을 차례로 맞닿게 한다
    큰 공을 던져주면 양팔과 가슴을 이용해 받는다 그려진 점선을 따라 선을 그린다
    54-71개월 굴러가는 공을 발로 세운다 동그라미를 가위로 오린다
    공을 바닥에 한 번 튕길 수 있다  네모를 가위로 오린다
    무릎 아래 높이로 매어져 있는 줄을 뛰어 넘을 수 있다 삼각형이 그려진 것을 보여주면 삼각형을 그린다
    줄넘기를 1회한다 엄지 손가락과 다른 네 손가락을 차례로 맞닿게 한다

     

    • 직접촬영 및 모바일촬영 세부 촬영데이터수집 시간 분류

    월령대 사례 비율 직접촬영 모바일
    촬영
    직접촬영 모바일
    촬영
    500시간 400시간 100시간
    4-19개월 7% 16.4시간 18.6시간 9.4시간 7시간 6.7시간 11.9시간
    20-35개월 18% 78.6시간 13.7시간 37.9시간 40.7시간 10.3시간 3.4시간
    36-53개월 46% 163.9시간 18.1시간 86.3시간 77.6시간 6.3시간 11.8시간
    54-71개월 39% 160.3시간 36.5시간 81.7시간 78.6시간 12.6시간 23.9시간
      100% 419.2시간 86.9시간 215.3시간 203.9시간 35.9시간 51시간

     

    • 월령별, 성별, 지역별, 행동별, 수준별 기준

    시간
    분포
    연령대 분포(%) 행동별 성별
    분포
    지역분포
    대근육 소근육
    500시간 4-19개월 10% 31.4 시간 3.6 시간

    남자 (49%)
    251.3시간


    여자 (51%)
    255시간

    1. 서울 (40%)
    201.6시간

    2. 광역시 (27%)
    137.8시간

    3. 도,자치도 (33%)
    166.9시간
    20-35개월 20% 76.4 시간 15.8 시간
    36-53개월 40% 141.4 시간 40.7 시간
    54-71개월 30% 166.8 시간 30.1 시간

     

    • 발달평가별, 대/소근육 영유아 수

    구분 대근육(명, 비율) 소근육(명,비율)
    빠른 310 36% 120 41%
    또래 387 44% 120 41%
    추적 156 18% 42 14%
    심화 19 2% 13 4%
    872명   295명  

     

    • 월령별 행동번호별 동영상 개수

    구분 동영상(단위:개)
    대근육1번 대근육2번 대근육3번 대근육4번
    A : 4~19개월  71 63 50 46 230
    B : 20~35개월 173 46 169 163 551
    C : 36~53개월 324 325 326 325 1,300
    D : 54~71개월 297 298 299 298 1,192
    865 732 844 832 3,273
    구분 소근육1번 소근육2번 소근육3번 소근육4번
    A : 4~19개월  17 18 15 16 66
    B : 20~35개월 55 57 57 59 228
    C : 36~53개월 118 120 118 116 472
    D : 54~71개월 86 86 84 87 343
    276 281 274 278 1,109

     

    • 월령별 행동번호별 동영상 시간

    구분 동영상(단위:시간)
    대근육1번 대근육2번 대근육3번 대근육4번
    A : 4~19개월  18.34 4.84 5.37 2.89 31.45
    B : 20~35개월 39.91 3.68 19.17 13.69 76.45
    C : 36~53개월 37.45 31.05 33.41 39.45 141.36
    D : 54~71개월 48.59 41.86 38 38.32 166.77
    144.3 81.43 95.96 94.35 416.03
    구분 소근육1번 소근육2번 소근육3번 소근육4번
    A : 4~19개월  0.91 0.83 1.06 0.78 3.58
    B : 20~35개월 4.63 4.03 2.76 4.42 15.83
    C : 36~53개월 10.71 12.02 11.32 6.65 40.7
    D : 54~71개월 9.34 8.56 6.18 6.03 30.11
    25.59 25.43 21.32 17.88 90.22

     

    • 월령별 행동번호별 이미지 수량

    구분 이미지
    대근육1번 대근육2번 대근육3번 대근육4번
    A : 4~19개월  66,717 15,587 18,825 11,451 112,580
    B : 20~35개월 119,677 14,513 93,503 61,331 289,024
    C : 36~53개월 128,913 106,029 110,232 152,536 497,710
    D : 54~71개월 170,004 138,988 131,683 147,902 588,577
    485,311 275,117 354,243 373,220 1,487,891
    구분 소근육1번 소근육2번 소근육3번 소근육4번
    A : 4~19개월  2,899 3,013 3,784 3,672 13,368
    B : 20~35개월 17,643 16,688 12,526 21,360 68,217
    C : 36~53개월 32,179 31,935 33,618 25,426 123,158
    D : 54~71개월 29,489 25,946 28,064 24,451 107,950
    82,210 77,582 77,992 74,909 312,693

     

    • 발달평가별 행동번호별 동영상 개수

    구분 동영상 개수(단위:개)
    대근육1번 대근육2번 대근육3번 대근육4번
    A : 4~19개월  308 265 296 293 1,162
    B : 20~35개월 384 321 379 370 1,454
    C : 36~53개월 160 134 156 156 606
    D : 54~71개월 13 12 13 13 51
    865 732 844 832 3,273
    구분 소근육1번 소근육2번 소근육3번 소근육4번
    A : 4~19개월  115 119 116 118 468
    B : 20~35개월 109 110 108 111 438
    C : 36~53개월 46 45 43 43 177
    D : 54~71개월 6 7 7 6 26
    276 281 274 278 1,109

     

    • 발달평가별 행동번호별 동영상 시간

    구분 동영상(단위:시간)
    대근육1번 대근육2번 대근육3번 대근육4번
    빠른 수준 62.42 35.7 39.3 40.68 178.09
    또래 수준 53.47 30.77 36.58 35.11 155.93
    추적검사 요망 22.84 13.46 17.67 16.57 70.53
    심화 평가 권고(지체) 5.57 1.5 2.42 1.99 11.48
    144.3 81.43 95.96 94.35 416.03
    구분 소근육1번 소근육2번 소근육3번 소근육4번
    빠른 수준 11.34 11.61 9.51 8.42 40.87
    또래 수준 9.15 9.13 8.06 6.28 32.61
    추적검사 요망 3.85 3.68 3.26 2.9 13.69
    심화 평가 권고(지체) 1.26 1 0.5 0.29 3.05
    25.59 25.43 21.32 17.88 90.22

     

    • 발달평가별 행동번호별 이미지/JSON 수량

    구분 이미지
    대근육1번 대근육2번 대근육3번 대근육4번
    A : 4~19개월  214,948 122,397 150,216 163,486 651,047
    B : 20~35개월 182,115 105,611 140,567 141,198 569,491
    C : 36~53개월 71,091 42,538 57,290 61,636 232,555
    D : 54~71개월 17,157 4,568 6,170 6,900 34,795
    485,311 275,114 354,243 373,220 1,487,888
    구분 소근육1번 소근육2번 소근육3번 소근육4번
    A : 4~19개월  39,748 37,469 41,864 39,398 158,479
    B : 20~35개월 27,004 26,894 24,834 23,829 102,561
    C : 36~53개월 12,367 10,244 9,777 10,648 43,036
    D : 54~71개월 3,091 2,975 1,517 1,034 8,617
    82,210 77,582 77,992 74,909 312,693
  • 저작도구 설명서 및 저작도구 다운로드

    저작도구 설명서 다운로드 저작도구 다운로드
  • AI 모델 상세 설명서 다운로드

    AI 모델 상세 설명서 다운로드 AI 모델 다운로드

    활용 모델

    모델 학습

    1) 인공지능 데이터 활용 모델 개발 요약표

    데이터명 AI 모델 모델 성능 지표 응용서비스 (예시)
    전체 아동 행동 데이터 행동인식 Accuracy (1) 발달 평가를 위한 특정아동행동 감지(대근육) 
    (2) K-DST 자동화
    전체 아동 행동 데이터  단계분류 학습모델 F1-score (1) 발달 평가를 위한 특정아동행동 감지(대근육) 
    (2) K-DST 자동화
    전체 아동 행동 데이터 정상, 지연 발달 분류 학습모델 F1-score 아동 정상 , 지연 발달 분류 서비스

     

    • 데이터명: 영유아 행동 영상 데이터
      영유아 행동 영상-모델 학습_1

      가. 인공지능 학습용 데이터 활용모델 개발 방안
      – 인공지능 학습용 데이터 활용모델 개발 방안 구축된 2D Human Pose Estimation AI 모델 : 구축 데이터 기반 2D 자세추론 AI 모델 설계 및 openpose 기반의 네트워크 구성, 관절 위치 고해상도 히트맵 결정. 및 사용자의 관절 좌표 확인. 

      나. 인공지능 모델을 적용한 기술혁신 지원 방안
      – 아동 행동 데이터 공개로 의료 분야 및 다양한 환경에서의 다목적 활용 가능. 아동 행동 감지 응용서비스 개발로 보호자 및 보육 환경 종사자의 효율성 확대. 
      – 운동 능력 발달 평가 측정 매뉴얼 제공으로 고비용의 기존 행동 측정 장비를 대체하여, 경제적 부담 감소 및 보급화 등 파급 효과.

    • 서비스 활용 시나리오

      • 데이터 파이프라인 구축 가이드 : 신규데이터에 대한 전처리 및 가공이 가능하도록 자동 처리될 수 있도록 본과제의 활용된 소스코드를 공개하고 수정 가공이 가능한 가이드를 재시함으로서 데이터 가공 재작업을 최소화함

      • 지속적으로 신규 생성되는 데이터를 모델 도출에 최적화된 데이터로 가공할 수 있도록 매뉴얼을 제공하여 지속적으로 모델을 도출하고 신규 데이터에 대한 활용이 가능하도록 활용 매뉴얼 및 후보 솔루션, 알고리즘, 라이브러리를 제시하여 서비스 구축 후에 자발적으로 모델 최적화가 가능한 가이드를 제공함

    기타 정보

    • 포괄성
      – 성별, 지역별, 연령(개월수) 편향되지 않은 데이터 확보
    • 포괄성
      – 성별, 지역별, 연령(개월수) 편향되지 않은 데이터 확보
  • 데이터 성능 점수

    측정값 (%)
    기준값 (%)

    데이터 성능 지표

    데이터 성능 지표
    번호 측정항목 AI TASK 학습모델 지표명 기준값 점수 측정값 점수
    1 행동 인식 학습 모델 Action Recognition MS-G3D Accuracy 80 % 80.89 %
    2 단계 분류 학습 모델 Image Classification MS-G3D F1-Score 0.7 0.7025
    3 정상 지연 발달 분류 학습 모델 Image Classification MS-G3D F1-Score 0.7 0.73

    ※ 데이터 성능 지표가 여러 개일 경우 각 항목을 클릭하면 해당 지표의 값이 그래프에 표기됩니다.

    ※ AI모델 평가 지표에 따라 측정값의 범위, 판단 기준이 달라질 수 있습니다. (ex. 오류율의 경우, 낮을수록 좋은 성능을 내는 것으로 평가됩니다)

  • 설명서 및 활용가이드 다운로드

    데이터 설명서 다운로드 구축활용가이드 다운로드

    데이터 구성

    영유아 행동 영상-데이터 구성_1

     

    어노테이션 포맷

    • 대근육
      영유아 행동 영상-어노테이션 포맷_1_대근육(1)영유아 행동 영상-어노테이션 포맷_2_대근육(2)영유아 행동 영상-어노테이션 포맷_3_대근육(3)영유아 행동 영상-어노테이션 포맷_4_대근육(4)
       
    • 소근육
      영유아 행동 영상-어노테이션 포맷_5_소근육

    실제 예시

    • 대근육
      영유아 행동 영상-실제 예시_1_대근육(1)영유아 행동 영상-실제 예시_2_대근육(2)
       
    • 소근육
      영유아 행동 영상-실제 예시_3_소근육(1)영유아 행동 영상-실제 예시_4_소근육(2)영유아 행동 영상-실제 예시_5_소근육(3)
  • 데이터셋 구축 담당자

    수행기관(주관) : ㈜미소정보기술
    수행기관(주관)
    책임자명 전화번호 대표이메일 담당업무
    강태준 02-2205-0551 tjkang@misoinfo.co.kr · 저작도구 개발 · 라벨링 도구 제공 · 데이터 저장 및 보관
    수행기관(참여)
    수행기관(참여)
    기관명 담당업무
    ㈜마음드리 · 검사 장면 촬영 및 검사 진행
    · 라벨링 작업
    ㈜루먼랩 · 검사 장면 촬영 및 검사 진행
    연세대학교 산학 협력단 · 데이터 정제(사람 얼굴 Blur 처리)
    · 데이터 유효성 검증
    · AI모델 개발
    ㈜가치랩스 · 내용 품질 및 오류 자동 검사 후 확인
    · 데이터 정제
    ㈜에스에스엘 · 데이터 구문정확성 검수
    서울대학교병원 · 발달지연 환자 모집
    데이터 관련 문의처
    데이터 관련 문의처
    담당자명 전화번호 이메일
    강태준 02-2205-0551 tjkang@misoinfo.co.kr
보건의료 데이터 개방 안내

보건의료 데이터는 온라인 및 오프라인 안심존을 통해 개방됩니다.

안심존이란 안심존 이용메뉴얼 안심존 이용신청
  • 인터넷과 물리적으로 분리된 온라인·오프라인 공간으로 의료 데이터를 포함하여 보안 조치가 요구되는 데이터를 다운로드 없이 접근하고 분석 가능
    * 온라인 안심존 : 보안이 보장된 온라인 네트워크를 통해 집, 연구실, 사무실 등 어디서나 접속하여 데이터에 접근하고 분석
    * 오프라인 안심존 : 추가적인 보안이 필요한 데이터를 대상으로 지정된 물리적 공간에서만 접속하여 데이터에 접근하고 분석

    1. AI 허브 접속
      신청자
    2. 안심존
      사용신청
      신청자신청서류 제출*
    3. 심사구축기관
    4. 승인구축기관
    5. 데이터 분석 활용신청자
    6. 분석모델반출신청자
  • 1. 기관생명윤리위원회(IRB) 심의 결과 통지서 [IRB 알아보기]
    2. 기관생명윤리위원회(IRB) 승인된 연구계획서
    3. 신청자 소속 증빙 서류 (재직증명서, 재학증명서, 근로계약서 등 택1)
    4. 안심존 이용 신청서 [다운로드]
    5. 보안서약서 [다운로드]
    ※ 상기 신청서 및 첨부 서류를 완비한 후 신청을 진행하셔야 정상적으로 절차가 이루어집니다.

  • 신청 및 이용관련 문의는 safezone1@aihub.kr 또는 02-525-7708, 7709로 문의

데이터셋 다운로드 승인이 완료 된 후 API 다운로드 서비스를 이용하실 수 있습니다.

API 다운로드 파일은 분할 압축되어 다운로드 됩니다. 분할 압축 해제를 위해서는 분할 압축 파일들의 병합이 필요하며 리눅스 명령어 사용이 필요합니다.

리눅스 OS 계열에서 다운로드 받으시길 권장하며 윈도우에서 파일 다운로드 시 wsl(리눅스용 윈도우 하위 시스템) 설치가 필요합니다.

※ 파일 병합 리눅스 명령어

find "폴더경로" -name "파일명.zip.part*" -print0 | sort -zt'.' -k2V | xargs -0 cat > "파일명.zip"

- 해당 명령어 실행 시, 실행 경로 위치에 병합 압축 파일이 생성됩니다.

- 병합된 파일 용량이 0일 경우, 제대로 병합이 되지 않은 상태이니 "폴더경로"가 제대로 입력되었는지 확인 부탁드립니다.

※ 데이터셋 소개 페이지에서 다운로드 버튼 클릭하여 승인이 필요합니다.