영유아 교육 영상콘텐츠 방송

영유아 교육 영상콘텐츠 방송

데이터셋명 영유아 교육 영상콘텐츠 방송
데이터 분야 비전 데이터 유형 비디오
구축기관 줌인터넷 데이터 관련 문의처 담당자명 이수윤
가공기관 (주)줌인터넷, (주)채널봄, (주)인피닉, (주)솔트룩스, (주)알디프로젝트, (주)마인즈랩, (주)지플러스 전화번호 02-583-4640
검수기관 (주)채널봄, (주)인피닉, (주)솔트룩스 이메일 tndbs83@zuminternet.com
구축 데이터량 79.2만 구축년도 2020년
버전 1.0 최종수정일자 2021.06.18
소개 영유아 교육 영상콘텐츠를 기반으로 동영상의 콘텐츠를 이해하고 분석하는 AI 기술 개발을 위한 영상 데이터
주요 키워드 객체인식, 상황인식, 방송 영상, 데이터셋, 영유아 영상, 영유아 교육, OTT 플랫폼
저작권 및 이용정책 본 데이터는 과학기술정보통신부가 주관하고 한국지능정보사회진흥원이 지원하는 '인공지능 학습용 데이터 구축사업'으로 구축된 데이터입니다. [데이터 이용정책 상세보기]
데이터설명서 자료보기 구축활용가이드 자료보기
샘플데이터 다운로드 교육활용동영상 영상보기
저작도구 다운로드 AI모델 다운로드
데이터 변경이력
버전 일자 변경내용 비고
1.0 2021.06.18 데이터 최초 개방  
구축 목적
  • 저작권, 지재권, 초상권, 특허권 등 적법성이 확보된 원본 데이터 및 가공 데이터의 구축·제공을 통해 지능형 영상 인식 AI의 학습 개발에 활용하기 위한 데이터셋 구축
활용 분야
  • 방송사 영상을 대상으로 구축하여, 실제 방송에서 획득할 수 있는 다양한 산업에서 활용 가능
    - 지적재산권, 초상권 등 법적 문제를 해결된 데이터로, 다양한 동영상 학습데이터 확보가 필요한 연구 및 검색서비스, 광고 서비스
    - 상황, 장면, 맥락(context)의 메타데이터가 기반 데이터가 되는 OTT 플랫폼, 영상제작사, 콘텐츠 투자사 등
소개
  • 방송사 및 개인으로부터 수집한 영상에 라벨링된 데이터셋으로, 다양한 장르의 영상에 라벨링된 객체, 상황, 인물등의 라벨링 정보를 담고 있으며 학습 데이터로 활용 가능하도록 지적재산권, 초상권 등 법적 문제를 해결한 원천 데이터를 활용함

     

    영유아 교육 영상콘켄츠 방송 데이터 소개 이미지
  • 영유아 교육 영상콘텐츠 방송 데이터셋은 EBS의 영유아 교육 관련 원천 데이터 대상으로 상황, 객체 정보를 라벨링함
구축 내용 및 제공 데이터량
  • 89번은 EBS의 영유아 교육 방송을 대상으로 약 700시간 가량의 동영상을 대상으로 라벨링된 데이터로 구성
세부과제명 데이터 형태 목표 수량 구축량
89번 객체 - 약 500만개
상황 6천개 이상 약 28만개
대표도면
영유아 교육 영상콘텐츠 방송 데이터 대표도면

※json형식은현재시점형태로,최종납품시변경될수있음

필요성
  • AI 학습 데이터는 4차 산업 혁명 시대의 중요한 생산 요소로 미국/ 유럽 등 AI 선도국에서는 정부와 민간이 협업하여 대규모의 데이터를 구축하고 있는 것에 반해, 한국은 비교적 경쟁력이 뒤쳐져 있어 이에 대한 대응 방안의 필요성이 대두되고 있음
  • 다만 국내 중소, 벤처 기업들은 오랜 시간과 많은 비용이 발생하는 AI 학습용 원천 데이터의 확보 부담으로 제품 서비스 개발에 어려움을 겪고 있음
  • 이에 저작권, 지재권, 초상권 등의 적법석이 확보된 원본 데이터 및 가공 데이터의 구축과 제공을 통해 중소/벤처기업 및 스타트업과 다양한 기관, 연구소 등에서 자유롭게 연구개발이 가능한 토대를 마련하고자 함
데이터 구조
  • 객체
    depth 항목 description 예시
    1 info 데이터셋  정보 -
    1.1. version 버전 정보 1.0.0
    1.2. name 데이터셋  이름 #98  객체 데이터셋
    1.3. description 데이터셋  설명 프레임  단위의 객체 태깅
    1.4. created_at 생성 날짜 43885
    2 annotation 라벨링 정보 -
    2.1 frames 이미지 정보 -
    2.1.1. filepath 이미지 경로 /EBS/program-0000/video-0000/0000000048.png"
    2.1.2. object 객체  라벨링 정보 -
    2.1.2.1. category_id 객체명 id 0
    2.1.2.2. bbox 바운딩박스 
    (X-min, Y-min, width, height)
    564,  182, 659, 898
    3 categories 객체명 정보 -
    3.1. id 객체명 번호 0
    3.2. name 객체명 한글 아이

     

  • 상황
    depth 항목 description 예시
    1 info 데이터셋  정보 -
    1.1. version 버전 정보 1.0.0
    1.2. name 데이터셋  이름 #98  상황 데이터셋
    1.3. description 데이터셋  설명 프레임  단위의 객체 태깅
    1.4. created_at 생성 날짜 43885
    2 annotation 라벨링 정보 -
    2.1 clips 상황 단위의 영상 클립 정보 -
    2.1.1. filepath 상황 단위의 영상 클립 경로 /EBS/program-0000/video-0000/0000000048.png"
    2.1.2. category_id 상황명 id 17
    2.1.3. length_sec 상황 단위의 영상 클립 길이 8
    2.2. frames 이미지 정보 -
    2.2.1. filepath 이미지 경로 /EBS/program-0004/video-0001/0000000533.png
    2.2.2. object 객체 라벨링 정보 -
    2.2.2.1. category_id 객체명 id 1
    2.2.2.2. bbox 바운딩박스 
    (X-min, Y-min, width, height)
    175,  45, 957, 1035
    3 situation_categories 상황  카테고리 정보 -
    3.1. id 상황  카테고리 번호 1
    3.2. L1 상황  카테고리 (대분류) 신체활동
    3.3. L2 상황  카테고리 (중분류) 걷기/달리기
데이터셋 구축 담당자
수행기관(주관) : 줌인터넷 주식회사
수행기관(주관) 표
책임자명 전화번호 대표이메일 담당업무
이수윤 02-583-4640 tndbs83@zuminternet.com · PM

 

수행기관(참여)
수행기관(참여) 표
기관명 담당업무 기관명 담당업무
채널봄 · 데이터 수집 및 정제
· 품질관리
마인즈랩 · 데이터 구조화 및 전처리
데이터메이커 · 저작도구 
· 데이터 라벨링 (크라우드소싱 활용) 
지플러스 · 저작도구 
· 데이터 라벨링 (크라우드소싱 활용) 

 

※ 이 데이터에 포함된 인물의 얼굴 등에 대해서는 개인정보 및 초상권의 이용 동의를 받아 제공합니다.