장면인식‧인물인식을 위한 방송 영상

장면인식‧인물인식을 위한 방송 영상

데이터셋명 장면인식‧인물인식을 위한 방송 영상
데이터 분야 비전 데이터 유형 비디오
구축기관 줌인터넷 데이터 관련 문의처 담당자명 이수윤
가공기관 (주)줌인터넷, (주)채널봄, (주)인피닉, (주)솔트룩스, (주)알디프로젝트, (주)마인즈랩, (주)지플러스 전화번호 02·583·4640
검수기관 (주)채널봄, (주)인피닉, (주)솔트룩스 이메일 tndbs83@zuminternet.com
구축 데이터량 93.6만 구축년도 2020년
버전 1.1 최종수정일자 2021.09.15
소개 미디어 영상의 비디오 및 프레임 데이터를 기반으로 미디어 장면을 분류하고, 미디어 영상 내 인물을 자동 검출 분석하기 위한 영상 데이터
주요 키워드 객체인식, 장면인식, 인물인식, 방송영상 데이터셋, 연예인 데이터, 연예인 닮은꼴
저작권 및 이용정책 본 데이터는 과학기술정보통신부가 주관하고 한국지능정보사회진흥원이 지원하는 '인공지능 학습용 데이터 구축사업'으로 구축된 데이터입니다. [데이터 이용정책 상세보기]
데이터설명서 자료보기 구축활용가이드 자료보기
샘플데이터 다운로드 교육활용동영상 영상보기
저작도구 다운로드 AI모델 다운로드
데이터 변경이력
버전 일자 변경내용 비고
1.1 2021.09.15 데이터 추가 개방  
1.0 2021.06.30 데이터 최초 개방  
구축목적
  • 저작권, 지재권, 초상권, 특허권 등 적법성이 확보된 원본 데이터 및 가공 데이터의 구축·제공을 통해 지능형 영상 인식 AI의 학습 개발에 활용하기 위한 데이터셋 구축
활용분야
  • 방송사 영상을 대상으로 구축하여, 실제 방송에서 획득할 수 있는 다양한 산업에서 활용 가능
  • 장면인식 인물인식을 위한 방송 영상 콘텐츠 데이터는 OBS, YTN, EBS 등 방송사 영상 및 개인으로부터 수집한 다양한 영상을 대상으로 인물, 장면, 객체 정보를 라벨링함 31_90.장면인식 인물인식을 위한 방송 영상 콘텐츠 데이터예시이미지
소개
  • 방송사 및 개인으로부터 수집한 영상에 라벨링된 데이터셋으로, 다양한 장 르의 영상에 라벨링된 객체, 상황, 인물등의 라벨링 정보를 담고 있으며 학 습 데이터로 활용 가능하도록 지적재산권, 초상권 등 법적 문제를 해결한 원천 데이터를 활용함
  • 장면인식 인물인식을 위한 방송 영상 콘텐츠 데이터는 OBS, YTN, EBS 등 방송사 영상 및 개인으로부터 수집한 다양한 영상을 대상으로 인물, 장면, 객체 정보를 라벨링함

 

구축 내용 및 제공 데이터량
  • 90번은 약 670시간 가량의 동영상을 대상으로 라벨링된 데이터로 구성
    장면인식‧인물인식을 위한 방송 영상 내용 및 데이터량 표
    세부과제명 데이터 형태 목표 수량 구축량
    90번 객체 700만개 이상 약 800만개
    인물 200명 241명, 14만개
    장면 - 29종, 21만개
대표도면

영상 콘텐츠의 이해 AI데이터 90.장면인식 인물인식을 위한 방송 영상 콘텐츠 데이터 예시이미지

image 73
필요성
  • AI 학습 데이터는 4차 산업 혁명 시대의 중요한 생산 요소로 미국/ 유럽 등 AI 선도국에서는 정부와 민간이 협업하여 대규모의 데이터를 구축하고 있는 것에 반해, 한국은 비교적 경쟁력이 뒤쳐져 있어 이에 대한 대응 방안의 필요성이 대두되고 있음
  • 다만 국내 중소, 벤처 기업들은 오랜 시간과 많은 비용이 발생하는 AI 학습용 원천 데이터의 확보 부담으로 제품 서비스 개발에 어려움을 겪고 있음
  • 이에 저작권, 지재권, 초상권 등의 적법석이 확보된 원본 데이터 및 가공 데이터의 구축과 제공을 통해 중소/벤처기업 및 스타트업과 다양한 기관, 연구소 등에서 자유롭게 연구개발이 가능한 토대를 마련하고자 함
데이터구조
  • 객체
    객체표
    depth 항목 description 예시
    1 info 데이터셋 정보 -
    1.1. version 버전 정보 1.0.0
    1.2. name 데이터셋 이름 #99 객체 데이터셋
    1.3. description 데이터셋 설명 프레임 단위의 객체 태깅
    1.4. created_at 생성 날짜 43885
    2 annotation 라벨링 정보 -
    2.1 frames 이미지 정보 -
    2.1.1. filepath 이미지 경로 /EBS/program-0000/video-0000/0000000048.png"
    2.1.2. object 객체 라벨링 정보 -
    2.1.2.1. category_id 객체명 id 0
    2.1.2.2. bbox 바운딩박스
    (X-min, Y-min, width, heigh)
    564, 182, 659, 898
    3 categories 객체명 정보 -
    3.1. id 객체명 번호 0
    3.2. name 객체명 한글 아이
  • 인물
     
    depth 항목 description 예시
    1 info 데이터셋 정보 -
    1.1. version 버전 정보 1.0.0
    1.2. name 데이터셋 이름 #99 인물 데이터셋
    1.3. description 데이터셋 설명 프레임 단위의 인물 태깅
    1.4. created_at 생성 날짜 43885
    2 annotation 라벨링 정보 -
    2.1. filepath 이미지 경로 filepath": "/OBS/program-0000/video-0000/0000000010.png
    2.2. people 인물 라벨링 정보 -
    2.2.1. category_id 인물명 id 201
    2.2.2. bbox 바운딩박스
    (X-min, Y-min, width, heigh)
    1166, 317, 54, 74
    3 categories 인물 카테고리 정보  
    3.1. id 인물명 번호 201
    3.2. name 인물명 한글 조영남
  • 장면
     
    depth 항목 description 예시
    1 info 데이터셋 정보 -
    1.1. version 버전 정보 1.0.0
    1.2. name 데이터셋 이름 #99 장면 데이터셋
    1.3. description 데이터셋 설명 프레임 단위의 장면 태깅
    1.4. created_at 생성 날짜 43885
    2 annotation 라벨링 정보 -
    2.1 frames 이미지 정보 -
    2.1.1. filepath 이미지 경로 "/YTN/program-0000/video-0000/0000000000.png
    2.1.2. category_id 장면명 id 0
    2.1.3. object 객체 라벨링 정보 -
    2.1.3.1. category_id 객체명 id 0
    2.1.3.2. bbox 바운딩박스
    (X-min, Y-min, width, heigh)
    51, 143, 410, 485
데이터셋 구축 담당자
수행기관(주관) : 줌인터넷
수행기관(주관)
책임자 연락처(대표전화) 대표 이메일 담당업무
이수윤 02-583-4640 tndbs83@zuminternet.com · PM
수행기관(참여)
수행기관(참여)
기관명 담당업무 기관명 담당업무
피플레이 · 콘텐츠 업무 마인즈랩 · 데이터 구조화 및 전처리, 라벨링
인피닉 · 저작도구, 데이터라벨링 (크라우드소싱 활용)