공개 데이터 게시판

Open 데이터 국내·외 AI 개발을 위해 공개된 Open 데이터를 소개합니다.

  • - You Tube에서 다운로드 받은 영상으로 구성된 안면 인식 영상 데이터 셋
    - 동영상에서의 통제되지 않은 안면 인식의 문제 해결을 위해 디자인되었으며, 사람의 특징을 indicate 해줄 수 있는 라벨을 produce 하는 것이 목적임. 두개의 인물 영상이 동일인이지 여부를 판별
    - 1,595명, 3,425 동영상 (1인당 2.15의 동영상)

      바로가기  
  • - 안면 사진 데이터셋으로 통제되지 않는 환경에서의 안면 인식 문제를 연구하기 위해 디자인됨
    인물의 이름이 라벨링된 13,000 개의 이미지(웹 다운로드)

      바로가기  
  • - 통제되지 않은 실내 환경에서 5개의 CCTV 로 촬영, 현실 환경과 최대한 유사한 환경 구현
    -CCTV로 촬영된 정지된 상태(static)의 사람의 안면 이미지 데이터 베이스
    130명, 4160 개의 static 이미지로 구성
    - 각기 다른 화질의 5개 카메라로 조명이 통제되지 않은 상황에서 다양한 거리로 9개의 다른 자세를 촬영  

      바로가기  
  • - 미국 국방부에서 구축한 안면 인식 기술의 표준
    - 1,199명의 11,338 이미지
    - 안면 인식 기술(FERET) 프로그램은 미국 방위고등연구계획국(DARPA)과 국립표준기술연구소(NIST)가 관리

      바로가기  
  • -독일 및 인근 국가, 50개 도시의 거리 환경에 대한 이해를 목적으로, 비디오 프레임에 고급 주석과 단순 주석 처리하여 물체 탐지 벤치마크로 활용
    - 5,000개의 고급 주석 처리한 이미지와 20,000개의 단순 주석 처리한 이미지 수집
    - 지리학적, 인구 규모, 시계열 별로 도시 선정 다양성 분류

      바로가기  
  • - 통제된 환경이 아닌 복잡한 실제 생활에서의 scene을 수집하여, 상황 이해를 통한 사물 인지 기술이 가능함
    - 이전의 사물 인식 데이터 셋은 이미지 분류/로컬라이제이션/세그멘테이션 등에 집중했으나, MS-CO-CO는 대용량의 풍부한 annotation 데이터 셋을 구축 보유함
    -4세 이상 아동이 인지할 수 있는 91개의 사물 사진 데이터,  총 250만 라벨링된 인스턴스(328K 이미지), 80개 카테고리 

      바로가기  
  • - 세계 최다량의 자율 주행을 위한 데이터 셋으로 다양한 형태의 도로 및 물체 인식 하기 위하여, 동영상 데이터 활용
    - 약 5만명의 드라이버로 부터 촬영된 주행 비디오를 수집하였으며, 뉴욕, 샌프란시스코 등 다양한 지역에서 드라이버를 고용
    - 100,000개(1,100시간)주행 비디오를 수집하였으며, 동영상은 각각 40초씩 단위로 나뉘어 있음

      바로가기  
  • - ImageNet 대규모 시각 인식 챌린지에서 사용된 라벨링된 이미지 데이터 베이스
    - 제공 이미지는 Copyright 으로 인해 URL만 제공
    - 14,197,122개의 이미지, 1,034,908개의 주석 바운딩 박스, 1,000개의 SIFT표시 Sysset, 1,200,000개의 SIFT 표시 이미지

      바로가기  
  • - 현존하는 object location annotation 데이터 셋 중 최대 규모
    - 이미지 / 바운딩박스/ 라벨링으로 구성됨
    - 920만개 이미지, (600개 카테고리에의 )1500 만개 박스 ,(약 2만개 카테고리에의) 300만개 이미지-레벨 라벨 

      바로가기  
  • - 숫자 필기체 인식을 위한 데이터 베이스
    - NIST의 오리지널 데이터셋에서 250여명의 필기체의 샘플을 재 혼합하여 제작
    - NIST의 20*20 픽셀 흑백 그림을 28*28 픽셀로 수정 및 안티앨리어싱 처리하여 그레이스케일 포함

      바로가기