공개 데이터 게시판

Open 데이터 국내·외 AI 개발을 위해 공개된 Open 데이터를 소개합니다.

  • 인터넷 마케팅 포럼에 광고된 50개 온라인 서비스의 데이터입니다.

      바로가기  
  • 뇌졸중 사건을 예측하는 11가지 임상적 특징입니다.

      바로가기  
  • 농구 게임과 기사 외 다양한 정보가 담긴 데이터셋을 제공합니다.
      바로가기  
  • 통신 회사에서 데이터 세트를 제공합니다. 이 데이터에는 거의 6,000명의 사용자, 그들의 인구 통계학적 특성, 그들이 사용하는 서비스, 운영자의 서비스 사용 기간, 지불 방법 및 지불 금액에 대한 정보가 포함되어 있습니다.
      바로가기  
  • 클럽하우스의 유저 프로필 데이터셋 입니다.
      바로가기  
  • 이것은 Google Play Store의 각 게임 범주별 상위 100개 게임의 데이터 세트입니다. 게임 등급 및 기타 데이터(예: 가격 및 설치 수)를 포함합니다.
      바로가기  
  • LibriTTS는 24kHz 샘플링 속도로 약 585시간의 읽기 영어 연설의 다중 스피커 코퍼스입니다. 더 리브리입니다TTS 말뭉치는 TTS 연구를 위해 설계되었습니다. 이것은 LibriSpeech 말뭉치의 원본 자료(LibriVox의 mp3 오디오 파일과 Project Gutenberg의 텍스트 파일)에서 파생되었습니다.
      바로가기  
  • MEASRO는 노트 라벨과 오디오 파형 사이의 미세한 정렬(~3ms)로 캡처된 200시간 이상의 가상 피아노 연주로 구성된 데이터 세트입니다.
      바로가기  
  • RealState10K는 약 80,000개의 비디오 클립에서 파생된 1,000만 개의 프레임에 해당하는 대규모 카메라 포즈 데이터 세트입니다. 약 10,000개의 YouTube 비디오에서 수집됩니다. 각 클립에 대해 포즈는 각 포즈가 궤적을 따라 카메라 위치와 방향을 지정하는 궤적을 형성합니다. 이러한 포즈는 대규모 비디오 세트에서 SLAM 및 번들 조정 알고리즘을 실행하여 도출됩니다.
      바로가기  
  • 카툰 세트는 랜덤 2D 만화 아바타 이미지 모음입니다. 만화는 10개의 예술품 범주, 4개의 색상 범주 및 4개의 비율 범주로 다양하며, 총 1013개의 조합이 가능합니다. 무작위로 선택된 10k와 100k의 만화 세트와 레이블이 지정된 속성을 제공합니다.
      바로가기