Loading...

KETI 지능정보 플래그십 R&D 데이터

소개

개요

  • 디지털 자율지능이 사용자를 이해하고 적절한 도움을 주는 동반자 관점에서, 다양한 입력 정보를 수집하여 학습하는 적응형 기계학습(Adaptive Machine Learning) 기반 자율지능 디지털 동반자 기술을 개발하는 과제
  • 과제를 수행하며 취득한 AI데이터를 AI허브에서 공개
  • 과제는 총 4세부로 구성되어 있으며 디지털 동반자의 효과가 큰 응용 도메인을 선정하여 각 세부과제의 결과를 적용한 응용/서비스 개발

 

과제 세부 목표
총괄/1세부
(디지털 동반자 프레임워크)
스스로 상황을 판단하고, 대응방법을 결정할 수 있는 자율지능 디지털 동반자 프레임워크와 이를 활용한 응용/서비스 개발
2세부
(적응형 기계학습)

자율지능 디지털 동반자의 인공지능 성능 향상을 위해, 초기 학습된 상태를 기반으로 지속적으로 수집되는 사용자와 주변 멀티모달 정보를 학습하여 자가 성장하는 적응형 기계학습 기술 연구

3세부
(지능형 인터랙션)
사용자의 멀티모달 상황정보를 활용한 자율지능 디지털 동반자용 지능형 인터랙션 기술 연구개발
4세부
(동반자 감성지능 기술)
인간과 유사하게 소통하면서 상대방의 감정을 추론, 판단하여 감성적 대화를 통해 정서적인 공감대를 형성할 수 있는 자율지능 디지털 동반자용 감성지능 개발

데이터셋 다운로드

  • 데이터셋 (현재 다운로드 수 높은 데이터 순으로 우선 공개되며 2019년 12월 말에 27개 데이터 추가 공개)

감정음성합성 데이터셋

30대 여성 성우 1인, 7가지 감정에 대해서 각각 3,000개 발화에 대한 음성 녹음하여 총 21,000개 음성 파일 구축

파일형식PCM, TXT
용량4.0G
사용동의서4-2. 서약서_감정 음성합성 데이터셋.pdf

임신육아 지식베이스

의료 관련 질문 셋을 분석하여 28,000개의 키워드를 추출하고 이를 바탕으로 20,000개의 인스턴스 구축

파일형식RDF구조의 트리플데이터
용량389K
사용동의서1-5. 서약서_임신육아지식베이스.pdf

감정분류용 데이터셋

연기자 100명 대상, 7가지 감정에 대해 1인당 약 100번씩 발화 및 연기 수행, 총 10,351개 영상 구축

파일형식영상
용량92G
사용동의서4-1. 서약서_감정 분류용 데이터셋.pdf

수어 데이터셋

적용 도메인에 맞추어 선별된 단어 419개에 대한 수어 Full HD(1920×1080) 동영상과 메타정보

파일형식CSV, 영상
용량58G
사용동의서1-1. 서약서_수어 데이터셋.pdf

어린이 음성 데이터

초등학생 1학년에서 6학년의 남녀가 발성한 총 22.387시간의 음성데이터

파일형식TXT, WAV
용량832M
사용동의서3-5. 서약서_어린이 음성 데이터셋.pdf