KETI 지능정보 플래그십 R&D

상황/의미적 정보 데이터셋

외부 데이터는 해당 기관의 이용정책과 다운로드 절차를 따라야 하며 AI 허브와 관련이 없음을 알려 드립니다. [저작권 및 이용정책 상세보기]

구축량
  • 3차년도: 20명 대상 데이터 수집 (10월 - 11월)
대표 도면
image

 

필요성
  • 해외 유수 학회의 연구로부터 스마트폰은 다양한 개인화 지능형 서비스 제공을 위한 데이터 수집 플랫폼이자 서비스 전달 매체로 활용되고 있음
  • 스마트폰의 내장 센서 및 사용 정보로부터 수집되는 다양한 데이터는 사용자의 다양한 상태 및 맥락을 파악하는 데 필수적임. 이러한 데이터들은 실/내외 위치, 통화 시간/횟수, 문자 횟수, 화면 켬/끔 등을 포함함.
  • 또한, 스마트폰의 내장 센서를 통해서 사용자의 활동을 유추할 수 있음. Google 사에서 제공하는 Fitness API는 스마트폰/워치 기반으로 50종 이상의 신체 활동 내역을 추론/수집할 수 있도록 지원하고 있음.
  • 더불어, 경험 표본 추출법 (Experience Sampling Method)을 활용하여 사용자의 감정, 판단, 선호 등을 수집함으로써 보다 풍부한 상황 추론이 가능함.
  • 사용자 맞춤형 개인화된 인공지능 에이전트 개발을 위해선 이러한 스마트폰 기반의 상황/의미적 정보를 활용하는 것이 필요함
  • 이러한 종류의 데이터를 공식적으로 공개/공유하는 기관은 현재까지 없거나, 그 양이 미비하므로, 관련 분야 발전을 위하여 데이터 구축 및 공개가 필수적
데이터 구조
  • 데이터 공개/제공시 여러 형식으로 변환하여 제공할 수 있도록 지원 (JSON, CSV 등)
  • 다음은 JSON 형식일 때의 데이터셋 구조임 (전화 통화 내역 데이터의 경우)
{
  "subject_id": 1,
  "timestamp": 1538636589802,
  "source_type": "PHONE",
  "source_info": "samsung-SM-G950N-8.0.0",
  "number": "0109$e4f029b2d0249ddf305548affb1a41a1",
  "type": "INCOMING",
  "duration": 107,
  "presentation": "ALLOWED",
  "data_usage": 0,
  "contact": "UNDEFINED",
  "times_contacted": 0,
  "is_starred": 0,
  "is_pinned": 0
}
  • 또한, 데이터 제공을 위한 별도의 gRPC를 통하여 특정 쿼리 (예. 시간대, 특정 앱 등)에 만족하는 데이터를 취득할 수 있는 API 제공

데이터 구축 담당자 표 (담당기관, 책임자명, 전화번호, 대표이메일)
담당기관 책임자명 전화번호 대표이메일
KAIST 산업및시스템공학과 이의진 · uclee@kaist.edu
다운로드 폴더 구성정보

데이터 다운로드는 PC에서만 가능합니다.