상황/의미적 정보 데이터셋
외부 데이터는 해당 기관의 이용정책과 다운로드 절차를 따라야 하며 AI 허브와 관련이 없음을 알려 드립니다. [저작권 및 이용정책 상세보기]
구축량
- 3차년도: 20명 대상 데이터 수집 (10월 - 11월)
대표 도면

필요성
- 해외 유수 학회의 연구로부터 스마트폰은 다양한 개인화 지능형 서비스 제공을 위한 데이터 수집 플랫폼이자 서비스 전달 매체로 활용되고 있음
- 스마트폰의 내장 센서 및 사용 정보로부터 수집되는 다양한 데이터는 사용자의 다양한 상태 및 맥락을 파악하는 데 필수적임. 이러한 데이터들은 실/내외 위치, 통화 시간/횟수, 문자 횟수, 화면 켬/끔 등을 포함함.
- 또한, 스마트폰의 내장 센서를 통해서 사용자의 활동을 유추할 수 있음. Google 사에서 제공하는 Fitness API는 스마트폰/워치 기반으로 50종 이상의 신체 활동 내역을 추론/수집할 수 있도록 지원하고 있음.
- 더불어, 경험 표본 추출법 (Experience Sampling Method)을 활용하여 사용자의 감정, 판단, 선호 등을 수집함으로써 보다 풍부한 상황 추론이 가능함.
- 사용자 맞춤형 개인화된 인공지능 에이전트 개발을 위해선 이러한 스마트폰 기반의 상황/의미적 정보를 활용하는 것이 필요함
- 이러한 종류의 데이터를 공식적으로 공개/공유하는 기관은 현재까지 없거나, 그 양이 미비하므로, 관련 분야 발전을 위하여 데이터 구축 및 공개가 필수적
데이터 구조
- 데이터 공개/제공시 여러 형식으로 변환하여 제공할 수 있도록 지원 (JSON, CSV 등)
- 다음은 JSON 형식일 때의 데이터셋 구조임 (전화 통화 내역 데이터의 경우)
{
"subject_id": 1,
"timestamp": 1538636589802,
"source_type": "PHONE",
"source_info": "samsung-SM-G950N-8.0.0",
"number": "0109$e4f029b2d0249ddf305548affb1a41a1",
"type": "INCOMING",
"duration": 107,
"presentation": "ALLOWED",
"data_usage": 0,
"contact": "UNDEFINED",
"times_contacted": 0,
"is_starred": 0,
"is_pinned": 0
}
- 또한, 데이터 제공을 위한 별도의 gRPC를 통하여 특정 쿼리 (예. 시간대, 특정 앱 등)에 만족하는 데이터를 취득할 수 있는 API 제공