KETI 지능정보 플래그십 R&D

순차적 의사결정 데이터셋

외부 데이터는 해당 기관의 이용정책과 다운로드 절차를 따라야 하며 AI 허브와 관련이 없음을 알려 드립니다. [저작권 및 이용정책 상세보기]

구축량
  • 1, 2차년도: 44명 대상 약 95,000개 의사결정 행동데이터
대표 도면
image

 

필요성
  • 최근 강화학습은 경험을 통해 학습하는 인간의 학습과정에 대한 이론적 근거를 바탕으로 여러 문제에 사용되고 있으며, n-armed bandit과 같은 제한적 선택에 기반을 둔 데이터 또한 수집되어 왔음.
  • 하지만 에이전트가 무한히 많은 옵션을 가진 미지의 세계를 탐구하는 방법에 대해서는 거의 이해하지 못함.
  • 이에 고도로 제어된 실험 환경에서 한정적인 옵션을 가지고 인간의 학습과정을 재현했던 기존의 행동 실험 패러다임을 벗어나 보다 실제 환경 변화 시나리오와 가까운 실험 환경을 적용한 데이터 셋의 구축이 필요함.
구축 내용
  • 실제 환경 변화 시나리오를 모사한 실험 환경 구축
  • 위의 실험 환경에서 44명을 대상으로 실험 진행, 인간의 환경 탐색/학습 과정 데이터 구축
데이터 구조
  • double형 배열 내에 각 피험자별 의사결정 데이터 저장
  • ['col1 - Planet #'    'col2 - Global Time (sec)'    'col3 - Local Time (sec)'    'col4 - x Position of touch (pixels)'    'col5 - y Position of touch (pixels)'    'col6 – Gain']
  • ['col1 - Planet #'    'col2 - Distance between reward and penalty (pixel)'    'col3 - Degree of Distribution (rad) '    'col4 - Global Start Time (sec) '    'col5 - Global End Time (sec) ']
  • ['col1-total Score' ]
활용 예시
  • 연구 분야
    -데이터로부터 추출한 사람의 순차적 의사결정 프로세스 관련 행동 패턴을 알고리즘에 이식, 현재 컨텍스트에 대한 확률 분포가 알려지지 않은 환경에 대해서도 빠르게 학습 가능한 알고리즘 개발
    - 다양한 시나리오에서 사람의 행동 패턴을 예측하고 대응하는 알고리즘을 개발할 때 학습 및 테스트를 위한 데이터셋으로 활용.
  • 산업 분야
    - 현재 컨텍스트에 대한 확률 분포가 알려지지 않은 상황에서 사용자의 행동 패턴을 예측하고 적합한 행동을 추천하는 서비스 및 알고리즘 개발시 데이터셋으로 활용

데이터 구축 담당자 표 (담당기관, 책임자명, 전화번호, 대표이메일)
담당기관 책임자명 전화번호 대표이메일
한국과학기술원 바이오및뇌공학과 이상완 · sangwan@kaist.ac.kr
다운로드 폴더 구성정보

데이터 다운로드는 PC에서만 가능합니다.