KETI 지능정보 플래그십 R&D

VRM 화행 데이터

외부 데이터는 해당 기관의 이용정책과 다운로드 절차를 따라야 하며 AI 허브와 관련이 없음을 알려 드립니다. [저작권 및 이용정책 상세보기]

구축량
  • 영문 SWDA 혹은 MRDA 화행 데이터를 기반으로 VRM 화행 맵핑을 통한 데이터셋 약 10만건 레코드 구축 
  • 한국 드라마 대본 셋에서 크라우드 소싱으로 레이블링된 VRM 화행 분류 데이터셋 구축
필요성
  • VRM(Verbal Response Mode)는 임의의 문장을 8개의 대화 의도로 분류한 체계이다.
  • VRM은 기존 심리학 연구에서 그 대화 양상을 연구한 바가 있으므로 VRM 화행 분류기 제작에 도움이 되는 데이터는 다양한 대화 양상을 지원할 수 있는 에이전트를 제작하는데 도움이 될 수 있다.
  • VRM에 대한 대용량 데이터 베이스가 없으므로, 이를 구축하면 분류기 제작에 도움이 될 수 있다.
  • 원본 메시지에 대한 VRM 레이블링 자료를 제공합니다.

 

상식 데이터 구축내용 표 (구축년도,데이터종류,포함내용,제공방식)
원본 VRM
즐거운 아침입니다. D
오늘 아침은 영상 15도입니다. E
네 맞습니다. K
오늘 아침 오십니까? Q
오늘 아침 오세요 A
오늘 기분이 좋으시군요 R
너는 참 멋진 사람이야  
  • VRM의 분류는 다음 표와 같습니다.

 

상식 데이터 구축내용 표 (구축년도,데이터종류,포함내용,제공방식)
경험의 원천 경험에 대한 추정 인용프레임 (타인) 인용프레임 (화자)
타인 타인 Reflection (R) Interpretation (I)
타인 화자 Acknowledgement (K) Question (Q)
화자 타인 Confirmation (C) Advisement (A)
화자 화자 Edification (E) Disclosure (D)
데이터 구조
  • 파일 형식 : CSV
  • 헤더 : 대화본문, VRM 레이블링 
  • 예시 : “오늘 아침 참 상쾌하고 기분이 좋네”, D

데이터 구축 담당자 표 (담당기관, 책임자명, 전화번호, 대표이메일)
담당기관 책임자명 전화번호 대표이메일
카이스트 산학협력단 이성철 · leesungchul@kaist.ac.kr
다운로드 폴더 구성정보

데이터 다운로드는 PC에서만 가능합니다.