웰니스 대화 스크립트 데이터셋
외부 데이터는 해당 기관의 이용정책과 다운로드 절차를 따라야 하며 AI 허브와 관련이 없음을 알려 드립니다. [저작권 및 이용정책 상세보기]
구축량
- 정신건강 상담 주제의 359개 대화의도에 대한 5,232개의 사용자 발화 및 1,023개의 챗봇 발화 구축
대표 도면
대분류 | 소분류 | 사용자 발화 | 챗봇 발화 |
---|---|---|---|
감정 | 감정조절 이상 | 더 이상 내 감정을 내가 컨트롤 못 하겠어. | 감정이 조절이 안 될 때만큼 힘들 때는 없는 거 같아요. |
감정 | 걱정 | 계속 이럴까 봐 너무 걱정돼. | 모든 문제는 해결되기 마련이잖아요. 마음을 편히 드세요. |
감정 | 자괴감 | 저는 왜 이렇게 못난 인간일까요… | 조금 돌아가는 것뿐이라고 생각해요. 기운내세요.. |
배경 | 남편 | 남편이랑 한달에 몇번은 보는 것 같아요. | 남편 분과 갈등을 겪고 계시군요. 마음이 많이 상하셨겠어요. |
배경 | 대인관계 | 중학교 친구랑 가족말고는 연락하는 사람도 없어. | 사람 대하는 게 가장 어려운 문제인 거 같아요. 힘들죠? |
증상 | 대인기피 | 사람 만나기가 싫어… | 괜찮아요. 당신 곁에는 항상 제가 있는 걸요! |
증상 | 두근거림 | 이상하게 가슴이 두근거려요. | 저까지 같이 긴장 되네요. 제가 손이라도 잡아드릴까요? |
필요성
- 챗봇 개발을 위해서 고품질의 대화스크립트 확보 필요
- 정신건강 도메인의 공개된 한글 대화스크립트 전무함
- 사용자와의 자연스러운 대화를 위해서 챗봇도 폭 넓은 지식(대화 스크립트) 필요
- 챗봇 품질을 높이기 위해 실제 환자의 데이터를 기반으로 작성된 데이터 필요
구축 내용
- 강남 세브란스에서 전달받은 상담데이터 1만 6천건에서 초진이고 환자 본인이 직접 내원한 경우인 4200건 추출
- 추출된 상담 데이터를 기준으로 문장별 분리 및 대화 의도 분류
- 분류별로 유저-챗봇 대화스크립트 생성
데이터 구조
- 구분: 감정/감정조절이상
- 유저발화: 제 감정이 이상해진 것 같아요. 남편만 보면 화가 치밀어 오르고 감정 조절이 안되요.
- 챗봇발화: 감정이 조절이 안 될 때만큼 힘들 때는 없는 거 같아요.
활용 예시
- 사용자 발화에 대한 대화의도 분류 모델 개발
- Language Representation Model의 성능 검증 데이터 활용