AI-Hub

#일상 대화 # 쇼핑 대화 # 정치 대화 # 경제 대화 # 취미 대화 # AI 비서 # 동시통역 # 감성형 대화 음성지능 서비스

구축년도 : 2018 갱신년월 : 2019-05 조회수 : 66,608 다운로드 : 14,718 용량 :

소개 파일 목록 (API 다운로드)

※ 내국인만 데이터 신청이 가능합니다.

문의하기 목록

데이터 변경이력
버전	일자	변경내용	비고
1.0	2019-05-15	데이터 최초 개방

데이터 히스토리
일자	변경내용	비고
2022-10-17	세부데이터, 데이터통계 항목 내 링크 수정

대화형 음성 인식 성능 개선을 위한 음향 모델용 한국어 자유 발화 음성 데이터 구축 및 2,000여명의 발성 대화 음성 1,000시간을 구축한 자연어 데이터 제공

구축내용

대화형 음성인식 성능 개선을 위한 음향모델(Acoustic Modeling)용 한국어 자유발화 음성데이터 구축
조용한 환경에서 2,000여명이 발성한 한국어 대화음성 1,000시간 구축
두 사람이 다양한 주제(예: 일상, 쇼핑, 정치, 경제, 날씨, 취미 등)로 자유롭게 대화하는 음성을 녹음하고 발성내용을 ERTI전사규칙(예: 간투사, 머뭇거림 등)에 따라 철자전사
전사규칙 공유 https://aihub.or.kr/aihubnews/notice/view.do?pageIndex=1&nttSn=9746&currMenu=132&topMenu=103
평가 데이터, 실험 하이퍼 파라메터 등에 관한 참고 자료(레퍼런스 페이퍼) :KsponSpeech (Korean Spontaneous Speech Corpus for Automatic Speech Recognition)

[ 한국어 음성 분야 대화 주제 표 예시 ]

법률 데이터 구축내용 표 (구축년도,데이터종류,포함내용,제공방식)
데이터 종류	구축수량	포함 내용	제공 방식
안부 일상 대화	자기소개	날씨	계절
	거주지 정보		황사/미세먼지
	이성친구		혹서기/혹한기
	학교생활		장마/폭설
	회사생활		온도
	기념일		눈/비/안개 등
쇼핑	의류	취미	사진
	전자기기		여행
	생활용품		음식(맛집)
	악기 등		책
TV	예능		운동
	드라마		전시회
	영화		공연
	연예인		블로그
	시사		음악
정치 경제	정치		스포츠
	부동산		게임
	주식		자동차
		전공	전공(이과/문과)

데이터 설명서 다운로드

데이터 변경이력

데이터 변경이력
버전	일자	변경내용	비고
1.0	2019.05.15	데이터 최초 개방

필요성

최근 대화형 AI 서비스의 글로벌 경쟁이 치열함에 따라 국내 산업체 지원을 위한 AI학습용 대화형 자유발화 음성DB 구축 시급
구글, 바이두 등 해외 경쟁업체는 수천~수만시간의 대용량 음성데이터를 AI 기술 개발에 활용하고 있으나 국내에서는 수십~백시간 수준의 소규모 데이터 구축으로 한정되어 AI 기술개발에 제약이 되고 있음
본 DB 활용을 통해 국가 간 사활을 걸고 있는 AI 분야 대화형 음성인식 기술경쟁 우위 확보 및 新서비스 창출로 글로벌 시장 점유 확대 및 AI비서, 외국어교육, 동시통역 등 AI 기반 음성인식 사용성의 획기적 개선으로 장애인, 다문화가족을 비롯한 일반 국민의 편익 향상이 기대됨

구축내용

대화형 음성인식 성능 개선을 위한 음향모델(Acoustic Modeling)용 한국어 자유발화 음성데이터 구축
조용한 환경에서 2,000여명이 발성한 한국어 대화음성 1,000시간 구축
두 사람이 다양한 주제(예: 일상, 쇼핑, 정치, 경제, 날씨, 취미 등)로 자유롭게 대화하는 음성을 녹음하고 발성내용을 ERTI전사규칙(예: 간투사, 머뭇거림 등)에 따라 철자전사
전사규칙 공유 https://aihub.or.kr/aihubnews/notice/view.do?pageIndex=1&nttSn=9746&currMenu=132&topMenu=103
평가 데이터, 실험 하이퍼 파라메터 등에 관한 참고 자료(레퍼런스 페이퍼) :KsponSpeech (Korean Spontaneous Speech Corpus for Automatic Speech Recognition)

[ 한국어 음성 분야 대화 주제 표 예시 ]

법률 데이터 구축내용 표 (구축년도,데이터종류,포함내용,제공방식)
데이터 종류	구축수량	포함 내용	제공 방식
안부 일상 대화	자기소개	날씨	계절
	거주지 정보		황사/미세먼지
	이성친구		혹서기/혹한기
	학교생활		장마/폭설
	회사생활		온도
	기념일		눈/비/안개 등
쇼핑	의류	취미	사진
	전자기기		여행
	생활용품		음식(맛집)
	악기 등		책
TV	예능		운동
	드라마		전시회
	영화		공연
	연예인		블로그
	시사		음악
정치 경제	정치		스포츠
	부동산		게임
	주식		자동차
		전공	전공(이과/문과)

데이터 구조

발화 단위로 세그멘테이션된 음성파일(포맷: 16kHz/16bits, headerless (little endian) linear PCM)과 전사파일(포맷: EUC-KR)로 구성- [그림 1] 데이터처리, [그림 2] 자유 발화 녹음 장면
발화단위는 long pause 단위로, 1개 발화에는 복수 개의 문장으로 구성됨- [그림 3] 음성 검사 프로그램
구축DB의 크기는 총 123GB이며, 41개의 폴더에 3GB씩 음성/전사 파일을 할당함

한국어음성 데이터 분석 이미지 예시

<한국어음성 데이터 분석 이미지 예시>

데이터 활용 예

데이터 관련 문의처
담당자명	전화번호	이메일
김상훈(한국전자통신연구원)	042-860-5141	ksh@etri.re.kr

보건의료 데이터 개방 안내

보건의료 데이터는 온라인 및 오프라인 안심존을 통해 개방됩니다.

인터넷과 물리적으로 분리된 온라인·오프라인 공간으로 의료 데이터를 포함하여 보안 조치가 요구되는 데이터를 다운로드 없이 접근하고 분석 가능
* 온라인 안심존 : 보안이 보장된 온라인 네트워크를 통해 집, 연구실, 사무실 등 어디서나 접속하여 데이터에 접근하고 분석
* 오프라인 안심존 : 추가적인 보안이 필요한 데이터를 대상으로 지정된 물리적 공간에서만 접속하여 데이터에 접근하고 분석
1. AI 허브 접속
  신청자
2. 안심존
  사용신청신청자신청서류 제출*
3. 심사구축기관
4. 승인구축기관
5. 데이터 분석 활용신청자
6. 분석모델반출신청자
1. 기관생명윤리위원회(IRB) 심의 결과 통지서 [IRB 알아보기] [공용IRB 심의신청 가이드라인]
2. 기관생명윤리위원회(IRB) 승인된 연구계획서
3. 신청자 소속 증빙 서류 (재직증명서, 재학증명서, 근로계약서 등 택1)
4. 안심존 이용 신청서 [다운로드]
5. 보안서약서 [다운로드]
※ 상기 신청서 및 첨부 서류를 완비한 후 신청을 진행하셔야 정상적으로 절차가 이루어집니다.
신청 및 이용관련 문의는 safezone1@aihub.kr 또는 02-525-7708, 7709로 문의