명령어 음성(일반남녀) 소개
기본탭
데이터셋명 | 명령어 음성(일반남녀) | |||
---|---|---|---|---|
데이터 분야 | 음성/자연어 | 데이터 유형 | 텍스트, 오디오 | |
구축기관 | 비디 | 데이터 관련 문의처 | 담당자명 | 황유라(비디) |
가공기관 | 미디어젠, 메트릭스리서치, 셀렉트스타 | 전화번호 | 02-2025-4999 | |
검수기관 | 미디어젠, 메트릭스리서치, 셀렉트스타, 세종대학교 | 이메일 | yura@bluedigm.com | |
구축 데이터량 | 576만 | 구축년도 | 2020년 | |
버전 | 1.2 | 최종수정일자 | 2021.10.22 | |
소개 | 한국인 일반남녀 명령어를 문자로 바꾸어 주는 AI기술을 위한 음성 데이터 | |||
주요 키워드 | 명령어 AI 데이터, AI 비서, AI 로봇, AI 키오스크, 음성데이터, 전사데이터, 일반인 | |||
저작권 및 이용정책 | 본 데이터는 과학기술정보통신부가 주관하고 한국지능정보사회진흥원이 지원하는 '인공지능 학습용 데이터 구축사업'으로 구축된 데이터입니다. [데이터 이용정책 상세보기] | |||
데이터설명서 | 자료보기 | 구축활용가이드 | 자료보기 | |
샘플데이터 | 다운로드 | 교육활용동영상 | 영상보기 | |
저작도구 | 다운로드 | AI모델 | 다운로드 |
※ 본 데이터에 포함된 이름, 주소, 전화번호, 상황 등은 모두 창작된 것으로 실제와 어떠한 관련이 없음을 알려드립니다.
데이터 변경이력
버전 | 일자 | 변경내용 | 비고 |
---|---|---|---|
1.2 | 2021.10.22 | 데이터 추가 개방 | |
1.1 | 2021.09.08 | 데이터 품질 보완 및 추가 개방 | |
1.0 | 2021.06.30 | 데이터 최초 개방 |
구축 목적
- 한국인 일반남여의 음성 명령어를 문자로 바꾸어 주고, 문맥을 이해하는 한국어 음성언어처리 기술 개발을 위한 일반인 명령어 기반 AI 학습용 한국어 음성 DB를 구축함으로써, 국내 음성인식 인공지능 기술을 발전시키고 서비스를 제공하고자 함
활용 분야
- 음성 서비스를 제공하고자 하는 기업과 기관 및 개인
소개

-
AI 음성 서비스를 위한 음성 데이터를 다양한 환경에서 수집하여 생활 곳곳에서 음성 서비스를 가능하게 함.
-
일반인을 대상으로 구축한 데이터는 AI 음성비서, AI 로봇, 음성인식 키오스크 등에 활용될 수 있음.
구축 내용 및 제공 데이터량
- 데이터 구축 프로세스
- 데이터 설계, 수집, 가공, 검수 및 AI 모델링 수행 - 데이터 구축 규모
- 음성 4,000시간 데이터 구축
대표도면
- 음성 데이터 수집 도구
- 스마트폰, 태블릿, PC 등 다양한 환경에서 크라우드 워커들의 데이터 수집 수행, 문장 단위 데이터 가공의 자동화로 효율적 수집 가능 - 파일명 구조
- 파일명으로 데이터 카테고리, 화자정보, 환경정보 등을 쉽게 구분 - 데이터 검수 도구
- 3단계의 강도 높은 검수를 통해 데이터 품질 확보 - 어노테이션 구조
필요성
- 국내 음성인식 기술의 빠른 발전을 가져올 수 있을 것임. 그동안 음성인식 분야는 선진국에 뒤처져 있었던 것이 사실. 글로벌 기업들은 인공지능 성능을 높이는 데 필수적인 데이터의 확보량이 차이가 났음. 이번 프로젝트로 해외와 국내의 음성인식 기술 격차가 상당히 줄어들 수 있을 것으로 생각됨.
- 해외 엔진 대비 국내 엔진의 경쟁력을 높여줄 수 있을 것임. 인공지능 기술이 선진국이 더 발달한 것이 사실이지만, 데이터에 의존하는 성격이 있는 인공지능 기술은 한글 데이터가 많을수록 국내에서는 경쟁력을 더 발휘할 수 있음. 국내에서 음성과 한글 문장이 더 쌓일수록 성능이 더 높아지기 때문임. 이런 관점에서 국내 엔진의 경쟁력을 높여줄 수 있음.
- 인공지능 기술 중에서도 음성인식 분야가 기술 축적이 오랫동안 이뤄졌으면서도 발전이 급격하지는 않았음. 그것은 음성 서비스는 한 두 번 오인식되면 서비스 사용을 중지하는 사람들이 많기 때문임. 본 사업으로 국내 음성인식 인식률이 높아지면 산업의 성장이 급격히 이뤄질 것으로 보임.
데이터 구조
- 데이터 구성
(1) Wave 파일 : 48kHz(44kHz), 16bit, mono
(2) Json 파일 : Json 포맷 어노테이션 정보 - 데이터 분포
- 일반인용 AI 비서 데이터 분포 (대본 기준)일반인용 AI 비서 데이터 분포 표 IOT 모드
변환ON/
OFF반복
일상귀가 기상 외출 취침 엔터
테인
먼트스트
리밍
서비
스오디
오북정보
검색교통
정보금융
뉴스날씨 스포
츠
정보총계 240 93 147 746 121 369 167 89 529 235 294 1485 435 381 538 131 3000 일반인용 AI 로봇 데이터 분포 표1 의료 병원
시설
정보공항 대중
교통/
숙박
정보비행
정보시설
정보주차
정산직원
호출마트 가격
비교상품
위치
및
정보운영
시간
확인주차
정산직원
호출할인
정보
확인2 2 93 28 31 18 4 12 138 34 43 15 13 7 26 일반인용 AI 비서 데이터 분포 표2 숙박 숙박
시설
정보숙박
예약숙박
체크
인/
아웃주변
관광
정보주차
정산직원
호출식당
/카
페음식
주문
/계
산직원
호출의료 병원
시설
정보시설
정보의료
진
호출주차
정산진료
시간
예약진료
시간
조회총합계 1452 242 424 162 367 164 93 55 51 4 1260 394 10 268 156 323 109 3000 일반인용 AI 키오스크 데이터 분포 표 도서관 도서
검색/
대출시설
정보좌석
정보/
예약영화
관매점
이용시설
안내영화
예매주차
등록지하철 목적지
검색배차
시간승차
권시설
안내직원
호출총합계 1319 611 475 233 1481 169 618 291 403 200 59 24 42 42 33 3000 - 어노테이션 포맷
어노테이션 포맷 대분류 속성 표기 의미 타입 필수여부 기본 정보
(DB_Info)Language 언어 String Version 버전 String ApplicationCategory 응용 분야 String NumberOfSpeaker 발성화자 수 String NumberOfUtterance 발화 수 String DataCategory DB종류 String RecordingDate 녹음날짜 String FillingDate 수정날짜 String RevisionHistory 수정기록 String Distributer 수행기관 String 음성 정보
(Wave_Info)SamplingRate 주파수 String NumberOfBit 비트 수 String ByteOrder 바이트정보 String EncodingLaw 인코딩방식 String NumberOfChannel 채널 수 String SignalToNoiseRatio SNR String 전사 정보
(Label_Info)LabelText 텍스트 전사 String Y 화자 정보
(Speaker Info)SpeakerName 화자 이름 String Y Gender 성별 String Y Age 나이 String Y Region 지역 String Y Dialect 방언 String Y 환경 정보
(Environment_Info)RecordingEnviron 녹음 환경 String Y NoiseEnviron 노이즈 환경 String Y RecordingDevices 녹음 장치 String Y 파일 정보
(File_Info)FileCategory 파일 종류 String FileName 파일 이름 String DirectoryPath 파일 위치 String HeaderSize 헤더 크기 String FileLength 파일 길이 String Y FileFormat 파일 포맷 String NumberOfRepeat 반복 차수 String TimeInterval 녹음 주기 String Y Distance 녹음 거리 String 기타 정보
(Miscellaneous_Info)QualityStatus 품질 상태 String - Json 포맷 샘플
데이터셋 구축 담당자
수행기관(주관) : 비디
책임자명 | 전화번호 | 대표이메일 | 담당업무 |
---|---|---|---|
황유라 | 02-2025-4999 | yura@bluedigm.com | · 데이터 구축 총괄 · 응용 서비스 개발 |
수행기관(참여)
기관명 | 담당업무 | 기관명 | 담당업무 |
---|---|---|---|
미디어젠㈜ | · 데이터 검수 · AI 모델링 |
메트릭스리서치 | · 크라우드소싱 · 결과물 정제 및 검수 |
셀렉트스타 | · 비정형 데이터 정제 · 비정형 데이터 검수 |
세종대학교 | · 데이터 검증 및 연구활동 |