Loading...
상세보기폼
한국어 음성데이터 추가 라벨 정보 가능여부 문의

현재는 음성 PCM 데이터 + script 두가지만 있는것 같습니다.기존에도 질문되었던 부분인것 같습니다만, 비공개로 된 질문이 많아 다시 문의 드립니다.아래와 같은 라벨이 추가되면 훨씬 가치있는 데이터셋이 될것 같습니다.아래 항목에 대해서 라벨 정보가 추가될 여지나 계획이 있는지 문의 드립니다.1. 개인정보가 포함되지 않는선에서 발화자의 Unique ID 부여     (현재는 같은 사람인지, 다른 사람인지 구별이 불가능합니다.)2. Gender정보 (성별 정보)3. Age 정보 (발화자의 대략적인 나이대 정보가 추가되면 좋겠습니다.)
공개여부 공개 진행사항 완료
답변
한국어 음성 데이터 추가 라벨 관련

안녕하세요


AI 허브 공개 데이터에 관심 가져주셔서 감사합니다.


의견 주신 내용 3가지에 대해 구축기관에 문의한 결과 

1번 의견의 경우 음성 합성 기술 등으로 악용될 소지(개인정보가 아니더라도 누군가의 목소리 생성)

2번, 3번의 경우 내부적인 논의를 통해 더 좋은 방향으로 결정할 것이라고 합니다.

(2, 3번도 개인정보 침해 요소가 없는지 등을 검토)


좋은 의견 주셔서 감사드리고, 지속적인 관심 부탁드립니다.

감사합니다.

목록으로