콘텐츠로 건너뛰기 메뉴로 건너뛰기 푸터로 건너뛰기
데이터를 불러오고 있습니다
데이터를 저장하고 있습니다
#AI # 인공지능 # 소리 # 비언어 # 학습데이터

자연 및 인공적 발생 非언어적 소리 데이터

자연 및 인공적 발생 비언어적 소리 데이터
  • 분야재난안전환경
  • 유형 오디오
구축년도 : 2021 갱신년월 : 2022-07 조회수 : 5,826 다운로드 : 365 용량 :
샘플 데이터 ?

샘플데이터는 데이터의 이해를 돕기 위해 별도로 가공하여 제공하는 정보로써 원본 데이터와 차이가 있을 수 있으며,
데이터에 따라서 민감한 정보는 일부 마스킹(*) 처리가 되어 있을 수 있습니다.

※ 내국인만 데이터 신청이 가능합니다.

  • 데이터 변경이력

    데이터 변경이력
    버전 일자 변경내용 비고
    1.0 2022-07-28 데이터 최초 개방

    데이터 히스토리

    데이터 히스토리
    일자 변경내용 비고
    2022-10-20 신규 샘플데이터 개방
    2022-07-28 콘텐츠 최초 등록

    소개

    – 자연적, 인공적으로 발생하는 각종 비언어적인 소리 데이터
    – 대분류 10개, 중분류 28개, 소분류125개의 데이터셋 구축

    구축목적

    현실에 적용될 수 있는 인공 청각지능 발달에 필요한 데이터를 다양한 환경적 요인을 고려한 형태로 구축하는 것을 목적으로 함
  • 데이터 통계

    • 데이터 구축 규모
      데이터 통계
      데이터 종류 데이터 형태 구축량
      원천데이터 Mp3 44,810 Clip
      라벨링 데이터 Json 44,810 Json
    • 데이터 분포
      • 데이터 분포
        • 대분류별 분포 : 자연, 무기, 사람, 동물, 알람, 물체, 악기, 군부대 운송수단, 생활, 기계 및 공구
        • 항목별 분포 : 수집방법, 계절, 날씨, 시간대, 취득장소 구분, 객체와의 거리 구분
      • 대분류별 분포
        * 단위 : Clip
        구분 구축량 비율
        자연                     3,552 8%
        무기                     4,755 11%
        사람                     3,341 7%
        동물                     3,893 9%
        알람                     1,259 3%
        물체                   10,801 24%
        악기                     3,928 9%
        군부대 운송수단                     3,743 8%
        생활                     5,253 12%
        기계 및 공구                     4,285 10%
        합계                   44,810 100%
        대분류별 분포
         
      • 항목별 분포
        – 수집 방법
        * 단위 : Clip
        구분 구축량 비율
        직접 수집                   16,755 37%
        크라우드 워커                   24,533 55%
        라이센스 구매                     3,522 8%
        합계                   44,810 100%
        항목별 분포-수집방법

        – 계절
        * 단위 : Clip
        구분 구축량 비율
                                 9 0%
        여름                     3,171 7%
        가을                   39,395 88%
        겨울                     2,235 5%
        합계                   44,810 100%
        항목별 분포-계절

        – 날씨
        * 단위 : Clip
        구분 구축량 비율
        맑음                   21,191 47%
                            4,688 10%
        흐림                   18,931 42%
                                  - 0%
        합계                   44,810 100%
        항목별 분포 날씨

        – 시간대
        * 단위 : Clip
        구분 구축량 비율
        주간                   32,321 72%
        야간                   12,489 28%
        합계                   44,810 100%
        항목별 분포 시간대

        – 취득장소 구분
        * 단위 : Clip
        구분 구축량 비율
        실내                   22,297 50%
        실외                   22,513 50%
        합계                   44,810 100%
        항목별 분포 취득장소 구분

        – 객체와의 거리 구분
        * 단위 : Clip
        구분 구축량 비율
        인접(10m)                   20,563 46%
        근거리(50m)                   13,308 30%
        원거리(100m)                   10,939 24%
        합계                   44,810 100%
        항목별 분포-객체와의 거리 구분
  • 저작도구 설명서 및 저작도구 다운로드

    저작도구 설명서 다운로드 저작도구 다운로드
  • AI 모델 상세 설명서 다운로드

    AI 모델 상세 설명서 다운로드 AI 모델 다운로드

    모델학습

     

    모델학습 이미지-1

    모델학습 이미지-2

     

    서비스 활용 시나리오

    서비스 활용 시나리오

     

  • 데이터 성능 점수

    측정값 (%)
    기준값 (%)

    데이터 성능 지표

    데이터 성능 지표
    번호 측정항목 AI TASK 학습모델 지표명 기준값 점수 측정값 점수
    1 소리 분류 모델 Audio Classification ResNet F1-Score 0.65 0.6642

    ※ 데이터 성능 지표가 여러 개일 경우 각 항목을 클릭하면 해당 지표의 값이 그래프에 표기됩니다.

    ※ AI모델 평가 지표에 따라 측정값의 범위, 판단 기준이 달라질 수 있습니다. (ex. 오류율의 경우, 낮을수록 좋은 성능을 내는 것으로 평가됩니다)

  • 설명서 및 활용가이드 다운로드

    데이터 설명서 다운로드 구축활용가이드 다운로드

    데이터 포맷

    데이터 포맷 예시

     

    데이터 구성 

    데이터 포맷
    순위 대분류 중분류 소분류 예시
    1 자연 기상 비소리(흙길, 숲, 도로, 나무데크, 지붕, 양철지붕, 비닐하우스, 나무 등과 같이 다양한 객체에 부딪히며 내는 소리)
    2 천둥 천둥소리
    3 우박 우박(흙, 숲, 도로, 지붕, 나무 등 객체에 부딪히는 소리)
    4 현상 물흐르는 소리  물소리(계곡, 하천, 급류, 강(상중하), 수로), 샘물, 강수량에 따라 물 흐르는 졸졸졸 소리 위주
    5 폭포 폭포소리
    6 파도 파도소리(백사장, 뻘, 몽돌, 바위, 방파제, 풍천 등에 부딪히는 소리)
    7 바람 강바람, 산바람, 바다바람, 숲속바람, 계곡, 도시바람 
    8 장작, 대나무 타는 소리(타닥, 탁, 피~식과 같이 나무가 타면서 내는 소리)
    9 균열 얼음 갈라지는 소리
    10 무기 공기총 공기소총, 공기권총
    11 개인화기 권총, 소총
    12 수렵, 경기용 엽총(산탄총), 클레이 사격
    13 비행 포의 비행소리
    14 야포 무반동총, 각종 야포의 사격소리
    15 폭발 포의 폭발소리
    16 사람 생리현상 기침 기침 소리
    17 트림 트림 소리
    18 방귀 방귀 소리
    19 재채기 재채기 소리
    20 코고는소리 코고는 소리
    21 하품 하품 소리
    22 헛기침 헛기침 소리(어흠과 같은 인위적인 헛기침)
    23 헐떡이는소리 뛰거나 숨을 멈춘 후의 숨을 헐떡이는 소리 
    24 신체를 이용한 인위적소리 박수 박수소리, 하이파이브 소리
    25 손가락튕기는소리 손가락 튕기는 소리
    26 휘파람 휘파람 소리
    27 감정 웃음 사람의 웃음소리
    28 울음 사람의 우는소리
    29 비명 사람의 비명, 놀라는 소리
    30 이동감지 실외에서 걸으면서 이동하는 소리 실외에서 걸으면서 이동하는 소리 (다가오는 소리, 멀어지는 소리)
    31 밟는소리 밟는소리(캔, 깨진병, 나뭇가지, 낙엽, 얼음)
    32 실외에서 뛰면서 이동하는 소리 실외에서 뛰면서 이동하는 소리 (다가오는 소리, 멀어지는 소리)
    33 동물 가축 돼지 돼지의 울음소리(싸우는 소리, 울음소리) 
    34 닭울음소리 
    35 소의 울음소리
    36 염소 염소의 울음소리
    37 오리 오리의 울음소리
    38 야생 동물 고라니 고라니 소리
    39 까마귀 까마귀 울음소리
    40 양서류 개구리, 맹꽁이, 두꺼비, 황소개구리,청개구리 등의 우는 소리
    41 곤충류 매미,귀뚜라미, 풀벌레 등의 우는소리
    42 멧돼지 멧돼지 소리(싸우는 소리, 울음소리) 
    43 까치  까치 울음소리
    44 산비둘기 비둘기 소리
    45 소쩍새 올빼미목의 소리
    46 참새 참새목의 소리
    47 알람 경보 응급경보 렉카차 싸이렌 소리
    48 도난경보 도난경보 소리, 침입감지 경보 소리, 비상상황 알람음
    49 화재경보 화재경보 소리(화재경보 경종, 독립형 화재경보소리)
    50 비상경보 공습경보, 비상경보, 민방위훈련 경보
    51 종소리 종소리 절 또는 교회종소리
    52 자전거 자전거 벨 소리
    53 풍경소리 풍경소리
    54 목탁소리 목탁소리
    55 물체 구겨짐 비닐 비닐류가 구겨지는 소리
    56 종이 종이류가 구겨지는 소리
    57 깨짐 부러짐 유리 유리류가 깨지는 소리
    58 나무 나무가 부러지는 소리
    59 부딪힘 나무 나무가 나무와 부딪히는 소리
    60 유리 유리가 유리와 부딪히는 소리
    61 금속 금속이 금속과 부딪히는 소리
    62 플라스틱 플라스틱이 플라스틱과 부딪히는 소리
    63 돌이 돌과 부딪히는 소리
    64 찌그러짐 플라스틱 플라스틱이 찌그러지는 소리
    65 캔 종류가 찌그러지는 소리
    66 찢어짐 천이 찢어지는 소리
    67 종이 종이가 찢어지는 소리
    68 악기 현악기 첼로 첼로 소리
    69 가야금 가야금 소리
    70 어쿠스틱 기타 어쿠스틱 기타 조율 및 연주 소리
    71 우크렐레 우크렐레 소리
    72 타악기 꽹가리 꽹가리 소리
    73 소고 소고 소리
    74 징 소리
    75 탬버린 탬버린 소리
    76 트라이앵글 트라이앵글 연주소리
    77 드럼 드럼 소리
    78 실로폰 실로폰 연주소리
    79 작은복 작은북 소리
    80 장구 장구소리
    81 큰북 큰북 소리
    82 관악기 플루트 플루트 소리
    83 단소 단소
    84 오르간 오르간 소리
    85 하모니카 하모니카
    86 일렉트릭 베이스 베이스 기타 소리
    87 일렉기타 일렉 기타소리
    88 군부대운송
    수단
    엔진
    (정지상황)
    군용차량 버스, 전투차량, 무장견인차, 유압크레인, 제설차, 살수차, 트레일러, 포크레인, 청소차 엔진소리
    89 장갑차 장갑차의 엔진소리
    90 전차 전차의 엔진소리
    91 헬기 헬기의 엔진소리
    92 기동
    (운행상황)
    군용차량 버스, 전투차량, 무장견인차, 유압크레인, 제설차, 살수차, 트레일러, 포크레인, 청소차 엔진소리
    93 장갑차 장갑차의 엔진소리
    94 전차 전차의 엔진소리
    95 헬기 헬기의 엔진소리
    96 생활 요리 가스불소리 가스불 소리, 토치불소리, 가스레인지 점화/점화불량 소리, 가스불 소리, 휴대용 가스버너 점화/점화불량 소리
    97 끓는소리 끓이는 소리
    98 빻는소리 절구, 플라스틱 도구로 마늘, 생강, 참깨 등의 재료를 빻는 소리
    99 설거지 소리 설거지 소리
    100 가전 가열류 에어프라이어, 전자레인지, 오븐의 작동 소리
    101 팬류 후드, 환풍기, 공기청정기, 헤어드라이기, 선풍기
    102 모터류 믹서기 소리, 커피머신 소리
    103 타이핑 키보드 타이핑 소리
    104 재봉틀 재봉틀로 바느질 하는 소리
    105 팩스 팩스 수신 발신 소리
    106 프린팅 인쇄 및 복사기 소리
    107 활동 공차는소리 축구(족구)(관중소리 최대한 배제)
    108 공치는소리 탁구, 테니스, 베드민턴, 야구, 골프, 당구(관중소리 최대한 배제)
    109 공튕기는소리 농구, 배구(관중소리 최대한 배제)
    110 가구 여닫는 소리 장롱, 서랍 등 가구 여닫는 소리
    111 문여닫는 소리 현관문, 방문 여닫는 소리
    112 물 따르는 소리 물따르는 소리(졸졸졸 소리)
    113 물내리는소리 변기, 씽크대에서 물내리는 소리
    114 기계 및 공구 전동기계 및 전동공구 공작기계류 선반기계, 그라인딩기계, 밀링기계, 샌당기계, 사상기계
    115 농기계류 로터리 소리, 이앙기, 탈곡기, 분쇄기, 콤바인 동작소리
    116 방앗간기계 도정기, 메주나 고추빻는 소리, 기름짜는 소리
    117 렌치류 에어렌치
    118 밴딩머신 커피자판기, 음료자판기, 각종 생활 자판기 작동소리
    119 자르는소리 정육기계(뼈자르는 소리, 고기 자르는 소리), 절단기(금속 자르는 소리), 전기톱(목재 자르는 소리)
    120 펌프 모터펌프
    121 공압기류 타카총, 콘크리트 못박이 총
    122 수동공구 도끼류 도끼류(도끼류로 나무를 쪼개거나 나무, 쇠 및 바위등을 박는소리)
    123 삽류 삽질 소리, 곡갱이, 호미질 소리(흙을 파거나 긁는 소리) 
    124 톱으로 나무자르는 톱질 소리, 쇠자르는 특수 톱으로 쇠자르는 톱질 소리
    125 펀치류 펀치로 구멍 뚫는 소리, 스테플러, 수동 타카 소리

     

    어노테이션 포맷

    No 항목 길이 타입 필수여부
      한글명 영문명      
    1 원시데이터 정보 RawDataInfo   JsonObject Y
      1-1 수집 음원 파일명 RawDataId   String Y
    1-2 저작권 Copyrighter   String Y
    1-3 샘플링 주파수 SampleRate(Hz)   Number Y
    1-4 채널 Channel   Number Y
    1-5 비트 깊이 BitDepth(bit)   Number Y
    1-6 녹음 기기 RecordingDevice   String Y
    1-7 전송 속도 BitRate(kbps)   Number Y
    1-8 수집 방법 CollectionType   String Y
    1-9 수집 일시 RecDateTime   String Y
    1-10 수집 음원 길이 RecDataLength(sec)   Number Y
    1-11 계절 Season   String Y
    1-12 날씨 Weather   String Y
    1-13 시간대 TimeZone   String Y
    1-14 취득 장소 구분 PlaceType   String Y
    1-15 객체와의 거리 구분 DistanceType   String Y
    1-16 음원 확장자 FileExtension   String Y
    2 원천데이터 정보 SourceDataInfo   JsonObject Y
      2-1 정제 음원 파일명 SourceDataId   String Y
    2-2 음원 확장자 FileExtension   String Y
    2-3 녹음파일상 클립 순서 NoOfClip   Number Y
    2-4 정제 음원 길이 ClipDataLength(sec)   Number Y
    3 라벨링데이터 정보 LabelDataInfo   JsonObject Y
      3-1 음원 및 Json 파일위치(폴더명) Path   String Y
    3-2 Json 파일명 LabelID   String Y
    3-3 라벨링 인원 수 NumAnnotator   Number Y
    3-4 대분류ID Division1   String Y
    3-5 중분류ID Division2   String Y
    3-6 소분류ID Class   String Y
    3-7 세부항목 Desc   String Y
    3-8 SoundAnnotation(고정값) Type   String Y
    3-9 라벨링(Segmentation) 개수 NumSegmentation   Number Y
    3-10 라벨링 구간 Segmentations   Array Y
  • 데이터셋 구축 담당자

    수행기관(주관) : ㈜미디어그룹사람과숲
    수행기관(주관)
    책임자명 전화번호 대표이메일 담당업무
    성낙춘 본부장 02-6959-6632 sung_1973@humanf.co.kr · 사업총괄/품질
    수행기관(참여)
    수행기관(참여)
    기관명 담당업무
    ㈜넥스터 · 수집/정제
    ㈜코클 · 가공
    서울대학교 산학협력단 · 알고리즘
    데이터 관련 문의처
    데이터 관련 문의처
    담당자명 전화번호 이메일
    성낙춘 본부장 02-6959-6632 sung_1973@humanf.co.kr
보건의료 데이터 개방 안내

보건의료 데이터는 온라인 및 오프라인 안심존을 통해 개방됩니다.

안심존이란 안심존 이용메뉴얼 안심존 이용신청
  • 인터넷과 물리적으로 분리된 온라인·오프라인 공간으로 의료 데이터를 포함하여 보안 조치가 요구되는 데이터를 다운로드 없이 접근하고 분석 가능
    * 온라인 안심존 : 보안이 보장된 온라인 네트워크를 통해 집, 연구실, 사무실 등 어디서나 접속하여 데이터에 접근하고 분석
    * 오프라인 안심존 : 추가적인 보안이 필요한 데이터를 대상으로 지정된 물리적 공간에서만 접속하여 데이터에 접근하고 분석

    1. AI 허브 접속
      신청자
    2. 안심존
      사용신청
      신청자신청서류 제출*
    3. 심사구축기관
    4. 승인구축기관
    5. 데이터 분석 활용신청자
    6. 분석모델반출신청자
  • 1. 기관생명윤리위원회(IRB) 심의 결과 통지서 [IRB 알아보기]
    2. 기관생명윤리위원회(IRB) 승인된 연구계획서
    3. 신청자 소속 증빙 서류 (재직증명서, 재학증명서, 근로계약서 등 택1)
    4. 안심존 이용 신청서 [다운로드]
    5. 보안서약서 [다운로드]
    ※ 상기 신청서 및 첨부 서류를 완비한 후 신청을 진행하셔야 정상적으로 절차가 이루어집니다.

  • 신청 및 이용관련 문의는 safezone1@aihub.kr 또는 02-525-7708, 7709로 문의

데이터셋 다운로드 승인이 완료 된 후 API 다운로드 서비스를 이용하실 수 있습니다.

API 다운로드 파일은 분할 압축되어 다운로드 됩니다. 분할 압축 해제를 위해서는 분할 압축 파일들의 병합이 필요하며 리눅스 명령어 사용이 필요합니다.

리눅스 OS 계열에서 다운로드 받으시길 권장하며 윈도우에서 파일 다운로드 시 wsl(리눅스용 윈도우 하위 시스템) 설치가 필요합니다.

※ 파일 병합 리눅스 명령어

find "폴더경로" -name "파일명.zip.part*" -print0 | sort -zt'.' -k2V | xargs -0 cat > "파일명.zip"

- 해당 명령어 실행 시, 실행 경로 위치에 병합 압축 파일이 생성됩니다.

- 병합된 파일 용량이 0일 경우, 제대로 병합이 되지 않은 상태이니 "폴더경로"가 제대로 입력되었는지 확인 부탁드립니다.

※ 데이터셋 소개 페이지에서 다운로드 버튼 클릭하여 승인이 필요합니다.