교통사고 영상 데이터
- 분야교통물류
- 유형 비디오 , 이미지
-
데이터 변경이력
데이터 변경이력 버전 일자 변경내용 비고 1.2 2024-01-02 원천데이터 및 라벨링데이터 수정 1.1 2023-02-10 원천데이터 및 라벨링데이터 수정 1.0 2022-07-29 데이터 최초 개방 데이터 히스토리
데이터 히스토리 일자 변경내용 비고 2024-07-29 AI 모델 및 AI 모델 설명서 수정 2023-06-12 AI 모델 및 AI 모델 설명서 수정 2022-10-21 신규 샘플데이터 개방 2022-10-06 교육동영상 개방 2022-07-29 콘텐츠 최초 등록 소개
교통사고 영상 데이터를 구축함으로써 교통사고 과실/평가 등의 구축 데이터를 이용한 인공지능 알고리즘 개발과 ICT 분야 법원, 경찰청, 보험사에서 사용하는 교통사고 과실 비율 측정/평가 프로그램 등의 공기관 및 기업에서 이용되고 있는 각종 서비스 및 기기 등의 개발 등을 위한 인공지능 알고리즘 개발 등에 활용하며, 교통사고 과실비율 측정/평가 기준을 인공지능 분석을 통해 과실비율 측정/평가를 위하여 통합 데이터를 구축
구축목적
국내 교통사고에 대한 영상 및 이미지 데이터를 수집하고 인공지능을 활용하여 과시 측정/평가 예측 모델을 구축하여 최적의 측정/평가하는 인공지능 서비스 모델을 개발하고자 데이터 구축
-
메타데이터 구조표 데이터 영역 교통물류 데이터 유형 비디오 , 이미지 데이터 형식 png, mp4 데이터 출처 png, mp4 라벨링 유형 바운딩 박스(이미지) 라벨링 형식 JSON 데이터 활용 서비스 분석모델 응용 서비스, 분석 모델 응용 서비스의 사업화, 분석모델 부가가치 창출 데이터 구축년도/
데이터 구축량2021년/영상 21,895 건, 이미지 3,284,250 장 -
1. 데이터 통계
- 데이터 구축 규모
1. 데이터 통계 데이터 종류 데이터 형태 원천 데이터 규모 어노테이션 규모 영상 영상 21,895 건 21,895 건 이미지 이미지 3,284,250 장 3,284,250 장
2. 데이터 분포
- 영상 분포
2. 데이터 분포 사고대상 사고장소 영상(건) 비율 차대차 직선 도로 9,089 42% 사거리교차로(신호등 없음) 1,534 7% 사거리교차로(신호등 있음) 2,594 12% 고속도로(자동차 전용도로)포함 1,593 7% T자형 교차로 1,315 6% 차도와 차도가 아닌 장소 291 1% 주차장(또는 차도가 아닌 장소) 772 4% 회전교차로 330 2% 차대보행자 횡단보도(신호등 없음) 78 0.36% 횡단보도(신호등 있음) 183 1% 횡단보도(신호등 없음) 부근 72 0.33% 횡단보도(신호등 있음) 부근 122 1% 횡단보도 없음 471 2% 육교 및 지하도 부근 7 0.03% 차대자전거 사거리 교차로(신호등 있음) 105 0.48% 사거리 교차로(신호등 없음) 193 1% 자전거 도로 7 0.03% 직선 도로 741 3% 차대이륜차 직선 도로 1,207 6% 사거리교차로(신호등 없음) 280 1% 사거리교차로(신호등 있음) 560 3% 회전교차로 3 0.01% T자형 교차로 200 1% 차도와 차도가 아닌 장소 148 1% 합계 21,895 100% - 이미지 분포(Bbox)
이미지 분포(Bbox) 사고대상 사고장소 이미지(장) 비율 차대차 직선 도로 1,363,350 42% 사거리교차로(신호등 없음) 230,100 7% 사거리교차로(신호등 있음) 389,100 12% 고속도로(자동차 전용도로)포함 238,950 7% T자형 교차로 197,250 6% 차도와 차도가 아닌 장소 43,650 1% 주차장(또는 차도가 아닌 장소) 115,800 4% 회전교차로 49,500 2% 차대보행자 횡단보도(신호등 없음) 11,700 0.36% 횡단보도(신호등 있음) 27,450 1% 횡단보도(신호등 없음) 부근 10,800 0.33% 횡단보도(신호등 있음) 부근 18,300 1% 횡단보도 없음 70,650 2% 육교 및 지하도 부근 1,050 0.03% 차대자전거 사거리 교차로(신호등 있음) 15,750 0.48% 사거리 교차로(신호등 없음) 28,950 1% 자전거 도로 1,050 0.03% 직선 도로 111,150 3% 차대이륜차 직선 도로 181,050 6% 사거리교차로(신호등 없음) 42,000 1% 사거리교차로(신호등 있음) 84,000 3% 회전교차로 450 0.01% T자형 교차로 30,000 1% 차도와 차도가 아닌 장소 22,200 1% 합계 3,284,250 100%
- 데이터 구축 규모
-
-
AI 모델 상세 설명서 다운로드
AI 모델 상세 설명서 다운로드 AI 모델 다운로드1. 활용 모델
- 모델 학습
- 영상에서의 인스턴스 9종(차량, 보행자, 이륜차, 자전거, 표지판, 신호등(적색), 신호등(녹색), 신호등(기타), 횡단보도) 검출을 위한 'DetectoRS' 학습 알고리즘 사용
- 과실비율산정 인자 분류를 위한 4개의 직렬 연결 'VTN' 학습 알고리즘 사용
1. 활용 모델 학습(Train) 검증(Validation) 시험(Test) 개요 -detectoRS, VTN등 모델에 vision 기반 학습 -detectoRS, VTN등 모델에 vision 기반 학습 -detectoRS, VTN등 모델에 vision 기반 학습 - 대규모 학습용 이미지 사용 - 대규모 학습용 이미지 사용 - 대규모 학습용 이미지 사용 비율 80% 10% 10% 학습 알고리즘 구조 학습 알고리즘 구조 DetectoRS Video Transformer Network (VTN) 2. 서비스 활용 시나리오
- 교통사고 과실비율 측정/평가 시스템(교통사고 AI 과실 측정/평가 시스템이 사용되면 수리비 청구 기간이 4일에서 1일로 단축될 수 있을 것으로 판단)
- 소액보상 손해사정시간이 절감 가능하며, 전체 차량수리에 교통사고 AI 과실 측정/평가 시스템 사용 가능
- 과실비율 측정 소프트웨어 개발과 더 나아가 과실비, 보험금, 차량 수리비까지 알 수 있는 AI응용서비스 개발
- 본 사업 기간 이후, 주관기관 ㈜티맥스티베로의 컨소시엄이 한국교통안전공단을 통하여 대국민 서비스(T-safer)에 활용할 수 있도록 응용서비스 구축
- 모델 학습
-
데이터 성능 점수
측정값 (%)기준값 (%)데이터 성능 지표
데이터 성능 지표 번호 측정항목 AI TASK 학습모델 지표명 기준값 점수 측정값 점수 1 과실비율 상황 영상 분류 Image Classification VTN F1-Score 0.7 점 0.7591 점 2 바운딩박스 객체 인식 Object Detection DetectoRS mAP 70 % 83.4 %
※ 데이터 성능 지표가 여러 개일 경우 각 항목을 클릭하면 해당 지표의 값이 그래프에 표기됩니다.
※ AI모델 평가 지표에 따라 측정값의 범위, 판단 기준이 달라질 수 있습니다. (ex. 오류율의 경우, 낮을수록 좋은 성능을 내는 것으로 평가됩니다)
-
설명서 및 활용가이드 다운로드
데이터 설명서 다운로드 구축활용가이드 다운로드1. 데이터 포맷
- 원천데이터 포맷 예시(영상 데이터)
1. 데이터 포맷 제목 사고 영상 영상 파일 포맷 MP4 카테고리 교통사고 전처리 전(영상 기준) 전처리 후(10초 영상) Json 형식(영상 데이터) - 원천데이터 포맷 예시(이미지 데이터)
원천데이터 포맷 예시(이미지 데이터) 제목 사고 영상 이미지 영상 파일 포맷 MP4 PNG 교통사고 전처리 전(영상 기준) 전처리 후(이미지 추출) Json 형식(이미지 데이터)
2. 어노테이션 포맷
- 영상 데이터
2. 어노테이션 포맷 구분 항목명 타입 필수여부 설명 범위 비고 1 info object 데이터셋 정보 1-1 name string Y 데이터셋 명 [accident] 1-2 description string 데이터셋 상세설명 1-3 url string 데이터셋 URL 2 video object 영상 정보 2-1 video_name string Y 비디오 명 2-2 video_date string Y 비디오 날짜 yymmdd 2-3 filming_way string Y 촬영 방법 [cc, bb] cc : cctv bb : blackbox 2-4 video_point_of_view number Y 영상 시점 [1, 3] 1인칭: 1 3인칭: 3 2-5 accidental_negligence_rateA number Y 과실 비율 [0, 10, 20, 30, 40, 50, 60, 70, 80, 90, 100] isObjectA에 대한 과비율 측정 2-6 accidental_negligence_rateB number Y 과실 비율 [0, 10, 20, 30, 40, 50, 60, 70, 80, 90, 100] isObjectB에 대한 과비율 측정 2-7 accident_type number Y 사고 유형 [0 ~ 433] [별첨 ②] 2-8 accident_object number Y 사고 대상 종류 [0 ~ 3] [별첨 ②] 2-9 accident_place number Y 사고 장소 유형 [0 ~ 14] [별첨 ②] 2-10 accident_place_feature number Y 사고 장소 특징 [0 ~ 60] [별첨 ②] 2-11 vehicle_a_progress_info number Y 사고객체A [0 ~ 179] [별첨 ②] 진행 정보 2-12 vehicle_b_progress_info number Y 사고객체B [0 ~ 173] [별첨 ②] 진행 정보 1인칭의 경우, 본인을 사고객체B로 간주 2-13 damage_location string 파손 위치 2-14 related_laws string 관련 법규 2-15 violation_of_law string 법규 위반 2-16 additional_elements string 가감 요소 2-17 violation_factor string 위반 요소 2-18 weather string 날씨 [맑음, 비, 눈, 흐림, 안개] - 이미지 데이터
이미지 데이터 구분 항목명 타입 필수여부 설명 범위 비고 1 file_name string Y 이미지 파일명 2 width number Y 이미지 너비 [0 ~ 3840] 3 height number Y 이미지 높이 [0 ~ 2160] 4 video_file_name string Y 비디오 파일명 이미지가 추출된 비디오 파일명 5 sequence_frame_number number Y 추출된 이미지들 내의 프레임번호 [0 ~ 150] 1초당 15프레임으로 샘플링시, 10초간 최대 150프레임 추출 6 objects array 바운딩 박스 집합 6-1 object object 바운딩 박스 정보 6-1-1 bbox array Y 바운딩 박스의 위치 및 크기 [좌상단 x좌표, 좌상단 y좌표, 너비, 높이] 6-1-2 category string Y 각 bbox의 클래스이름 [별첨 ①] 6-1-3 isObjectA boolean 각 bbox의 사고객체A 여부 [ture,false] 6-1-4 isObjectB boolean 각 bbox의 사고객체B 여부 [ture,false] 6-1-5 isOtherObjects boolean Y 각 bbox의 사고관련 객체여부 [ture,false]
3. 실제예시
- 영상 데이터
- 이미지 데이터
- 원천데이터 포맷 예시(영상 데이터)
-
데이터셋 구축 담당자
수행기관(주관) : ㈜티맥스티베로
수행기관(주관) 책임자명 전화번호 대표이메일 담당업무 박윤수 031-8018-9398 yoonsu_park@tmax.co.kr · 과제 총괄관리 · 데이터 수집 · 데이터 정제 · 데이터 가공 · 데이터 학습 및 검증 수행기관(참여)
수행기관(참여) 기관명 담당업무 ㈜올림커뮤니케이션즈 · 정제, 가공, 검수 크라우드 워커 교육 ㈜보배네트워크 · 영상 데이터 수집 법무법인 도담 · 과실비율 분석 및 산정 한국교통안전공단 · 영상 데이터 수집
· 학습엔진 및 응용서비스 개발데이터 관련 문의처
데이터 관련 문의처 담당자명 전화번호 이메일 박윤수 031-8018-9398 yoonsu_park@tmax.co.kr
-
인터넷과 물리적으로 분리된 온라인·오프라인 공간으로 의료 데이터를 포함하여 보안 조치가 요구되는 데이터를 다운로드 없이 접근하고 분석 가능
* 온라인 안심존 : 보안이 보장된 온라인 네트워크를 통해 집, 연구실, 사무실 등 어디서나 접속하여 데이터에 접근하고 분석
* 오프라인 안심존 : 추가적인 보안이 필요한 데이터를 대상으로 지정된 물리적 공간에서만 접속하여 데이터에 접근하고 분석 -
- AI 허브 접속
신청자 - 안심존
사용신청신청자신청서류 제출* - 심사구축기관
- 승인구축기관
- 데이터 분석 활용신청자
- 분석모델반출신청자
- AI 허브 접속
-
1. 기관생명윤리위원회(IRB) 심의 결과 통지서 [IRB 알아보기] [공용IRB 심의신청 가이드라인]
2. 기관생명윤리위원회(IRB) 승인된 연구계획서
3. 신청자 소속 증빙 서류 (재직증명서, 재학증명서, 근로계약서 등 택1)
4. 안심존 이용 신청서 [다운로드]
5. 보안서약서 [다운로드]
※ 상기 신청서 및 첨부 서류를 완비한 후 신청을 진행하셔야 정상적으로 절차가 이루어집니다. -
신청 및 이용관련 문의는 safezone1@aihub.kr 또는 02-525-7708, 7709로 문의
데이터셋 다운로드 승인이 완료 된 후 API 다운로드 서비스를 이용하실 수 있습니다.
API 다운로드 파일은 분할 압축되어 다운로드 됩니다. 분할 압축 해제를 위해서는 분할 압축 파일들의 병합이 필요하며 리눅스 명령어 사용이 필요합니다.
리눅스 OS 계열에서 다운로드 받으시길 권장하며 윈도우에서 파일 다운로드 시 wsl(리눅스용 윈도우 하위 시스템) 설치가 필요합니다.
※ 파일 병합 리눅스 명령어
find "폴더경로" -name "파일명.zip.part*" -print0 | sort -zt'.' -k2V | xargs -0 cat > "파일명.zip"
- 해당 명령어 실행 시, 실행 경로 위치에 병합 압축 파일이 생성됩니다.
- 병합된 파일 용량이 0일 경우, 제대로 병합이 되지 않은 상태이니 "폴더경로"가 제대로 입력되었는지 확인 부탁드립니다.
※ 데이터셋 소개 페이지에서 다운로드 버튼 클릭하여 승인이 필요합니다.