교통문제 해결을 위한 CCTV 교통 영상(고속도로)
- 분야재난안전환경
- 유형 이미지
-
데이터 변경이력
데이터 변경이력 버전 일자 변경내용 비고 1.0 2021-06-30 데이터 최초 개방 데이터 히스토리
데이터 히스토리 일자 변경내용 비고 2022-10-12 신규 샘플데이터 개방 소개
고속도로 CCTV 영상 내 차량 속도와 교통량을 자동으로 측정하는 AI기술 개발을 위한 영상 데이터
구축목적
본 인공지능 학습 데이터셋 구축은 고속도로 CCTV 영상 내 차량 속도와 교통량을 자동으로 측정하는 AI기반 영상VDS 개발에 활용을 목표로 함
-
메타데이터 구조표 데이터 영역 재난안전환경 데이터 유형 이미지 데이터 형식 데이터 출처 라벨링 유형 라벨링 형식 데이터 활용 서비스 데이터 구축년도/
데이터 구축량2020년/50만 -
구축 내용 및 제공 데이터량
- 데이터 규모 : 총 505시간 동영상 및 학습 데이터 50만 장 이미지
- 학습 데이터 형태
① Bounding Box (Detection) 이미지 : 30만 장
② Segmentation 이미지 : 20만 장 - 차종분류 : car, truck 및 bus 3종 (car는 suv, van, 픽업트럭을 포함한 가정에서 운용 가능한 승용차량을 모두 포함)
- 가공형태별 세부사항
구축 내용 및 제공 데이터량 표 가공형태 Bounding Box Polygon 이미지 수 30만장 20만장 CCTV 수 50개 지점 첨두 구간 비율 14.77% 시간대
분포동틈(06:00~08:59) 9.67% 9% 주간(09:00~17:00) 67.99% 68.45% 야간(17:01~06:00) 22.34% 22.55% 차로 분포 단방향 2차선 7.14% 7.98% 단방향 5차선 17.75% 15.43% 왕복 2차선(총4차선) 46.27% 47.56% 왕복 3차선(총6차선) 22.81% 23.66% 왕복 5차선(총10차선) 6.03% 5.37% 도로 형태 분포 일반 60.25% 59.32% 교량 34.62% 34.91% 터널 5.13% 5.77% 날씨 분포 맑음 79.36% 87.66% 비 12.63% 7.45% 안개 4.5% 2.36% 눈 3.17% 2.19% 식별불가(터널내부) 0.34% 0.34%
-
-
AI 모델 상세 설명서 다운로드
AI 모델 다운로드 -
데이터 성능 점수
측정값 (%)기준값 (%)데이터 성능 지표
데이터 성능 지표 번호 측정항목 AI TASK 학습모델 지표명 기준값 점수 측정값 점수 1 객체검출 Object Detection YOLO v4 mAP@IoU 0.5 60 % 68.2 % 2 객체분할 Object Detection YOLACT, Mask R-CNN mAP@IoU 0.5 40 % 40.3 %
※ 데이터 성능 지표가 여러 개일 경우 각 항목을 클릭하면 해당 지표의 값이 그래프에 표기됩니다.
※ AI모델 평가 지표에 따라 측정값의 범위, 판단 기준이 달라질 수 있습니다. (ex. 오류율의 경우, 낮을수록 좋은 성능을 내는 것으로 평가됩니다)
-
설명서 및 활용가이드 다운로드
데이터 설명서 다운로드 구축활용가이드 다운로드데이터 변경이력
교통문제 해결을 위한 CCTV 교통 영상(고속도로)-데이터변경이력 버전 일자 변경내용 비고 1.0 2021.06.30 데이터 최초 개방 구축 목적
- 본 인공지능 학습 데이터셋 구축은 고속도로 CCTV 영상 내 차량 속도와 교통량을 자동으로 측정하는 AI기반 영상VDS 개발에 활용을 목표로 함
활용 분야
- 고속도로 교통량 자동 측정 기술, 교통흐름 분석 및 기존 교통 정보 수집 체계 계선
소개
- 고속도로 CCTV 영상 내 차량 속도와 교통량을 자동으로 측정하는 AI기술 개발을 위한 인공지능 학습 데이터 구축을 위해 전국 50개 지점의 고속도로 영상 데이터를 수집하고 50만장의 이미지 데이터를 정제하여 가공(어노테이션)을 수행함
구축 내용 및 제공 데이터량
- 데이터 규모 : 총 505시간 동영상 및 학습 데이터 50만 장 이미지
- 학습 데이터 형태
① Bounding Box (Detection) 이미지 : 30만 장
② Segmentation 이미지 : 20만 장 - 차종분류 : car, truck 및 bus 3종 (car는 suv, van, 픽업트럭을 포함한 가정에서 운용 가능한 승용차량을 모두 포함)
- 가공형태별 세부사항
구축 내용 및 제공 데이터량 표 가공형태 Bounding Box Polygon 이미지 수 30만장 20만장 CCTV 수 50개 지점 첨두 구간 비율 14.77% 시간대
분포동틈(06:00~08:59) 9.67% 9% 주간(09:00~17:00) 67.99% 68.45% 야간(17:01~06:00) 22.34% 22.55% 차로 분포 단방향 2차선 7.14% 7.98% 단방향 5차선 17.75% 15.43% 왕복 2차선(총4차선) 46.27% 47.56% 왕복 3차선(총6차선) 22.81% 23.66% 왕복 5차선(총10차선) 6.03% 5.37% 도로 형태 분포 일반 60.25% 59.32% 교량 34.62% 34.91% 터널 5.13% 5.77% 날씨 분포 맑음 79.36% 87.66% 비 12.63% 7.45% 안개 4.5% 2.36% 눈 3.17% 2.19% 식별불가(터널내부) 0.34% 0.34%
대표도면
대표도면 Bounding Box Polygon Segmentation 이미지 예시 전체 가공
이미지 수량300,000 200,000 폴더명 구조 한국도로공사지사명_설치위치명_날짜_시간_요일_높이_첨두_도로유형_차로수_날씨_해상도 어노테이션
파일 예시필요성
- 영상기반 교통흐름분석을 위한 도로객체 검출/분할용 학습데이터는 국외 도로환경에서 제작된 일부 데이터만 존재하며, 국내 도로환경의 데이터는 전무하여 정확한 교통흐름 분석(속도 및 교통량) 기술개발이 불가능
- 특히, 영상기반 속도추정을 위한 GT데이터는 존재하지 않음
- AI 교통 서비스를 위한 AI 모델이 대규모 영상 데이터를 필요로 함에 따라, 교통안전 AI 경쟁력 강화를 위해서는 본 사업을 통해 실수요 기반의 AI 데이터 구축 필요
- 또한, 국내의 경우, 데이터셋 부족할 뿐만 아니라, 국내 수요처(한국도로공사, 지자체, AI 서비스 기업)가 필요로 하는 AI 데이터의 부족으로 AI 데이터구축 사업을 통한 경쟁력 강화가 절실
데이터 구조
- 1. Bounding Box 어노테이션 포맷
Bounding Box 어노테이션 포맷 표 항 목 설 명 xml에 입력된 어노테이션 데이터 예시 이미지 가공 작업의 이름, 메타데이터가
적용된 동영상 파일 이름과 같음Suwon_CH01_20200720_1700_MON_9m_NH_highway_TW5_
sunny_FHD객체(Class)정보 정의
car
truck
bus가공 대상인 원천 이미지 데이터 파일명 및
해상도 등의 정보 정의...(중략)...
name="Suwon_CH01_20200720_1700_MON_9m_NH_highway_TW5_
sunny_FHD_001.png" width="1080" height="1920"
...(중략)...이미지 위에 가공된 바운딩박스 객체의 정보,
라벨 정보와 box의 좌측 상단, 우측하단 좌표
정보를 포함...(중략)...
xbr="582.19" ybr="798.56" z_oreder="3">
...(중략)...
- 2. Polygon Segmentation 어노테이션 포맷
Polygon Segmentation 어노테이션 포맷 표 항 목 설 명 xml에 입력된 어노테이션 데이터 예시 이미지 가공 작업의 이름, 메타데이터가
적용된 동영상 파일 이름과 같음Suwon_CH01_20200721_1500_TUE_9m_NH_highway_TW5_
sunny_FHD객체(Class)정보 정의
car
truck
bus가공 대상인 원천 이미지 데이터 파일명 및
해상도 등의 정보 정의...(중략)...
name="Suwon_CH01_20200721_1500_TUE_9m_NH_highway_TW5_
sunny_FHD_001.png" width="1080" height="1920"
...(중략)...이미지 위에 가공된 바운딩박스 객체의
정보, 라벨 정보와 polygon 다각형을 구성하는 다수의 점 좌표
정보들을 포함...(중략)...
...(중략)...
- 3. 1분단위 영상 메타데이터 정보(json 포맷)
-
데이터셋 구축 담당자
수행기관(주관) : 라온피플
수행기관(주관) 책임자명 전화번호 대표이메일 담당업무 김대승 031-4264-8290 dskim@laonpeople.com · 데이터 구축 총괄 수행기관(참여)
수행기관(참여) 기관명 담당업무 KETI · 데이터 수집, AI 모델/활용 서비스 개발 메타빌드 · 데이터 수집, AI 활용 서비스 개발 테스트웍스 · 데이터 정제, 가공, 검수 그레스프리 · 테이터 정제 데이터 관련 문의처
데이터 관련 문의처 담당자명 전화번호 이메일 진창윤(라온피플) 031-698-3456 cyjin@laonpeople.com
-
인터넷과 물리적으로 분리된 온라인·오프라인 공간으로 의료 데이터를 포함하여 보안 조치가 요구되는 데이터를 다운로드 없이 접근하고 분석 가능
* 온라인 안심존 : 보안이 보장된 온라인 네트워크를 통해 집, 연구실, 사무실 등 어디서나 접속하여 데이터에 접근하고 분석
* 오프라인 안심존 : 추가적인 보안이 필요한 데이터를 대상으로 지정된 물리적 공간에서만 접속하여 데이터에 접근하고 분석 -
- AI 허브 접속
신청자 - 안심존
사용신청신청자신청서류 제출* - 심사구축기관
- 승인구축기관
- 데이터 분석 활용신청자
- 분석모델반출신청자
- AI 허브 접속
-
1. 기관생명윤리위원회(IRB) 심의 결과 통지서 [IRB 알아보기] [공용IRB 심의신청 가이드라인]
2. 기관생명윤리위원회(IRB) 승인된 연구계획서
3. 신청자 소속 증빙 서류 (재직증명서, 재학증명서, 근로계약서 등 택1)
4. 안심존 이용 신청서 [다운로드]
5. 보안서약서 [다운로드]
※ 상기 신청서 및 첨부 서류를 완비한 후 신청을 진행하셔야 정상적으로 절차가 이루어집니다. -
신청 및 이용관련 문의는 safezone1@aihub.kr 또는 02-525-7708, 7709로 문의
데이터셋 다운로드 승인이 완료 된 후 API 다운로드 서비스를 이용하실 수 있습니다.
API 다운로드 파일은 분할 압축되어 다운로드 됩니다. 분할 압축 해제를 위해서는 분할 압축 파일들의 병합이 필요하며 리눅스 명령어 사용이 필요합니다.
리눅스 OS 계열에서 다운로드 받으시길 권장하며 윈도우에서 파일 다운로드 시 wsl(리눅스용 윈도우 하위 시스템) 설치가 필요합니다.
※ 파일 병합 리눅스 명령어
find "폴더경로" -name "파일명.zip.part*" -print0 | sort -zt'.' -k2V | xargs -0 cat > "파일명.zip"
- 해당 명령어 실행 시, 실행 경로 위치에 병합 압축 파일이 생성됩니다.
- 병합된 파일 용량이 0일 경우, 제대로 병합이 되지 않은 상태이니 "폴더경로"가 제대로 입력되었는지 확인 부탁드립니다.
※ 데이터셋 소개 페이지에서 다운로드 버튼 클릭하여 승인이 필요합니다.