-
데이터 변경이력
데이터 변경이력 버전 일자 변경내용 비고 1.0 2022-07-14 데이터 최초 개방 데이터 히스토리
데이터 히스토리 일자 변경내용 비고 2022-10-20 신규 샘플데이터 개방 2022-07-14 콘텐츠 최초 등록 소개
• 과적 및 정상 차량 유형으로 구분하고, 과적 차량의 경우 과적 분류 체계별 데이터 40만 장 데이터 구축 • 차량 유형별(대형(덤프트럭), 중형, 소형 화물트럭) 3종 • CCTV, 블랙박스, 드론, 디지털 카메라, 스마트기기, 활용한 데이터 수집 • 과적, 불법 차량 개조 분류 체계 제시 • 세부 분류 체계에 따른 데이터 편향 없이 구축 • 개인정보 등 민감 정보 제거 • 정상 차량, 과적 차량, 불법 개조 차량, 태깅 • 안전 도로를 확보하여, 도로 위험 상황 연출 및 학습 데이터 구축 • 공용 도로 대상으로 교통 안전에 피해를 주지 않게 원천 영상 획득
구축목적
• 과적 단속 업무 효율화 및 AI 기술 발전 기여 • 도로 안전을 위한 AI 기술 활용 가능성 확대 • COVID-19 사태로 장기 경기침체에 대응하여 대규모 일자리 창출 가능 • 과적 및 불법 개조 차량 검출을 통한 차량 단속을 위한 학습 데이터 구축
-
메타데이터 구조표 데이터 영역 재난안전환경 데이터 유형 이미지 데이터 형식 JPG 데이터 출처 직접촬영, 인천광역시 종합걸설본부 CCTV 라벨링 유형 바운딩박스,세그멘테이션(이미지) 라벨링 형식 JSON 데이터 활용 서비스 과적 차량에 대한 학습 데이터를 구축함으로써 과적 차량을 정지시키지 않고 영상을 이용하여 과적을 판정하는 LVES(과적 차량 단속 서비스)에 활용 가능함 데이터 구축년도/
데이터 구축량2021년/400,000장 -
1. 데이터 통계
- 원천데이터 40만장, 라벨링데이터 40만장 구축
※복합차량( 정상차량+정상차량 / 정상차량 + 불법차량 / 불법차량 +불법차량)의 경우 포함된 수량)
2. 데이터 분포
- 차량 크기별 객체 분포 : 대형차, 중형차, 소형차
- 불법 구분별 분포 : 정상차량, 불법차량
- 불법 유형별 분포 : 높이과적, 넓이과적, 길이과적, 적재불량, 불법개조
- 획득방법별 분포 : CCTV, 드론, 블랙박스, 직접촬영, 기획촬영
- 원천데이터 40만장, 라벨링데이터 40만장 구축
-
-
AI 모델 상세 설명서 다운로드
AI 모델 상세 설명서 다운로드 AI 모델 다운로드- 라벨링 툴을 자체적으로 개발하여 모델 학습에 있어 최적의 학습용 데이터 가공
- 과적차량 분류를 위해 다양한 Image Detection 모델의 성능 및 효율을 비교하여 적합 모델 선정
- 불법개조차량 탐지를 위해 다양한 Instance Segmentation 모델의 성능 및 효율을 비교하여 적합 모델 선정
- 도로 내 운행 객체 중 과적 탐지 및 분류(YOLOv4)
- 도로 내 운행 객체 중 불법개조 차량 탐지(Mask R-CNN)
- 도로 내 운행 객체 중 과적 탐지 및 분류(YOLOv4)
서비스 활용
- 고속·일반도로 안전 서비스 체계 제공
- 도로관리자 및 화물차 운전자 그리고 일반 차량 운전자에게 반드시 필요한 도로 교통안전 서비스로서 화물차 운행 관리 및 효과적 제한, 과적 위반 차량 단속과 계도를 통한 선진적 관리체계, 교통 사고 예방 및 사회 비용 절감 등 기여
- 서울특별시, 부산광역시 등 광역단위 지자체와 경기도, 수원시 등 화물차 통행량 증가와 이로 인한 위험성이 존재하는 도시부 일반도로 관리구간의 참여로 다양한 도로 환경을 반영한 데이터 구축으로 데이터의 범용화, 실용화 추진
- 화물차량 과적 단속 업무 개선 및 화물 차량 과적 정보 구축
- 화물 차량 과적 정보 구축의 기초자료로 활용하고, 이를 토대로 보다 지속적이고, 발전적인 데이터 구축 서비스로 확장하여 국민안전 및 공공 업무 효율화 기여
- 과적 차량의 단속을 과학화하기 위해, 지능형 단속시스템의 기술발전과 단속 업무의 개선을 통해 치밀한 보안ㆍ관제形 화물차량 및 과적 차량 식별 자동화 기술에 기여
- 과적 차량을 정지시키지 않고 영상을 이용하여 과적을 판정하는 LVES(과적 차량 단속 서비스)에 활용
-
데이터 성능 점수
측정값 (%)기준값 (%)데이터 성능 지표
데이터 성능 지표 번호 측정항목 AI TASK 학습모델 지표명 기준값 점수 측정값 점수 1 과적 차량 탐지 모델 정확도 Object Detection YOLO v4 mAP@IoU 0.6 50 % 93.6 % 2 불법개조(판스프링) 탐지 모델 정확도 Object Detection Mask R-CNN mAP 50 % 89.6 %
※ 데이터 성능 지표가 여러 개일 경우 각 항목을 클릭하면 해당 지표의 값이 그래프에 표기됩니다.
※ AI모델 평가 지표에 따라 측정값의 범위, 판단 기준이 달라질 수 있습니다. (ex. 오류율의 경우, 낮을수록 좋은 성능을 내는 것으로 평가됩니다)
-
설명서 및 활용가이드 다운로드
데이터 설명서 다운로드 구축활용가이드 다운로드1. 데이터 설명
- 다양한 도로,CCTV,블랙박스,카메라,드론 영상에 원시 데이터로부터 이미지 캡처 및 정제작업 하여 적합 원천 데이터를 추출하여 어노테이션 도구를 활용하여 정제된 원천데이터를 바운딩 박스,폴리곤 메타데이터를 적용한 인공지능 학습용 과적차량 도로 위험 데이터셋으로, 데이터의 다양성을 추구하며, 정제작업시 비식별화 작업을 통해 개인정보 및 민감정보 저작권 등 문제를 완전히 해결한 데이터
2. 데이터 포맷
-
2. 데이터 포맷 정상차량 – 대형차 데이터 항목 JSON 형식 촬영 기본 정보 해당 차량 정보 바운딩박스 정보
3. 데이터 구성
-
3. 데이터 구성 구분 항목명 타입 필수여부 설명 범위 비고 1 파일명 (FILE NAME) String Y 파일명 CCTV, 드론, 블랙박스,
스마트기기(캠코더,폰)1-1 획득구분
(COLLECTION METHOD)String Y 촬영방식구분 1-2 주/야 (Day/Night) String Y 주간/야간 주간, 야간 1-3 차선정보 (Lane) String Y 단/다차선 구분 단차선, 다차선 1-4 도로 번호(Road Number) String Y 도로 번호 1번 국도 등 1-5 촬영장소 (Place) String Y 촬영장소 명칭 경인고속도로,실증도로 등
위치 또는 주소 등1-6 촬영자 (ID CODE) String Y 사용자 코드 촬영방식 및 촬영자 코드 1-7 촬영일 (Date) Date Y 년월일 YYYY.MM.DD 1-8 기상정보 (Weather) String Y 기상상황 맑음, 흐림, 우천, 강설 1-9 해상도 (Resolution) String Y 해상도 1920X1080 라벨링 대상
이미지 해상도1-10 카메라제조사 (Make) String Y 카메라 제조 업체 정보 카메라 제조업체명 1-11 모델명 (Model Name) String Y 카메라 모델명 카메라 모델명 1-12 파일크기 (File Size) String Y 이미지 파일 크기 (Byte) 1-13 지정대상수량
(BoundingCount)Number Y 라벨링 Object 갯수 복수 라벨링 지정 시
라벨링 갯수
4. 어노테이션 포맷
-
4. 어노테이션 포맷 구분 항목명 타입 필수여부 설명 범위 비고 2 라벨링구분 (Drawing) String Y Box / Polygon Box, Polygon 획득구분
(Collection method)
기획촬영 경우에는
polygon만 허용2-1 바운딩박스 (Box) String N X1, Y1, X2, Y2
(라벨링구분이
Box인 경우 필수)X1, Y1, X2, Y2
좌표값획득구분
(Collection method)
CCTV, 드론, 블랙박스, 직접촬영 경우에만 허용2-2 폴리곤 (Polygon) String N X1, Y1, X2, Y2
(라벨링구분이
Polygon인경우 필수)X1, Y1, X2, Y2
좌표값획득구분
(Collection method)
기획촬영 경우에만 허용2-3 대항목 (Segment) String Y 차량 유형 대형차, 중형차, 소형차 2-4 중항목 (Package) String Y 불법 구분 불법차량, 정상차량 2-5 소항목 (Class) String Y 불법 유형 높이과적, 넓이과적, 길이과적,
적재불량, 불법개조, 정상차량중항목(Package)이
정상차량일 경우
소항목(Class)는
정상차량만 해당2-6 덮개상태 (Cover) String N 덮개 상태 덮개개방, 덮개없음, 끈 없음 소항목(Class)이
적재불량인
경우에만 해당2-7 차량방향 (course) String Y 차량 방향 전면좌측, 전면우측,
후면좌측, 후면우측2-8 커브방향 (Curve) String Y 커브 방향 정상주행, 좌커브, 우커브
5. 실제 예시
-
데이터셋 구축 담당자
수행기관(주관) : 주식회사 에스디엠이앤씨
수행기관(주관) 책임자명 전화번호 대표이메일 담당업무 김대석 070-4896-1266 dskim@sdmenc.co.kr · 데이터 총괄 관리 및 정제 공정 수행기관(참여)
수행기관(참여) 기관명 담당업무 더화이트커뮤니케이션(주) · 데이터 가공 노아에스앤씨 주식회사 · 데이터 품질관리 및 검수
· 인공지능 모델 개발재단법인 국제도시물정보과학연구원 · 데이터 수집
-
인터넷과 물리적으로 분리된 온라인·오프라인 공간으로 의료 데이터를 포함하여 보안 조치가 요구되는 데이터를 다운로드 없이 접근하고 분석 가능
* 온라인 안심존 : 보안이 보장된 온라인 네트워크를 통해 집, 연구실, 사무실 등 어디서나 접속하여 데이터에 접근하고 분석
* 오프라인 안심존 : 추가적인 보안이 필요한 데이터를 대상으로 지정된 물리적 공간에서만 접속하여 데이터에 접근하고 분석 -
- AI 허브 접속
신청자 - 안심존
사용신청신청자신청서류 제출* - 심사구축기관
- 승인구축기관
- 데이터 분석 활용신청자
- 분석모델반출신청자
- AI 허브 접속
-
1. 기관생명윤리위원회(IRB) 심의 결과 통지서 [IRB 알아보기] [공용IRB 심의신청 가이드라인]
2. 기관생명윤리위원회(IRB) 승인된 연구계획서
3. 신청자 소속 증빙 서류 (재직증명서, 재학증명서, 근로계약서 등 택1)
4. 안심존 이용 신청서 [다운로드]
5. 보안서약서 [다운로드]
※ 상기 신청서 및 첨부 서류를 완비한 후 신청을 진행하셔야 정상적으로 절차가 이루어집니다. -
신청 및 이용관련 문의는 safezone1@aihub.kr 또는 02-525-7708, 7709로 문의
데이터셋 다운로드 승인이 완료 된 후 API 다운로드 서비스를 이용하실 수 있습니다.
API 다운로드 파일은 분할 압축되어 다운로드 됩니다. 분할 압축 해제를 위해서는 분할 압축 파일들의 병합이 필요하며 리눅스 명령어 사용이 필요합니다.
리눅스 OS 계열에서 다운로드 받으시길 권장하며 윈도우에서 파일 다운로드 시 wsl(리눅스용 윈도우 하위 시스템) 설치가 필요합니다.
※ 파일 병합 리눅스 명령어
find "폴더경로" -name "파일명.zip.part*" -print0 | sort -zt'.' -k2V | xargs -0 cat > "파일명.zip"
- 해당 명령어 실행 시, 실행 경로 위치에 병합 압축 파일이 생성됩니다.
- 병합된 파일 용량이 0일 경우, 제대로 병합이 되지 않은 상태이니 "폴더경로"가 제대로 입력되었는지 확인 부탁드립니다.
※ 데이터셋 소개 페이지에서 다운로드 버튼 클릭하여 승인이 필요합니다.