-
데이터 변경이력
데이터 변경이력 버전 일자 변경내용 비고 1.0 2024-08-20 데이터 개방 Beta Version 데이터 히스토리
데이터 히스토리 일자 변경내용 비고 2024-08-20 산출물 공개 Beta Version 소개
- 전국의 고속도로, 국도, 지방도 4.5만KM에 존재하는 도로시설물 인식 데이터 구축 -도로안전시설물(16종), 도로관리시설물(8종), 교통관리시설물(8종), 기타(2종)
구축목적
- 다양한 도로환경에서 도로시설물 영상데이터 수집 및 위치정보를 포함한 구간별 시설물 인식 데이터 구축 - 도로 시설물 유형, 위치 및 상태 식별
-
메타데이터 구조표 데이터 영역 교통물류 데이터 유형 이미지 데이터 형식 jpg 데이터 출처 자체 수집 라벨링 유형 바운딩박스(이미지), 세그멘테이션(이미지), 캡션(txt) 라벨링 형식 json 데이터 활용 서비스 도로시설물 유지 관리 데이터 구축년도/
데이터 구축량2023년/220,000건 -
- 데이터 구축 규모
데이터 종류 가공 방식 데이터 형태 데이터 규모 비고 전국도로시설물
영상정보
데이터도로시설물 바운딩박스
세그멘테이션원천 JPG 200,000장 라벨링 JSON 200,000개 이미지캡션 캡션 원천 JPG 20,000장 도로시설물 원천데이터와 중복 라벨링 JSON 20,000개 도로시설물 - 원천 JPG 1,800,000장 - 데이터 분포(객체별 분포)
구분 라벨링 유형 이미지 수량 총객체수(개) 이미지 당
평균 객체(수)도로시설물 바운딩박스 200,000 2,031,764 10.16 세그멘테이션 200,000 644,988 3.22 이미지캡션 이미지캡션 20,000 20,000 1 - 데이터 분포(지역별 분포)
지역 객체수 비율 강원도 428,258 16.00% 경기도 506,304 18.91% 경상남도 183,625 6.86% 경상북도 352,882 13.18% 광주광역시 27,182 1.02% 대구광역시 74,720 2.79% 대전광역시 47,380 1.77% 부산광역시 50,348 1.88% 서울특별시 96,794 3.62% 세종특별자치시 10,158 0.38% 울산광역시 18,814 0.70% 인천광역시 20,433 0.76% 전라남도 182,605 6.82% 전라북도 188,063 7.03% 충청남도 273,820 10.23% 충청북도 215,366 8.05% 합계 2,676,752 100.00% - 데이터 분포(도로종류별 분포)
regiontype roadtype 객체수 구성비 비고 도시부 국도 193,430 7.23% 도시부-국도 지방도 9,652 0.36% 도시부-지방도 비도시부 고속도로 781,857 29.21% 비도시부-고속도로 국도 1,478,897 55.25% 비도시부-국도 지방도 212,916 7.95% 비도시부-지방도 합계 2,676,752 100.00%
- 데이터 분포(이미지 캡션)구분 구축규모 최소값 이미지캡션 어절수 143,695 5 어절 음절수 582,601 20 음절 -
-
AI 모델 상세 설명서 다운로드
AI 모델 상세 설명서 다운로드 AI 모델 다운로드- 활용 모델
ㅇ 이미지 기반 2D 바운딩박스 객체 탐지 모델 설계 및 구현
- Yolo V4를 이용한 도로시설물 Detecting
- 시선유도표지, 교통신호기, 갈매기표지, 도로 표지, 표지병, 안전 표지, 장애물 표적표, 도로명판, 구조물 도색 및 빗금표지, 긴급연락시설, 시선유도봉, CCTV, 조명시설, 도로전광표시, 도로반사경, 도로이정표, 과속방지턱의 19개에 대한 도로시설물 탐지
ㅇ 이미지 기반 2D 세그멘테이션 객체 탐지 모델 설계 및 구현
- Yolo V5를 이용한 도로시설물 Detecting
- 중앙분리대, 방호울타리, 충격흡수시설, 낙석방지망, 낙석방지울타리, 낙석방지 옹벽, 식생공법, 교량 , 지하차도, 고가차도, 입체교차로, 지하보도, 육교, 정거장, 터널의 15개 도로시설물 탐지Object detector
ㅇ 활용방안
- 인공지능 기반 도로시설물 인식 및 평가 기술개발에 필요한 데이터 셋 확보
- 인프라 스스로 진단 및 유지 보수 프로세스 제공 기반 마련- 향후 도로대장전산화 파일과 연계하여 도로시설물 유지관리에 활용
- 현장 순찰을 통해 도로대장 등에 등재 누락된 시설물 탐지 활용 -
설명서 및 활용가이드 다운로드
데이터 설명서 다운로드 구축활용가이드 다운로드- 데이터 구성
Key 설명 타입 비고 license 저작권 array info[] 일반 정보 array info[].contributor 기여자 string info[].date_created 데이터 생성일 string info[].description 데이터 설명 string info[].url 이미지 주소 string info[].version 가공 버전 number info[].year 가공 년도 number images[] 이미지 정보 array images[].id 이미지 고유 ID number images[].file_name 이미지 파일명 string images[].width 이미지 너비 number 0~3328 images[].height 이미지 높이 number 0~1920 images[].latitude 위도 number 32.12345 images[].longitude 경도 number 127.12355 images[].day 촬영날짜 string yy:mm:dd images[].time 촬영시간 string hh:mm:ss images[].camera 촬영카메라모델 string images[].velocity 주행속도 number images[].direction 촬영방향 number 진북기준 0-360 images[].climate 촬영당시 날씨 string 맑음/흐름/비 images[].frame 촬영프레임 number categories[] 객체 정보 array categories[].id 객체 고유 ID number categories[].name 객체 이름 enum categories[].supercategory 객체 상위 카테고리 string annotations[] 어노테이션 정보 array annotations[].id 객체 고유 ID number annotations[].image_id 이미지 고유 ID number annotations[].category_id 카테고리 고유 ID number annotations[].bbox 어노테이션 좌표 array [xtl, ytl, width, height] annotations[].segmentation 어노테이션 좌표 array [x1,y1,x2,y2,...] annotations[].region1 광역시도 enum annotations[].region2 지역 enum (시/군/구) annotations[].roadtype 도로구분 enum 고속도로/국도/지방도 annotations[].regiontype 도시타입 enum 도시부/비도시부 annotations[].state 시설물 상태정보 enum 정상 / 파손 annotations[].name 시설물종류 enum annotations[].subtype 시설물형태 string * 데이터 구성 정보
[4-2] categories[].name : "도로안전시설물", "도로관리시설물", "교통관리시설물", "기타"
[5-6] annotations[].region1 : "서울특별시", "부산광역시", "대구광역시", "인천광역시", "광주광역시", "대전광역시", "울산광역시", "세종특별자치시", "경기도", "강원도", "충청북도", "충청남도", "전라북도", "전라남도", "경상북도", "경상남도"
[5-11] annotations[].name : "기둥","가로재","시선유도표지","갈매기표지","표지병","장애물 표적표지", "구조물 도색 및 빗금표지", "시선유도봉", "조명시설", "도로반사경", "과속방지턱", "중앙분리대", "방호울타리", "충격흡수시설", "낙석방지망", "낙석방지울타리", "낙석방지 옹벽", "식생공법", "교량", "터널", "지하차도", "고가차도", "입체교차로", "지하보도", "육교", "정거장", "교통신호기", "도로 표지", "안전 표지", "도로명판", "긴급연락시설", "CCTV", "도로전광표시" "도로이정표“- 어노테이션 포맷
구분 항목명 길이 타입 필수 비고 여부 1 license array N 2 info[] array Y 02-1 info[].contributor string Y 02-2 info[].date_created string Y 02-3 info[].description string Y 02-4 info[].url string N 02-5 info[].version number N 02-6 info[].year number N 3 images[] array Y 03-1 images[].id number Y 03-2 images[].file_name string Y 03-3 images[].width number Y 0~3328 03-4 images[].height number Y 0~1920 03-5 images[].latitude number N 32.12345 03-6 images[].longitude number N 127.12355 03-7 images[].day string Y yy:mm:dd 03-8 images[].time string Y hh:mm:ss 03-9 images[].camera string Y 03-10 images[].velocity number Y 03-11 images[].direction number Y 진북기준 0-360 03-12 images[].climate string Y 맑음/흐름/비 03-13 images[].frame number Y 4 categories[] array Y 04-1 categories[].id number Y 04-2 categories[].name enum Y 04-3 categories[].supercategory string N 5 annotations[] array Y 05-1 annotations[].id number Y 05-2 annotations[].image_id number Y 05-3 annotations[].category_id number Y 05-4 annotations[].bbox array Y [xtl, ytl, width, height] 05-5 annotations[].segmentation array Y [x1,y1,x2,y2,...] 05-6 annotations[].region1 enum Y 05-7 annotations[].region2 enum N (시/군/구) 05-8 annotations[].roadtype enum Y 고속도로/국도/지방도 05-9 annotations[].regiontype enum Y 도시부/비도시부 05-10 annotations[].state enum Y 정상 / 파손 05-11 annotations[].name enum Y 05-12 annotations[].subtype string N - 데이터 포맷
■ 라벨링 데이터 포맷
라벨링 기능 원천 데이터 포맷 라벨링 데이터 포멧 도로 시설물 인지 RGB Camera Image JSON ■ 라벨링 데이터 규모
데이터 취득 센서 원천 데이터(장) 라벨링 데이터(장) 도로 시설물 인지 RGB 카메라 2,000,000 200,000 이미지캡션 RGB 카메라 - 20,000
■ 가공 타입원천 데이터 포멧 가공유형 RGB Camera Image 2D bounding box polygon ■ 가공 예시
- JSON 형식
{
"info": [ {
"contributor": "테스트웍스",
"date_created": "230830",
"description": "전국 도로시설물 영상정보 데이터"
} ],
"images": [ {
"id": 1,
"file_name": "20230804_000001.jpg",
"width": 3328,
"height": 1872,
"latitude": 37.51551109,
"longitude": 127.4138,
"day": "230804",
"time": "12:45:22",
"camera": "XNB-8003",
"velocity": 28,
"direction": 96,
"climate": "맑음",
"frame": 30 } ],
"annotations": [
{ "id": 1,
"image_id": 1,
"category_id": 35,
"bbox": [
1639.0,
879.5,
43.55,
78.4 ],
"segmentation": [],
"region1": "경기도",
"roadtype": "국도",
"regiontype": "비도시부",
"state": "정상",
"name": "기둥" },
{ "id": 17,
"image_id": 1,
"category_id": 15,
"bbox": [],
"segmentation": [
3328.0,
729.31 ],
"region1": "경기도",
"roadtype": "국도",
"regiontype": "비도시부",
"state": "정상",
"name": "낙석방지울타리" } ]} -
데이터셋 구축 담당자
수행기관(주관) : 테스트웍스
수행기관(주관) 책임자명 전화번호 대표이메일 담당업무 동길무 02-423-5168 gmdong@testworks.co.kr 사업총괄, 데이터 가공 및 검사, 세그멘테이션 탐지 모델 개발 수행기관(참여)
수행기관(참여) 기관명 담당업무 소다시스템 데이터 수집 및 정제 유오케이 데이터 수집 및 정제 와이파이브 바운딩박스 탐지 모델 개발 한국자동차연구원 데이터 설계 및 정제 데이터 관련 문의처
데이터 관련 문의처 담당자명 전화번호 이메일 동길무 02-423-5168 gmdong@testwork.co.kr 김은비 02-423-5168 ebkim@testworks.co.kr AI모델 관련 문의처
AI모델 관련 문의처 담당자명 전화번호 이메일 동길무 02-423-5168 gmdong@testwork.co.kr 김민혁 070-4334-7599 mh0804@wifive.co.kr 저작도구 관련 문의처
저작도구 관련 문의처 담당자명 전화번호 이메일 동길무 02-423-5168 gmdong@testwork.co.kr 김은비 02-423-5168 ebkim@testworks.co.kr
-
인터넷과 물리적으로 분리된 온라인·오프라인 공간으로 의료 데이터를 포함하여 보안 조치가 요구되는 데이터를 다운로드 없이 접근하고 분석 가능
* 온라인 안심존 : 보안이 보장된 온라인 네트워크를 통해 집, 연구실, 사무실 등 어디서나 접속하여 데이터에 접근하고 분석
* 오프라인 안심존 : 추가적인 보안이 필요한 데이터를 대상으로 지정된 물리적 공간에서만 접속하여 데이터에 접근하고 분석 -
- AI 허브 접속
신청자 - 안심존
사용신청신청자신청서류 제출* - 심사구축기관
- 승인구축기관
- 데이터 분석 활용신청자
- 분석모델반출신청자
- AI 허브 접속
-
1. 기관생명윤리위원회(IRB) 심의 결과 통지서 [IRB 알아보기] [공용IRB 심의신청 가이드라인]
2. 기관생명윤리위원회(IRB) 승인된 연구계획서
3. 신청자 소속 증빙 서류 (재직증명서, 재학증명서, 근로계약서 등 택1)
4. 안심존 이용 신청서 [다운로드]
5. 보안서약서 [다운로드]
※ 상기 신청서 및 첨부 서류를 완비한 후 신청을 진행하셔야 정상적으로 절차가 이루어집니다. -
신청 및 이용관련 문의는 safezone1@aihub.kr 또는 02-525-7708, 7709로 문의
데이터셋 다운로드 승인이 완료 된 후 API 다운로드 서비스를 이용하실 수 있습니다.
API 다운로드 파일은 분할 압축되어 다운로드 됩니다. 분할 압축 해제를 위해서는 분할 압축 파일들의 병합이 필요하며 리눅스 명령어 사용이 필요합니다.
리눅스 OS 계열에서 다운로드 받으시길 권장하며 윈도우에서 파일 다운로드 시 wsl(리눅스용 윈도우 하위 시스템) 설치가 필요합니다.
※ 파일 병합 리눅스 명령어
find "폴더경로" -name "파일명.zip.part*" -print0 | sort -zt'.' -k2V | xargs -0 cat > "파일명.zip"
- 해당 명령어 실행 시, 실행 경로 위치에 병합 압축 파일이 생성됩니다.
- 병합된 파일 용량이 0일 경우, 제대로 병합이 되지 않은 상태이니 "폴더경로"가 제대로 입력되었는지 확인 부탁드립니다.
※ 데이터셋 소개 페이지에서 다운로드 버튼 클릭하여 승인이 필요합니다.