AI-Hub

#자율주행

배송용 로봇 시각 환경 인식을 위한 주행 영상 데이터

분야교통물류
유형 텍스트 , 이미지 , 비디오

구축년도 : 2021 갱신년월 : 2023-04 조회수 : 5,969 다운로드 : 170 용량 :

샘플 데이터

※샘플데이터는 데이터의 이해를 돕기 위해 별도로 가공하여 제공하는 정보로써 원본 데이터와 차이가 있을 수 있으며,
데이터에 따라서 민감한 정보는 일부 마스킹(*) 처리가 되어 있을 수 있습니다.

소개 파일 목록 (API 다운로드)

※ 내국인만 데이터 신청이 가능합니다.

데이터 토론 문의하기 목록

데이터 변경이력

데이터 변경이력
버전	일자	변경내용
1.3	2023-04-19	원천데이터, 라벨링데이터 수정/기타산출물 추가
1.2	2022-11-23	원천데이터, 라벨링데이터 수정
1.1	2022-09-26	Training > 원천데이터, 라벨링데이터
1.0	2022-07-29	데이터 최초 개방

데이터 히스토리

데이터 히스토리
일자	변경내용	비고
2022-10-21	신규 샘플데이터 개방
2022-07-29	콘텐츠 최초 등록

소개

• 로봇의 수송역량이 가능한 물리적 공간에서의 자율주행을 위한 학습용 인공지능 데이터 획득을 통해 배송용 로봇의 시각 확보 기반 마련
• 구축된 학습용 데이터를 활용하여 자율주행 로봇 비즈니스모델과 프로세스 정립에 활용되어 AI 데이터를 적절하게 관리하고 효율적인 사용이 가능한 기반을 제공할 수 있는 배송용 시각 영상 데이터 마련
• 택배와 같은 말단 배송 수요가 증가하는 가운데, 아파트나 빌딩 등 고밀도 집적 시설 내 배송 효율성을 높이고 증가하는 수요에 대응할 수 있는 자동 화물 운송 셔틀 운영 시스템 개발을 위한 주변 환경 데이터의 구축

구축목적

국내 특화 자율주행 기술 및 서비스 개발 고도화를 위하여 다양한 주행 환경에서 로봇 관점의 주행 영상기반의 고품질 인공지능 학습용 데이터를 구축

메타데이터 구조표
데이터 영역	교통물류	데이터 유형	텍스트 , 이미지 , 비디오
데이터 형식	MP4, JPG, TXT	데이터 출처	원시데이터는 직접 고용된 크라우드워커에 의해 획득하며, 장소는 사전에 협조 및 허가된 공공시설을 포함 6구역의 시설에서 촬영
라벨링 유형	바운딩박스 및 세그멘테이션(이미지)	라벨링 형식	JSON
데이터 활용 서비스	(비대면서비스) 비대면 수요가 급증하면서 실내·외 다양한 환경의 영상 데이터 배포를 통해 배달·배송 서비스 구현/ (자율경로 선정) 입력된 지도맵 기반의 배송용 로봇은 자율 경로를 선정하여 이동할 수 있으며, 인공지능에 활용 가능한 데이터 취득/ (시스템 통합) 배송자, 물품 취득자 간의 유기적인 배송 전달 체계 마련을 위해 통합관제 시스템 운영 관리 가능	데이터 구축년도/ 데이터 구축량	2021년/원천 이미지 데이터(jpg) : 300,650장, 라벨링 데이터(json) : 363개, 원천 영상 데이터(mp4) : 363개, 영상 시나리오 주석 파일(txt) : 363개

데이터 통계

데이터 구축 규모
– 데이터 구축공정에 따른 구축량
: 목표 구축량은 영상데이터 100시간, 이미지 300,000장
: 영상데이터 1파일 당 40분, 10FPS, 2,000장의 이미지 추출
: 이미지는 영상의 변화가 충분히 반영된 1.2초 당 1장으로 추출하였으며, 40분 영상에서는 2,000장의 이미지를 획득할 수 있음

데이터 통계
구분		획득	가공1	가공2	활용
카메라	데이터구축량	150시간	150시간	100시간 300,000장	100시간 300,000장
카메라	데이터형태	MP4	MP4	MP4 JPG, JSON	MP4 JPG, JSON
3D LiDAR +RGB-D 카메라 융합데이터	데이터구축량	12시간	10시간		10시간
3D LiDAR +RGB-D 카메라 융합데이터	데이터형태	xyz	xyz		xyz

– 일반상황 시나리오 영상 데이터 (일반적인 배송임무 영상 데이터)

구분	주요 내용	구축량(TB)	비고
원시데이터	FHD(1920x1080), 10FPS 이상, MP4, 115시간 이상 * 1.5GB(60분) × 115개 = 172.5GB	180GB 이상	-
원천데이터	40분 내외 FHD(1920x1080) MP4 영상 115개(영상 클립당 1GB 내외) : 76시간 이상	115GB 이상	-
라벨링 이미지	영상 1.2초 간격으로 FHD 화질의 jpg 이미지 파일 추출 : 총 23 만장 구축	115GB 이상	-
어노테이션 파일	JSON 파일 약 23만개 (이미지당 1개)	500MB 이상	-
데이터 저장소	데이터 백업을 고려하여 전체 구축데이터의 2배에 이상의 대용량 NAS 서버 저장소 확보	약 1TB	-

– 돌발상황 시나리오 영상 데이터 (임무 중 사고 발생 대응 영상 데이터)

구분	주요 내용	구축량(TB)	비고
원천데이터	FHD(1920x1080), 10FPS 이상, MP4, 35시간 이상 * 1.5GB(60분) × 35개 = 52.5GB	60GB 이상	-
원시데이터	40분 내외 FHD(1920x1080) MP4 영상 35개(영상 클립당 1GB 내외) : 23시간 이상	70GB 이상	-
라벨링 이미지	영상 1.2초 간격으로 FHD 화질의 jpg 이미지 파일 추출 : 총 7 만장 구축	70GB 이상	-
어노테이션 파일	JSON 파일 약 7만개 (이미지당 1개)	300MB 이상	-
3D 공간 구축데이터	Spot 당 2,000,000개의 Point Cloud Data 구축	120GB 이상	시각화 도구 포함
데이터 저장소	데이터 백업을 고려하여 전체 구축데이터의 2배에 이상의 대용량 NAS 서버 저장소 확보	약 400GB	-

– 시나리오별 데이터 분포

구분		산출물 수량
구분		시간(분)	장
일반상황	기본배송	1,482분	74,100
	물품환경	1,012분	50,600
	외부환경	2,530분	126,500
돌발상황	기후변화	1,012분	50,600
합계		6,036분	301,800

– 데이터 수집 장소별 영상 데이터

번호	수집장소	산출물 수량
번호	수집장소	시간(분)	장
1	공공시설_오전	1.306분	64,600
2	공공시설_오후	1.306분	64,600
3	주거단지	1.232분	61,600
4	상업시설	1.296분	64,800
5	대학시설_실외	560분	28,000
6	대학시설_실내	336분	16,800
합계		6,036분 (100.6시간)	300,400
합계		6,036분 (100.6시간)	300,400

– 라벨링 대상 객체 분포

(단위: 개)
구분	동적객체	정적 객체
		정적 장애물	지형	상호작용 가능한 객체	조작 가능한 객체	인식용 객체
		정적 장애물	장애물	상호작용 가능한 객체	조작 가능한 객체	인식용 객체
기존 (전체)	26 (39%)	21 (32%)	8 (12%)	6 (9%)	5 (8%)	0 (0%)
기존 (그룹핑)	6 (24%)	6 (24%)	5 (20%)	2 (8%)	6 (24%)	0 (0%)
기존 (반영후)	5 (20%)	1 (4%)	1 (4%)	7 (28%)	8 (32%)	3 (12%)

저작도구 설명서 및 저작도구 다운로드
저작도구 설명서 다운로드 저작도구 다운로드

AI 모델 상세 설명서 다운로드

AI 모델 상세 설명서 다운로드 AI 모델 다운로드

인공지능 모델/알고리즘 필요성

사람이 눈을 사용하여 필요한 정보를 획득하듯 배송용 로봇은 카메라로 인식된 시각정보를 기반으로 주행하면서 발생되는 외부적 요인을 로봇 스스로 해결 필요
물체의 종류와 형태, 그리고 로봇이 이동 가능한 영역을 인식하는 것은 물류/배송로봇의 자율주행과 물체 조작에 매우 중요한 기능이며, 정확하고 실시간으로 동작하는 영상기반 물체인식 기술이 필요
물체 또는 장애물을 인지하는 것 외에 실외에서 이동하는 배송로봇은 보도와 같이 로봇이 주행 가능한 영역을 인지하는 것도 필요.
비식별화된 영상 데이터를 기반으로 여러 사물을 동시에 검출하고 인식할 수 있는 모델을 이용하여 배송 로봇의 자율주행 안정성 확보가 필요함
이 과제에서는 최근 관련 연구를 조사하여 이동객체에 대한 검지 및 인식 성능이 높다고 알려진 Swin-L, Scaled-YOLOv4 CSP 모델을 적용함

인공지능 모델/알고리즘 연구개발 방안 및 목표

인공지능 모델/알고리즘 필요성
구분		항목	목표치	단위	세계최고 수준	국내 수준
다중 객체 인식 모델 (bounding box)		mAP (IoU 50)	60 이상	%	60 이상	N/A
다중 객체 인식 모델 (polygon)		mAP (IoU 50)	60 이상	%	60 이상	N/A
다중 객체 행위 인식 모델	정적객체	mAP	60 이상	%	N/A	N/A
다중 객체 행위 인식 모델	동적객체	mAP	30 이상	%	N/A	N/A

다중 객체 인식 모델 (bounding box, polygon)	다중 객체 행위 인식 모델

인공지능 알고리즘 구성도 분석 범위

(알고리즘 구성도 분석 범위) 수집된 데이터에 대한 기계학습 기반 데이터 자동 분류기술 및 유사도, 의존도 연산 알고리즘 개발
– 베이지안 네트워크 등의 알고리즘을 이용하여 입력 데이터를 분류하고 의존도 연산하는 S/W 개발

[통합 시스템 구조 및 데이터 처리 시스템 구조도 예시]
(데이터 수집 시스템 설계 범위) 데이터 수집, 저장, 처리가 가능한 시스템이 설계되어있으며, 데이터셋 구조 데이터시스템 설계에 대한 특징표현 가능

[데이터 수집 시스템 구성 및 전처리 데이터베이스]
– 데이터처리 시스템은 인플럭스 DB, OpenTSDB에 원본 데이터를 저장하고 전처리된 데이터는 카산드라DB에 저장, 활용 가능
– 카산드라 DB는 분석알고리듬 수행에 필요한 입력데이터를 저장, 처리하며, 분석된 데이터를 가시화 플랫폼에 전송하는 기능 담당 수행

[고속 시계열 데이터 처리를 위한 시스템 구조 및 구현]

[데이터 분석/활용을 위한 통합처리 시스템 구조]

설명서 및 활용가이드 다운로드

데이터 설명서 다운로드 구축활용가이드 다운로드

데이터 포맷

기본 포맷 : mp4, jpg, json file, xyz file
– 로봇 관점의 주행에 대하여 사람이 직접 촬영하거나 로봇이 촬영한 영상 데이터

데이터 포맷
단계	데이터 설명	분류	포맷
획득 및 정제 단계	고프로, 스마트폰을 통해 수집된 영상데이터	동영상	MP4
획득 및 정제 단계	자율주행 로봇에 부착된 3D LiDAR와 RGBD 카메라 정합 데이터	RGBD +3D LiDAR	xyz
가공단계	영상데이터를 일정 간격으로 슬라이싱하여 라벨링 수행	이미지	jpg
구축단계	이미지 속성과 라벨링 정보가 담긴 파일	Json File	JSON

– (로봇 영상 데이터 취득) 데이터 수집 허가 승인 시설에서 로봇주행에 자율주행 로봇을 활용하여 영상 취득
– (작업자 취득) 데이터 수집 허가 승인 시설 및 장소에서 동적 장애물 또는 로봇주행이 어려운 공간에서 데이터를 취득하기 위해 인력을 활용해 영상 취득

어노테이션 포맷

어노테이션이 완료된 데이터는 어노테이션 도구를 통해 산출하게 되면 .jpg 이미지 파일과 라벨링 정보를 담고있는 .json 파일이 생성
생성된 json 파일은 COCO1.0의 형식을 따름
JSON 파일은 각 라벨에 대한 어노테이션 정보를 포함

[라벨 구성요소]
라벨 구성요소 표 이미지 라벨 구성요소 표 이미지2

데이터 포맷

기본 포맷 : jpg, json file, xyz file
– 로봇 관점의 주행에 대하여 사람이 직접 촬영하거나 로봇이 촬영한 영상 데이터

분류	예시	데이터 항목
영상		배송용 로봇 관점 주행 영상
이미지		객체 종류 객체 상황 속성 위치 관계 정보


JSON		객체 정의 객체 번호 객체명 대분류 이미지정보 이미지번호 라이센스 파일명 이미지 사이즈 (가로, 세로) 어노테이션 정보 라벨링 번호 이미지 번호 bbox 좌표 segmentation 좌표 라벨링 영역 넓이 세부 속성 객체 가림 정보 트랙킹 id 객체 트랙킹 여부 객체 상세 속성

데이터셋 구축 담당자

수행기관(주관) : 흥일기업(주)

수행기관(주관)
책임자명	전화번호	대표이메일	담당업무
박성진	02-6283-0165	sjpark@hungil.co.kr	· 사업 총괄, 책임

수행기관(참여)

수행기관(참여)
기관명	담당업무
㈜디타스	· 데이터 정제 및 가공
한국교통대학교	· AI활용 서비스 모델 제시
오산시청	· 데이터 획득을 위한 운행 장소 제공

데이터 관련 문의처

데이터 관련 문의처
담당자명	전화번호	이메일
권용빈	02-6283-0165	ybgwon@hungil.co.kr

보건의료 데이터 개방 안내

보건의료 데이터는 온라인 및 오프라인 안심존을 통해 개방됩니다.

안심존이란 안심존 이용메뉴얼 안심존 이용신청

인터넷과 물리적으로 분리된 온라인·오프라인 공간으로 의료 데이터를 포함하여 보안 조치가 요구되는 데이터를 다운로드 없이 접근하고 분석 가능
* 온라인 안심존 : 보안이 보장된 온라인 네트워크를 통해 집, 연구실, 사무실 등 어디서나 접속하여 데이터에 접근하고 분석
* 오프라인 안심존 : 추가적인 보안이 필요한 데이터를 대상으로 지정된 물리적 공간에서만 접속하여 데이터에 접근하고 분석
1. AI 허브 접속
  신청자
2. 안심존
  사용신청신청자신청서류 제출*
3. 심사구축기관
4. 승인구축기관
5. 데이터 분석 활용신청자
6. 분석모델반출신청자
1. 기관생명윤리위원회(IRB) 심의 결과 통지서 [IRB 알아보기]
2. 기관생명윤리위원회(IRB) 승인된 연구계획서
3. 신청자 소속 증빙 서류 (재직증명서, 재학증명서, 근로계약서 등 택1)
4. 안심존 이용 신청서 [다운로드]
5. 보안서약서 [다운로드]
※ 상기 신청서 및 첨부 서류를 완비한 후 신청을 진행하셔야 정상적으로 절차가 이루어집니다.
신청 및 이용관련 문의는 safezone1@aihub.kr 또는 02-525-7708, 7709로 문의