-
데이터 변경이력
데이터 변경이력 버전 일자 변경내용 비고 1.3 2024-06-25 최종데이터 추가 개방 Training(원천/라벨링 데이터) 1.2 2024-05-20 원천데이터 및 라벨링데이터 수정 1.1 2023-12-21 원천데이터 및 라벨링데이터 수정 1.0 2021-06-30 데이터 최초 개방 데이터 히스토리
데이터 히스토리 일자 변경내용 비고 2022-10-12 신규 샘플데이터 개방 소개
버스 승차 및 하차 중인 승객을 식별하여 승하차 의도를 분석하기 위한 영상 및 이미지 데이터
구축목적
대중교통 버스 내부의 감시 카메라를 활용하여 승객의 승하차 의도를 예측하거나 승객의 안전 등의 연구에 활용할 수 있도록 인공지능 데이터를 구축
-
메타데이터 구조표 데이터 영역 교통물류 데이터 유형 이미지 데이터 형식 데이터 출처 라벨링 유형 라벨링 형식 데이터 활용 서비스 데이터 구축년도/
데이터 구축량2020년/90만 -
구축 내용 및 제공 데이터량
- 버스 승강장 및 버스 내부에 대한 영상 클립 7,000건과 그 탑승객 들의 바운딩 박스, 스켈레톤 포인트 정보, 행동 정의, 승하차 여부, 성별, 마스크 착용 여부
- 영상 클립으로부터 추출된 프레임 이미지와 그 순간의 버스 gyro 정보 및 가속도 정보를 데이터화
- 폭력이나 사고 등의 상황에 대한 8방향의 카메라 동시 촬영 영상과 그 행동 상태, 승객 박스와 스켈레톤 정보
구축 내용 및 제공 데이터량 표1 영상채널 카메라 정의 이미지 클립 A 버스 정문에서 정류소 방향을 관측하는 카메라 27 만장 2000 개 B 버스 운전석방향에서 정문을 관측하는 카메라 27 만장 2000 개 C 버스 중앙에서 후문 주변을 관측하는 카메라 27 만장 2000 개 구축 내용 및 제공 데이터량 표2 시나리오 폭행 시나리오 시간 횟수 S#01 마스크를 제지하는 기사폭행 남성 45s 6 이상 S#02 이유 없이 핸드백으로 기사 폭행 45s 6 이상 S#03 기사와 말싸움하던 남성이 핸들을 돌림 45s 6 이상 S#04 두 명의 승객이 기사 폭행 45s 6 이상 S#05 1열에 앉은 여성이 기사에게 오물 투척 45s 6 이상 S#06 운전석 착석 전 기사 폭행 45s 6 이상 구축 내용 및 제공 데이터량 표3 시나리오 사고 시나리오 시간 횟수 S#07 뒷자석에 앉은 여성이 급정거에 버스 통로로 떨어진다. 20s 6 이상 S#08 여행용가방을 놓친 승객으로 앞좌석 승객이 다친다. 20s 6 이상 S#09 급출발로 자리에 앉지 못한 승객이 쓰러진다. 20s 6 이상 S#10 손잡이를 안잡은 승객이 쓰러지며 옆승객도 쓰러진다. 20s 6 이상 S#11 주행중인 버스를 걷던 할머니가 중심을 잃고 쓰러진다. 20s 6 이상 S#12 좌석에서 비져나온 승객의 발에 걸려 넘어지는 학생 20s 6 이상 구축 내용 및 제공 데이터량 표4 시나리오 사고 시나리오 시간 횟수 S#13 주간 마스크 승객 승 하차(개인정보 동의) 60s 14 S#14 야간 마스크 승객 승 하차(개인정보 동의) 60s 14
-
AI 모델 상세 설명서 다운로드
AI 모델 다운로드 -
설명서 및 활용가이드 다운로드
데이터 설명서 다운로드 구축활용가이드 다운로드데이터 변경이력
데이터 변경이력 버전 일자 변경내용 비고 1.0 2021.06.30 데이터 최초 개방 구축 목적
- 대중교통 버스 내부의 감시 카메라를 활용하여 승객의 승하차 의도를 예측하거나 승객의 안전 등의 연구에 활용할 수 있도록 인공지능 데이터를 구축
활용 분야
- 자율주행 버스의 승객 승하차 관리, 개문발차 사고 방지, 승객 수 카운팅, 승객의 이상행동 검출, 대중교통 보건 마스크 착용 여부 등
소개
- 대중교통 버스에 장착된 감시카메라(surveillance camera)를 이용, 실제 운용중인 버스로부터 버스승강장과 앞문, 뒷문을 집중적으로 볼 수 있는 카메라 채널을 선정하여 각 채널별로 승객의 자세와 위치 정보를 획득하고, 실제 승객의 승하차 상태 및 행동 여부, 승객의 마스크 착용 여부 등의 정보를 json파일에 기록한다.
구축 내용 및 제공 데이터량
- 버스 승강장 및 버스 내부에 대한 영상 클립 7,000건과 그 탑승객 들의 바운딩 박스, 스켈레톤 포인트 정보, 행동 정의, 승하차 여부, 성별, 마스크 착용 여부
- 영상 클립으로부터 추출된 프레임 이미지와 그 순간의 버스 gyro 정보 및 가속도 정보를 데이터화
- 폭력이나 사고 등의 상황에 대한 8방향의 카메라 동시 촬영 영상과 그 행동 상태, 승객 박스와 스켈레톤 정보
구축 내용 및 제공 데이터량 표1 영상채널 카메라 정의 이미지 클립 A 버스 정문에서 정류소 방향을 관측하는 카메라 27 만장 2000 개 B 버스 운전석방향에서 정문을 관측하는 카메라 27 만장 2000 개 C 버스 중앙에서 후문 주변을 관측하는 카메라 27 만장 2000 개 구축 내용 및 제공 데이터량 표2 시나리오 폭행 시나리오 시간 횟수 S#01 마스크를 제지하는 기사폭행 남성 45s 6 이상 S#02 이유 없이 핸드백으로 기사 폭행 45s 6 이상 S#03 기사와 말싸움하던 남성이 핸들을 돌림 45s 6 이상 S#04 두 명의 승객이 기사 폭행 45s 6 이상 S#05 1열에 앉은 여성이 기사에게 오물 투척 45s 6 이상 S#06 운전석 착석 전 기사 폭행 45s 6 이상 구축 내용 및 제공 데이터량 표3 시나리오 사고 시나리오 시간 횟수 S#07 뒷자석에 앉은 여성이 급정거에 버스 통로로 떨어진다. 20s 6 이상 S#08 여행용가방을 놓친 승객으로 앞좌석 승객이 다친다. 20s 6 이상 S#09 급출발로 자리에 앉지 못한 승객이 쓰러진다. 20s 6 이상 S#10 손잡이를 안잡은 승객이 쓰러지며 옆승객도 쓰러진다. 20s 6 이상 S#11 주행중인 버스를 걷던 할머니가 중심을 잃고 쓰러진다. 20s 6 이상 S#12 좌석에서 비져나온 승객의 발에 걸려 넘어지는 학생 20s 6 이상 구축 내용 및 제공 데이터량 표4 시나리오 사고 시나리오 시간 횟수 S#13 주간 마스크 승객 승 하차(개인정보 동의) 60s 14 S#14 야간 마스크 승객 승 하차(개인정보 동의) 60s 14
대표도면
필요성
- 국내 자율주행 버스의 연구는 주행관점에서의 연구 위주로 진행되고 있고 승객 관리에 대한 부분의 연구는 전무한 상태
- 실제 승객 관리에 대한 부분은 스마트폰 앱과 비컨을 이용한 방법이며 이는 디지털 소외계층의 대중교통 이용배제나 불평등을 야기할 수 있음
- 실제 자율주행 버스의 기술 도입 순위와 상용화는 늦어지고 있으며 후발 국가들에게 추월당하고 있는 상태
- 이에 자율주행 버스를 구현하는데 있어 필수적인 승객의 승하차와 차량 내 이상행동에 대한 데이터셋을 마련하고 국내 연구개발을 지원
데이터 구조
- 데이터 구성
- 어노테이션 포맷
어노테이션 포맷 표 No 항목 내용 타입 1 info 이미지 메타 데이터 List 1-1 description 데이터셋 명 String 1-2 year 데이터셋 공개연도 Interger 1-3 version 데이터셋 버전 String 1-4 Img_path 이미지파일 경로 String 1-5 width 이미지 Width Integer 1-6 height 이미지 Height Integer 1-7 G-Sensor 가속도 센서 측정값 Integer 1-8 Gyro 자이로 센서 측정값 Integer 2 annotations 이미지 어노테이션 정보 List 2-1 Id 해당 객체 ID Integer 2-2 bbox 승객 Bounding Box 정보
(좌상단 x,y / 우하단 x,y)List 2-3 occluded Bounding box 가림/잘림 정보 Boolean 2-4 num_keypoints 어노테이션된 Keypoint 수 Integer 2-5 Keypoints 16개 Keypoint 정보 List 2-6 action 현재 동작 상태 정보
(stand, walk, run, sit down, laydown,
grab handle, kick, punch)String 2-7 age 연령 정보
(Children, Adult, Elder)String 2-8 disabled 신체 부자유 여부 Boolean 2-9 mask 마스크 착용여부 Boolean 2-10 get_on 버스 승차 여부 Boolean 2-11 get_off 버스 하차 여부 Boolean
-
데이터셋 구축 담당자
수행기관(주관) : 디텍
수행기관(주관) 책임자명 전화번호 대표이메일 담당업무 이금석 031-706-2515 stevelee@d-teg.com · 데이터구축 총괄 · 원문데이터 확보 및 제공 · 데이터 정제 수행기관(참여)
수행기관(참여) 기관명 담당업무 ㈜에프에스솔루션 · 어노테이션 저작도구 개발
· AI 모델/응용서비스 개발(버스승객 승하차 예측 모델, 마스크 착용 분류 모델)(사)한국창직협회 · 데이터 가공 및 검수
· 사회적 일자리 창출데이터 관련 문의처
데이터 관련 문의처 담당자명 전화번호 이메일 이금석(디텍) 031-706-2515 stevelee@d-teg.com
-
인터넷과 물리적으로 분리된 온라인·오프라인 공간으로 의료 데이터를 포함하여 보안 조치가 요구되는 데이터를 다운로드 없이 접근하고 분석 가능
* 온라인 안심존 : 보안이 보장된 온라인 네트워크를 통해 집, 연구실, 사무실 등 어디서나 접속하여 데이터에 접근하고 분석
* 오프라인 안심존 : 추가적인 보안이 필요한 데이터를 대상으로 지정된 물리적 공간에서만 접속하여 데이터에 접근하고 분석 -
- AI 허브 접속
신청자 - 안심존
사용신청신청자신청서류 제출* - 심사구축기관
- 승인구축기관
- 데이터 분석 활용신청자
- 분석모델반출신청자
- AI 허브 접속
-
1. 기관생명윤리위원회(IRB) 심의 결과 통지서 [IRB 알아보기] [공용IRB 심의신청 가이드라인]
2. 기관생명윤리위원회(IRB) 승인된 연구계획서
3. 신청자 소속 증빙 서류 (재직증명서, 재학증명서, 근로계약서 등 택1)
4. 안심존 이용 신청서 [다운로드]
5. 보안서약서 [다운로드]
※ 상기 신청서 및 첨부 서류를 완비한 후 신청을 진행하셔야 정상적으로 절차가 이루어집니다. -
신청 및 이용관련 문의는 safezone1@aihub.kr 또는 02-525-7708, 7709로 문의
데이터셋 다운로드 승인이 완료 된 후 API 다운로드 서비스를 이용하실 수 있습니다.
API 다운로드 파일은 분할 압축되어 다운로드 됩니다. 분할 압축 해제를 위해서는 분할 압축 파일들의 병합이 필요하며 리눅스 명령어 사용이 필요합니다.
리눅스 OS 계열에서 다운로드 받으시길 권장하며 윈도우에서 파일 다운로드 시 wsl(리눅스용 윈도우 하위 시스템) 설치가 필요합니다.
※ 파일 병합 리눅스 명령어
find "폴더경로" -name "파일명.zip.part*" -print0 | sort -zt'.' -k2V | xargs -0 cat > "파일명.zip"
- 해당 명령어 실행 시, 실행 경로 위치에 병합 압축 파일이 생성됩니다.
- 병합된 파일 용량이 0일 경우, 제대로 병합이 되지 않은 상태이니 "폴더경로"가 제대로 입력되었는지 확인 부탁드립니다.
※ 데이터셋 소개 페이지에서 다운로드 버튼 클릭하여 승인이 필요합니다.
오프라인 데이터 이용 안내
본 데이터는 K-ICT 빅데이터센터에서도 이용하실 수 있습니다.
다양한 데이터(미개방 데이터 포함)를 분석할 수 있는 오프라인 분석공간을 제공하고 있습니다.
데이터 안심구역 이용절차 및 신청은 K-ICT빅데이터센터 홈페이지를 참고하시기 바랍니다.