BETA 실내공간 유지관리 서비스 로봇 데이터
- 분야로보틱스
- 유형 텍스트
- 생성 방식LMM
※ 25년 신규 개방되는 데이터로, 데이터 활용성 검토, 이용자 관점의 개선의견 수렴 등을 통해 수정/보완될 수 있으며 최종데이터, 샘플데이터, 산출물 등은 변경될 수 있습니다.
-
데이터 변경이력
데이터 변경이력 버전 일자 변경내용 비고 1.0 2025-04-16 데이터 개방 Beta Version 데이터 히스토리
데이터 히스토리 일자 변경내용 비고 2025-04-16 산출물 전체 공개 소개
- 대기 중, 업무 수행 중일 때의 실시간 로봇 상태 데이터 수집 - 실내 공간에 설치된 로봇으로부터 데이터를 수집하였으며, 수집 수량은 원천데이터/라벨링데이터 1,173,930건 수집 - 라벨링 과정을 통해, 정상 상태와 에러 상태 확인이 가능하며, 추론 가능함
구축목적
실내 공간에서 사용되는 서비스 로봇의 상태 및 세부 운영 정보 데이터를 기반으로, 선제적 유지보수를 수행할 수 있는 데이터 분석 시스템 구축 및 학습 모델 개발
-
메타데이터 구조표 데이터 영역 로보틱스 데이터 유형 텍스트 데이터 형식 json 데이터 출처 자체 수집 라벨링 유형 설명 라벨링 형식 json 데이터 활용 서비스 로봇 예방정비 서비스 데이터 구축년도/
데이터 구축량2024년/원천데이터 1,173,930 건 / 라벨링 데이터 1,173,930 건 -
ㅇ 데이터 구축 규모
- 구축 규모는 원천 데이터와 라벨링 데이터 둘다 1,173,930 건으로 동일함ㅇ 데이터 분포
- 사이트별 분포ㅇ 데이터 분포- 사이트별 분포 항목 구축량(건) 구성비(%) 병원 365,895 31.17 오피스 339,881 28.95 제조 233,651 19.90 학교 55,420 4.72 공공기관 124,837 10.63 식당 54,246 4.62 합계 1,173,930 100 - 장소 분포
ㅇ 데이터 분포- 장소 분포 항목 구축량(건) 구성비(%) 제조01x물류로봇01 59395 5.06 제조01x배송로봇04 62115 5.29 제조01x서빙로봇03 60086 5.12 제조02x물류로봇03 52055 4.43 병원01x안내로봇02 29196 2.49 병원01x안내로봇04 34079 2.9 병원02x안내로봇03 74700 6.36 병원04x배송로봇01 53250 4.54 병원04x안내로봇05 20550 1.75 병원04x안내로봇07 34178 2.91 병원05x배송로봇02 67896 5.78 병원06x배송로봇03 52046 4.43 오피스01x물류로봇02 63728 5.43 오피스01x서빙로봇02 53384 4.55 오피스01x안내로봇01 55554 4.73 오피스01x청소로봇12 63167 5.38 오피스02x서빙로봇01 50157 4.27 오피스02x청소로봇11 53891 4.59 공공기관01x청소로봇03 30553 2.6 공공기관01x청소로봇05 28417 2.42 공공기관01x청소로봇06 15639 1.33 공공기관02x청소로봇13 50228 4.28 식당01x서빙로봇02 54246 4.62 학교01x안내로봇06 55420 4.72 합계 1,173,930 100 - 로봇 종류별 분포
ㅇ 데이터 분포- 로봇 종류별 분포 항목 구축량(건) 구성비(%) 물류로봇01 59395 5.06 물류로봇02 63728 5.43 물류로봇03 52055 4.43 배송로봇01 53250 4.54 배송로봇02 67896 5.78 배송로봇03 52046 4.43 배송로봇04 62115 5.29 서빙로봇01 50157 4.27 서빙로봇02 107630 9.17 서빙로봇03 60086 5.12 안내로봇01 55554 4.73 안내로봇02 29196 2.49 안내로봇03 74700 6.36 안내로봇04 34079 2.9 안내로봇05 20550 1.75 안내로봇06 55420 4.72 안내로봇07 34178 2.91 청소로봇03 30553 2.6 청소로봇05 28417 2.42 청소로봇06 15639 1.33 청소로봇11 53891 4.59 청소로봇12 63167 5.38 청소로봇13 50228 4.28 합계 1,173,930 100 - 운영상태별 분포
ㅇ 데이터 분포- 운영상태별 분포 항목 구축량(건) 구성비(%) 정상 980350 83.51 에러 193580 16.49 합계 1,173,930 100 - 에러 상태별 분포
ㅇ 데이터 분포- 에러 상태별 분포 항목 구축량(건) 구성비(%) 충돌 51167 26.43 장애물 76213 39.37 자동문 3918 2.02 엘리베이터 21140 10.92 배터리 부족 17713 9.15 비상정지 23131 11.95 네트워크 118 0.06 소프트웨어 180 0.09 합계 193,580 100 - 시나리오별 분포(작업별 분포)
ㅇ 데이터 분포- 시나리오별 분포(작업별 분포) 항목 구축량(건) 구성비(%) 안내로봇 303677 25.87 배송로봇 235307 20.04 청소로봇 241895 20.61 서빙로봇 217873 18.56 물류로봇 175178 14.92 합계 1,173,930 100 -
-
AI 모델 상세 설명서 다운로드
AI 모델 상세 설명서 다운로드 AI 모델 다운로드ㅇ 활용모델
- 두 가지 임무에 따라, 각각 적합한 모델 사용
- 에러상태 예측: 의사결정나무 / 원인분석 설명문 생성: LLaMA3ㅇ 활용모델 임무 모델 내용 에러상태
예측의사결정나무 선정사유 • 알고리즘을 이해하기 쉽고, 최종결과 설명이 용이하며 수치형, 범주형 데이터 모두 처리 가능함 비율
(학습/검증/테스트)• 80% / 10% / 10% 측정지표 • Top-1 Accuracy 지표설명 • 모델이 추론한 클래스 중 가장 높은 확률을 가진 1개의 예측 클래스에 대한 정확도 원인분석
설명문 생성LLaMA 3 선정사유 • 오픈소스로 제공되어 접근성이 높고 다양한 크기의 모델이 선택가능하며 커뮤니티 기반의 지속적인 개선이 가능함
• 자체적으로 미세조정이 가능함비율
(학습/검증/테스트)• 80% / 10% / 10% 측정지표 • BLEU Score 지표설명 • 생성된 문장을 참조 문장으로 평가하기 위한 평가지표로서, 완변한 일치는 1.0의 점수가 나오는 반면 완벽한 불일치는 0의 점수가 나옴 -
설명서 및 활용가이드 다운로드
데이터 설명서 다운로드 구축활용가이드 다운로드ㅇ 데이터 구성
- 원천 데이터와 라벨링 데이터 모두 텍스트를 기반으로 하는 JSON 포맷으로 구성됨ㅇ 데이터 구성 원천데이터 원천데이터 종류 포맷 수량(단위) 설명 텍스트 데이터 JSON 1,173,930 (건) 로봇 상태 데이터를 JSON 포맷으로 구축 ㅇ 데이터 구성 라벨링데이터 라벨링데이터 종류 포맷 수량(단위) 설명 텍스트 데이터 JSON 1,173,930 (건) 원천데이터에서 정상/비정상 여부에 대한 라벨링 진행,
비정상일 경우 원인 함께 제시- 파일명의 경우, 1)로봇의 종류 2)로봇에게 부여된 고유ID 3)데이터가 생성된 월 4)로봇이 수행하는 태스크ID 5)데이터 순번으로 구성됨
ㅇ 데이터 구성 파일명 파일명 예시 세부 구성 설명
안내로봇_안내로봇01_11_task01_05233.json
① ② ③ ④ ⑤로봇종류_로봇Id_월_태스크ID_월 안에서의 순번.json ① 로봇종류 - 안내로봇
- 배송로봇
- 청소로봇
- 서빙로봇
- 물류로봇② 로봇 ID - ③ 월 - ④ 태스크 ID 태스크 번호(task01 ..) or 대기(STANDBY) ⑤ 순번 - ㅇ 데이터 포맷
- 원천 데이터의 경우, 아래 구분1부터 9까지 포함하고 있으며, 라벨링된 내용10번(errorData)가 추가되어 라벨링데이터가 구성됨ㅇ 데이터 포맷 구분 속성명 타입 설명 1 deviceId String 디바이스 Id 2 siteId String 사이트 id 3 deviceType String 디바이스 타입 4 lastUpdateTime String 업데이트 시간 5 createdAt String 원시데이터 생성 시간 6 registerDate String 로봇 등록일시 7 siteData Object 사이트 메타정보 7-1 siteId String 사이트 id 7-2 siteCategory String 사이트 종류 7-3 totalFloor String 전체 층 7-4 elvScenario boolean 엘리베이터 유무 7-5 elvRobotOnly boolean 전용 로봇 7-6 autoDoorScenario boolean 자동문 유무 7-7 autoDoorRobotOnly boolean 전용 로봇 7-8 crowd String 붐비는 정도 7-9 width String 넓이 7-10 depth String 깊이 8 taskData Object 작업 메타 정보 8-1 taskId String 작업 id 8-2 taskUuid String Task 테이블 id 8-3 taskName String 작업 이름 8-4 taskState String 작업 상태 8-5 taskStatement String 작업 설명 8-6 taskEstimatedTime String 예상 소요 시간 8-7 taskStartTime String 작업 시작 시간 8-8 taskElapsedTime String 작업 소요 시간 8-9 subTaskData Object 세부 작업 8-9-1 subTaskName String 세부 작업 이름 8-9-2 subTaskStatement String 세부 작업 설명 8-9-3 subTaskEstimatedTime String 세부 작업 예상소요 시간 8-9-4 subTaskStartTime String 세부 작업 시작 시간 8-9-5 subTaskElapsedTime String 세부작업 소요시간 9 deviceData Object 로봇 상태 9-1 mainState String 로봇 상태 9-2 robotStateString String 로봇 상태 9-3 batteryLevel number 배터리 9-4 nowCharging boolean 충전 여부 9-5 isOffline number 오프라인 정도 9-6 obstacle number 장애물 정도 9-7 collision number 충돌 정도 9-8 emergencyStop boolean 긴급정지 버튼 9-9 standardLocationData Object 위치 9-9-1 floorIndex String 층 정보 9-9-2 x number x 값 9-9-3 y number y 값 9-9-4 degree number 정도 9-9-5 speed number 속도 9-10 totalOperationData Object 운행 정보 9-10-1 time String 총 사용시간 9-10-2 distance number 총 이동거리 9-10-3 batteryUse number 배터리 사용량 9-10-4 batteryCycleCount number 배터리 충전 횟수 10 errorData Object 에러정보 10-1 errorState boolean 에러여부 10-2 errorCode String 에러코드 10-3 errorStatementLong String 에러 설명(롱버전) ㅇ 라벨링데이터 예시
-
데이터셋 구축 담당자
수행기관(주관) : ㈜빅웨이브로보틱스
수행기관(주관) 책임자명 전화번호 대표이메일 담당업무 송준봉 080-858-5050 jbsong@bigwaverobotics.com 총괄책임자 수행기관(참여)
수행기관(참여) 기관명 담당업무 뉴런아키텍쳐 품질관리 데이터 관련 문의처
데이터 관련 문의처 담당자명 전화번호 이메일 송준봉 080-858-5050 jbsong@bigwaverobotics.com 김선홍 080-858-5050 hong@bigwaverobotics.com AI모델 관련 문의처
AI모델 관련 문의처 담당자명 전화번호 이메일 송준봉 080-858-5050 jbsong@bigwaverobotics.com 김만수 080-858-5050 kms@bigwaverobotics.com 저작도구 관련 문의처
저작도구 관련 문의처 담당자명 전화번호 이메일 송준봉 080-858-5050 jbsong@bigwaverobotics.com 김만수 080-858-5050 kms@bigwaverobotics.com
-
인터넷과 물리적으로 분리된 온라인·오프라인 공간으로 의료 데이터를 포함하여 보안 조치가 요구되는 데이터를 다운로드 없이 접근하고 분석 가능
* 온라인 안심존 : 보안이 보장된 온라인 네트워크를 통해 집, 연구실, 사무실 등 어디서나 접속하여 데이터에 접근하고 분석
* 오프라인 안심존 : 추가적인 보안이 필요한 데이터를 대상으로 지정된 물리적 공간에서만 접속하여 데이터에 접근하고 분석 -
- AI 허브 접속
신청자 - 안심존
사용신청신청자신청서류 제출* - 심사구축기관
- 승인구축기관
- 데이터 분석 활용신청자
- 분석모델반출신청자
- AI 허브 접속
-
1. 기관생명윤리위원회(IRB) 심의 결과 통지서 [IRB 알아보기] [공용IRB 심의신청 가이드라인]
2. 기관생명윤리위원회(IRB) 승인된 연구계획서
3. 신청자 소속 증빙 서류 (재직증명서, 재학증명서, 근로계약서 등 택1)
4. 안심존 이용 신청서 [다운로드]
5. 보안서약서 [다운로드]
※ 상기 신청서 및 첨부 서류를 완비한 후 신청을 진행하셔야 정상적으로 절차가 이루어집니다. -
신청 및 이용관련 문의는 safezone1@aihub.kr 또는 02-525-7708, 7709로 문의
데이터셋 다운로드 승인이 완료 된 후 API 다운로드 서비스를 이용하실 수 있습니다.
API 다운로드 파일은 분할 압축되어 다운로드 됩니다. 분할 압축 해제를 위해서는 분할 압축 파일들의 병합이 필요하며 리눅스 명령어 사용이 필요합니다.
리눅스 OS 계열에서 다운로드 받으시길 권장하며 윈도우에서 파일 다운로드 시 wsl(리눅스용 윈도우 하위 시스템) 설치가 필요합니다.
※ 파일 병합 리눅스 명령어
find "폴더경로" -name "파일명.zip.part*" -print0 | sort -zt'.' -k2V | xargs -0 cat > "파일명.zip"
- 해당 명령어 실행 시, 실행 경로 위치에 병합 압축 파일이 생성됩니다.
- 병합된 파일 용량이 0일 경우, 제대로 병합이 되지 않은 상태이니 "폴더경로"가 제대로 입력되었는지 확인 부탁드립니다.
※ 데이터셋 소개 페이지에서 다운로드 버튼 클릭하여 승인이 필요합니다.
오프라인 데이터 이용 안내
본 데이터는 K-ICT 빅데이터센터에서도 이용하실 수 있습니다.
다양한 데이터(미개방 데이터 포함)를 분석할 수 있는 오프라인 분석공간을 제공하고 있습니다.
데이터 안심구역 이용절차 및 신청은 K-ICT빅데이터센터 홈페이지를 참고하시기 바랍니다.
국방데이터 개방 안내
본 데이터는 국방데이터로 군사 보안에 따라 AI허브에서 데이터를 제공하지 않으며,
군 담당자를 통한 별도의 사용 신청이 필요합니다.