※ 25년 신규 개방되는 데이터로, 데이터 활용성 검토, 이용자 관점의 개선의견 수렴 등을 통해 수정/보완될 수 있으며 최종데이터, 샘플데이터, 산출물 등은 변경될 수 있습니다.
-
데이터 변경이력
데이터 변경이력 버전 일자 변경내용 비고 1.0 2025-04-16 데이터 개방 Beta Version 데이터 히스토리
데이터 히스토리 일자 변경내용 비고 2025-04-16 산출물 전체 공개 소개
가사 등 가정환경 사람-로봇 간 공유 작업을 위한 VLM(Vison-Language Model) 기반 미세조정(Fine-tuning) 데이터
구축목적
- 가정환경 내 로봇 활용의 확대 - 사람-로봇 공유 작업을 위한 표준화된 이미지-텍스트 벤치마크
-
메타데이터 구조표 데이터 영역 로보틱스 데이터 유형 3D , 이미지 , 텍스트 데이터 형식 - 3D CAD 스캔데이터(*.obj, *.mtl, *.png) - 실제/가상 환경 촬영 데이터(*.png, *.npy) 데이터 출처 - 가정환경에서 사용되는 물체 200종에 대한 3D CAD 스캔 데이터 - 실제 환경과 3D CAD 데이터를 이용한 가상 환경에서 다양한 각도로 촬영한 물체 이미지 라벨링 유형 세그멘테이션(이미지) / 캡션(텍스트) 라벨링 형식 *.json 데이터 활용 서비스 로봇이 가정환경에서 사람과 함께 협력 작업 수행 데이터 구축년도/
데이터 구축량2024년/- 3D CAD 스캔데이터 200세트 - 실제/가상 환경 촬영 데이터 100,190세트 -
데이터 구축 규모
- 3D CAD 스캔데이터 200세트(*.obj, *.mtl, *.png, *.json)
- 실제/가상 환경 촬영 데이터 100,190세트(*.png, *.npy, *.json)데이터 분포
데이터 분포 구분 내용 이미지캡션
중복성유사도 0% 이미지캡션
어절 수9,266,844개 촬영 조도
분포구분 구성비 0~999 5% 1,000~1,999 36% 2,000~3,000 60% 3D 물체
대분류 분포구분 구성비 생활용품 19% 식품 22.92% 주방용품 25.09% 잡화 27.98% 욕실용품 5.01% 촬영 각도
분포구분 구성비 각도조건1
(0°~30°)32.45% 각도조건2
(30°~60°)33.36% 각도조건3
(60°~90°)34.19% 실제 환경 촬영
이미지 수10,000건 가상 환경 촬영
이미지 수90,190건 3D 물체
종류 수200종 이미지캡션
문장 수500,950개 이미지캡션
토큰 수9,266,844개 -
-
AI 모델 상세 설명서 다운로드
AI 모델 상세 설명서 다운로드 AI 모델 다운로드[참조 물체 위치 검출 (Referring Expression Comprehension)] - PolyFormer
- "Polyformer: Referring image segmentation as sequential polygon generation." CVPR 2023
- 선정 사유: 기존 픽셀 레벨로 해결한 다른 모델과 다른 접근이 polygon을 예측하는 방식을 픽셀 레벨로 문제를 해결한 다른 모델의 모듈과 함께 사용해 성능을 향상하고자 선정
- 특징: 기존 픽셀레벨로 해결했던 segmentatio 및 detection 문제를 polygon을 예측하는 문제로 바꾸어 문제를 해결함. 이를 위해 regression-based transformer decoder를 제안
- AI 모델 적용 인공지능 활용 예시: 물체의 정확한 형상까지 원하는 경우가 아닌 경우 더 높은 정확도로 물체가 놓여 있는 위치를 검출할 수 있기 때문에 목표 물체까지의 로봇 내비게이션과 같은 작업에 사용될 수 있음[참조 이미지 분할 (Referring Image Segmentation)] - LAVT
- LAVT: Language-Aware Vision Transformer for Referring Image Segmentation, CVPR, 2022
- RIS 태스크를 수행할 수 있는 모델
- 선정 사유: 2024년 기준 RIS 최고 성능 모델
- 특징: 이미지 transformer에 언어 인코더에서 나온 특징을 직접적으로 사용
- AI 모델 적용 인공지능 활용 예시: 로봇이 가정환경에서 사람과 함께 작업할 때, 물체의 공식적 명칭뿐 아니라 물체의 특징(크기, 색상, 위치 등)을 통한 표현을 통해서도 물체를 인식하고 협력 작업에 활용 -
설명서 및 활용가이드 다운로드
데이터 설명서 다운로드 구축활용가이드 다운로드데이터 구성
데이터 구성 Key Description 타입 images 이미지 정보 Dictionary file_name RGB 파일명 String depth_file_name Depth 파일명 String height RGB 이미지 높이 Int width RGB 이미지 넓이 Int depth_height Depth 이미지 높이 Int depth_width Depth 이미지 넓이 Int id 이미지 식별 ID Int camera_info 카메라 정보 Dictionary depth_scale 깊이 정보 Int camera_type 카메라 종류 String environment 촬영 환경 String working_stage 작업 단계 String luminous_intensity 조도 Int angle_type 각도 종류 String annotiations 어노테이션 정보 List of Dictionary segmentation 이미지 세그멘테이션 정보 Dictionary counts 런 렝스 부호화
(Run-length encoding, RLE)
압축방식을 사용한 마스크 정보RLE size RLE 적용되는 이미지 크기 List of Int area RLE 적용되는 마스크 영역 크기 Float bbox BBox 좌표값 List of Int category_id 물체 클래스 ID 번호 Int referring_expression 캡션 문장 String token 캡션 토큰 변환 형태 List of String token_length 토큰 길이 Int categories 물체 카테고리 정보 List of Dictionary supercategory 물체 용도 분류 String usage_id 물체 용도 분류 번호 Int name 물체 영문 이름 String korean_name 물체 국문 이름 String 어노테이션 포맷
어노테이션 포맷 No 항목 한글명 항목 영문명 타입 필수여부 작성예시 1 이미지 정보 images Dictionary Y - 1.01 파일 이름 file_name String Y "000050_000002.png" 1.02 깊이 파일 이름 depth_file_name String Y "000050_000002.npy" 1.03 높이 height Int Y 1080 1.04 너비 width Int Y 1920 1.05 깊이 높이 depth_height Int Y 1024 1.06 깊이 너비 depth_width Int Y 1024 1.07 이미지ID id Int Y 30932 1.08 카메라 정보 camera_info Dictionary Y - 1.08.01 깊이 정보 스케일 depth_scale Int Y 10 1.08.02 카메라 타입 camera_type String Y "azure_kinect" 1.09 환경 environment String Y "home01" 1.1 작업단계 working_stage String Y "ready" 1.11 조도 luminous_intensity Int Y 1000 1.12 각도조건 angle_type String Y “각도조건1” 2 라벨링 정보 annotiations List of Dictionary Y - 2.01 물체 마스크 segmentation Dictionary Y - 2.01.01 마스크 RLE counts RLE Y “cUeU12eQ14M3L4M3L4L4M
3L4L5L3L4M3L4L4M3L4L4M3
L3N1N3M2O1N2O2M2N2O
1N3M2O1N2O2M2N2O1000
000O1000000O2O000O1000
000O1000001N10000O10000
00O101O000O10000O10000
00O2O00000O10`Th`0"2.01.02 마스크 크기 size List of Int Y [1080, 1920] 2.02 영역 area Float Y 620 2.03 그룹 라벨링 여부 iscrowd Int Y 0 2.04 이미지ID image_id Int Y 30932 2.05 바운딩 박스 bbox List of Int Y [
100,
50,
38,
28
]2.06 카테고리 ID category_id Int Y 127 2.07 주석 ID id Int Y 154663 2.08 지칭 문장 referring_expression String Y "가방에 넣어 다닐 수 있는 물티슈를 건네줘" 2.09 토큰 token List of String Y [
"▁가방",
"에",
"▁넣어",
"▁다",
"닐",
"▁수",
"▁있는",
"▁물",
"티",
"슈",
"를",
"▁건",
"네",
"줘“
]2.1 토큰 길이 token_length Int Y 14 3 카테고리 정보 categories List of Dictionary Y - 3.01 슈퍼 클래스 supercategory String Y "Daily supplies" 3.02 물체ID category_id Int Y 16 3.03 용도 usage_id Int Y 3 3.04 물체 영문 이름 name String Y "Wet tissue" 3.05 물체 한글 이름 korean_name String Y “물티슈” 3.06 무게 weight Float Y 0.1 데이터 포맷(물체 세그멘테이션, 텍스트 라벨링)
json 예시
{
"images": {
"file_name": "008037_000000.png",
"depth_file_name": "008037_000000.npy",
"height": 1080,
"width": 1920,
"depth_height": 1024,
"depth_width": 1024,
"id": 2008037000000,
"camera_info": {
"depth_scale": 10,
"camera_type": "azure_kinect"
},
"environment": "living_01",
"working_stage": "ready",
"luminous_intensity": 1150,
"camera_angle": "각도조건3"
},
"annotations": [
{
"segmentation": {
"counts":
"Zdm`0 "size": [
1080,
1920
]
},
"area": 58520.0,
"iscrowd": 0,
"image_id": 2008037000000,
"bbox": [
513,
426,
821,
616
],
"category_id": 4,
"id": 2008037000000,
"referring_expression": "저 은색 납작한 형태의 노트북을 위쪽으로 빨리 가져와",
"token": [
"▁저",
"▁",
"은",
"색",
"▁",
"납",
"작",
"한",
"▁형태",
"의",
"▁노트북",
"을",
"▁위",
"쪽으로",
"▁빨리",
"▁가져",
"와"
],
"token_length": 17
},...
],
"categories": [
{
"supercategory": "Daily supplies",
"category_id": 4,
"usage_id": 1,
"name": "Laptop",
"korean_name": "노트북",
"weight": 1.0
},...
]
} -
데이터셋 구축 담당자
수행기관(주관) : ㈜미디어그룹사람과숲
수행기관(주관) 책임자명 전화번호 대표이메일 담당업무 김지빈 02-830-8584 kjb@humanf.co.kr 데이터 가공/검수 수행기관(참여)
수행기관(참여) 기관명 담당업무 광주과학기술원 데이터 획득/수집/정제, AI 모델링, 저작도구 개발 ㈜이펙트원 데이터 획득/수집/정제 ㈜하이지노 데이터 획득/수집 데이터 관련 문의처
데이터 관련 문의처 담당자명 전화번호 이메일 김지빈 02-830-8583 kjb@humanf.co.kr 이태윤 02-830-8583 lty@humanf.co.kr AI모델 관련 문의처
AI모델 관련 문의처 담당자명 전화번호 이메일 김강민 062-715-5356 kgmin156@gm.gist.ac.kr 이상범 062-715-5356 saturnbum@gmail.com 저작도구 관련 문의처
저작도구 관련 문의처 담당자명 전화번호 이메일 김강민 062-715-5356 kgmin156@gm.gist.ac.kr 남동우 062-715-5356 77ndw77@gmail.com
-
인터넷과 물리적으로 분리된 온라인·오프라인 공간으로 의료 데이터를 포함하여 보안 조치가 요구되는 데이터를 다운로드 없이 접근하고 분석 가능
* 온라인 안심존 : 보안이 보장된 온라인 네트워크를 통해 집, 연구실, 사무실 등 어디서나 접속하여 데이터에 접근하고 분석
* 오프라인 안심존 : 추가적인 보안이 필요한 데이터를 대상으로 지정된 물리적 공간에서만 접속하여 데이터에 접근하고 분석 -
- AI 허브 접속
신청자 - 안심존
사용신청신청자신청서류 제출* - 심사구축기관
- 승인구축기관
- 데이터 분석 활용신청자
- 분석모델반출신청자
- AI 허브 접속
-
1. 기관생명윤리위원회(IRB) 심의 결과 통지서 [IRB 알아보기] [공용IRB 심의신청 가이드라인]
2. 기관생명윤리위원회(IRB) 승인된 연구계획서
3. 신청자 소속 증빙 서류 (재직증명서, 재학증명서, 근로계약서 등 택1)
4. 안심존 이용 신청서 [다운로드]
5. 보안서약서 [다운로드]
※ 상기 신청서 및 첨부 서류를 완비한 후 신청을 진행하셔야 정상적으로 절차가 이루어집니다. -
신청 및 이용관련 문의는 safezone1@aihub.kr 또는 02-525-7708, 7709로 문의
데이터셋 다운로드 승인이 완료 된 후 API 다운로드 서비스를 이용하실 수 있습니다.
API 다운로드 파일은 분할 압축되어 다운로드 됩니다. 분할 압축 해제를 위해서는 분할 압축 파일들의 병합이 필요하며 리눅스 명령어 사용이 필요합니다.
리눅스 OS 계열에서 다운로드 받으시길 권장하며 윈도우에서 파일 다운로드 시 wsl(리눅스용 윈도우 하위 시스템) 설치가 필요합니다.
※ 파일 병합 리눅스 명령어
find "폴더경로" -name "파일명.zip.part*" -print0 | sort -zt'.' -k2V | xargs -0 cat > "파일명.zip"
- 해당 명령어 실행 시, 실행 경로 위치에 병합 압축 파일이 생성됩니다.
- 병합된 파일 용량이 0일 경우, 제대로 병합이 되지 않은 상태이니 "폴더경로"가 제대로 입력되었는지 확인 부탁드립니다.
※ 데이터셋 소개 페이지에서 다운로드 버튼 클릭하여 승인이 필요합니다.
오프라인 데이터 이용 안내
본 데이터는 K-ICT 빅데이터센터에서도 이용하실 수 있습니다.
다양한 데이터(미개방 데이터 포함)를 분석할 수 있는 오프라인 분석공간을 제공하고 있습니다.
데이터 안심구역 이용절차 및 신청은 K-ICT빅데이터센터 홈페이지를 참고하시기 바랍니다.
국방데이터 개방 안내
본 데이터는 국방데이터로 군사 보안에 따라 AI허브에서 데이터를 제공하지 않으며,
군 담당자를 통한 별도의 사용 신청이 필요합니다.