콘텐츠로 건너뛰기 메뉴로 건너뛰기 푸터로 건너뛰기
데이터를 불러오고 있습니다
데이터를 저장하고 있습니다
#자연어 #로보틱스

BETA 가정환경 사람-로봇 공유 작업 데이터

가정환경 사람-로봇 공유 작업 데이터 아이콘 이미지
  • 분야로보틱스
  • 유형 3D , 이미지 , 텍스트
  • 생성 방식LMM
구축년도 : 2024 갱신년월 : 2025-04 조회수 : 167 다운로드 : 2 용량 :
샘플 데이터 ?

샘플데이터는 데이터의 이해를 돕기 위해 별도로 가공하여 제공하는 정보로써 원본 데이터와 차이가 있을 수 있으며,
데이터에 따라서 민감한 정보는 일부 마스킹(*) 처리가 되어 있을 수 있습니다.

※ 25년 신규 개방되는 데이터로, 데이터 활용성 검토, 이용자 관점의 개선의견 수렴 등을 통해 수정/보완될 수 있으며 최종데이터, 샘플데이터, 산출물 등은 변경될 수 있습니다.

※ 내국인만 데이터 신청이 가능합니다.

  • 데이터 변경이력

    데이터 변경이력
    버전 일자 변경내용 비고
    1.0 2025-04-16 데이터 개방 Beta Version

    데이터 히스토리

    데이터 히스토리
    일자 변경내용 비고
    2025-04-16 산출물 전체 공개

    소개

    가사 등 가정환경 사람-로봇 간 공유 작업을 위한 VLM(Vison-Language Model) 기반 미세조정(Fine-tuning) 데이터

    구축목적

    - 가정환경 내 로봇 활용의 확대 
    - 사람-로봇 공유 작업을 위한 표준화된 이미지-텍스트 벤치마크
  • 데이터 구축 규모
     - 3D CAD 스캔데이터 200세트(*.obj, *.mtl, *.png, *.json)
     - 실제/가상 환경 촬영 데이터 100,190세트(*.png, *.npy, *.json)

     

    데이터 분포

    데이터 분포
    구분 내용
    이미지캡션
    중복성
    유사도
    0%
    이미지캡션
    어절 수
    9,266,844개
    촬영 조도
    분포
    구분 구성비
    0~999 5%
    1,000~1,999 36%
    2,000~3,000 60%
    3D 물체
    대분류 분포
    구분 구성비
    생활용품 19%
    식품 22.92%
    주방용품 25.09%
    잡화 27.98%
    욕실용품 5.01%
    촬영 각도
    분포
    구분 구성비
    각도조건1
    (0°~30°)
    32.45%
    각도조건2
    (30°~60°)
    33.36%
    각도조건3
    (60°~90°)
    34.19%
    실제 환경 촬영
    이미지 수
    10,000건
    가상 환경 촬영
    이미지 수
    90,190건
    3D 물체
    종류 수
    200종
    이미지캡션
    문장 수
    500,950개
    이미지캡션
    토큰 수
    9,266,844개
  • 저작도구 설명서 및 저작도구 다운로드

    저작도구 설명서 다운로드 저작도구 다운로드
  • AI 모델 상세 설명서 다운로드

    AI 모델 상세 설명서 다운로드 AI 모델 다운로드

    [참조 물체 위치 검출 (Referring Expression Comprehension)] - PolyFormer

    [참조 물체 위치 검출 (Referring Expression Comprehension)] - PolyFormer

    - "Polyformer: Referring image segmentation as sequential polygon generation." CVPR 2023
    - 선정 사유: 기존 픽셀 레벨로 해결한 다른 모델과 다른 접근이 polygon을 예측하는 방식을 픽셀 레벨로 문제를 해결한 다른 모델의 모듈과 함께 사용해 성능을 향상하고자 선정
    - 특징: 기존 픽셀레벨로 해결했던 segmentatio 및 detection 문제를 polygon을 예측하는 문제로 바꾸어 문제를 해결함. 이를 위해 regression-based transformer decoder를 제안
    - AI 모델 적용 인공지능 활용 예시: 물체의 정확한 형상까지 원하는 경우가 아닌 경우 더 높은 정확도로 물체가 놓여 있는 위치를 검출할 수 있기 때문에 목표 물체까지의 로봇 내비게이션과 같은 작업에 사용될 수 있음

     

    [참조 이미지 분할 (Referring Image Segmentation)] - LAVT

    [참조 이미지 분할 (Referring Image Segmentation)] - LAVT

    - LAVT: Language-Aware Vision Transformer for Referring Image Segmentation, CVPR, 2022
    - RIS 태스크를 수행할 수 있는 모델
    - 선정 사유: 2024년 기준 RIS 최고 성능 모델
    - 특징: 이미지 transformer에 언어 인코더에서 나온 특징을 직접적으로 사용
    - AI 모델 적용 인공지능 활용 예시: 로봇이 가정환경에서 사람과 함께 작업할 때, 물체의 공식적 명칭뿐 아니라 물체의 특징(크기, 색상, 위치 등)을 통한 표현을 통해서도 물체를 인식하고 협력 작업에 활용

  • 설명서 및 활용가이드 다운로드

    데이터 설명서 다운로드 구축활용가이드 다운로드

    데이터 구성

    데이터 구성
    Key Description 타입
    images 이미지 정보 Dictionary
    file_name RGB 파일명 String
    depth_file_name Depth 파일명 String
    height RGB 이미지 높이 Int
    width RGB 이미지 넓이 Int
    depth_height Depth 이미지 높이 Int
    depth_width Depth 이미지 넓이 Int
    id 이미지 식별 ID Int
    camera_info 카메라 정보 Dictionary
    depth_scale 깊이 정보 Int
    camera_type 카메라 종류 String
    environment 촬영 환경 String
    working_stage 작업 단계 String
    luminous_intensity 조도 Int
    angle_type 각도 종류 String
    annotiations 어노테이션 정보 List of Dictionary
    segmentation 이미지 세그멘테이션 정보 Dictionary
    counts 런 렝스 부호화
    (Run-length encoding, RLE)
    압축방식을 사용한 마스크 정보
    RLE
    size RLE 적용되는 이미지 크기 List of Int
    area RLE 적용되는 마스크 영역 크기 Float
    bbox BBox 좌표값 List of Int
    category_id 물체 클래스 ID 번호 Int
    referring_expression 캡션 문장 String
    token 캡션 토큰 변환 형태 List of String
    token_length 토큰 길이 Int
    categories 물체 카테고리 정보 List of Dictionary
    supercategory 물체 용도 분류 String
    usage_id 물체 용도 분류 번호 Int
    name 물체 영문 이름 String
    korean_name 물체 국문 이름 String

     

    어노테이션 포맷

    어노테이션 포맷
    No 항목 한글명 항목 영문명 타입 필수여부 작성예시
    1 이미지 정보 images Dictionary Y -
      1.01 파일 이름  file_name String Y "000050_000002.png"
    1.02 깊이 파일 이름 depth_file_name String Y "000050_000002.npy"
    1.03 높이 height Int Y 1080
    1.04 너비 width Int Y 1920
    1.05 깊이 높이 depth_height Int Y 1024
    1.06 깊이 너비 depth_width Int Y 1024
    1.07 이미지ID id Int Y 30932
    1.08 카메라 정보 camera_info Dictionary Y -
      1.08.01 깊이 정보 스케일 depth_scale Int Y 10
      1.08.02 카메라 타입 camera_type String Y "azure_kinect"
    1.09 환경 environment String Y "home01"
    1.1 작업단계 working_stage String Y "ready"
    1.11 조도 luminous_intensity Int Y 1000
    1.12 각도조건 angle_type String Y “각도조건1”
    2 라벨링 정보 annotiations List of Dictionary Y -
      2.01 물체 마스크 segmentation Dictionary Y  
    -
      2.01.01 마스크 RLE counts RLE Y “cUeU12eQ14M3L4M3L4L4M
    3L4L5L3L4M3L4L4M3L4L4M3
    L3N1N3M2O1N2O2M2N2O
    1N3M2O1N2O2M2N2O1000
    000O1000000O2O000O1000
    000O1000001N10000O10000
    00O101O000O10000O10000
    00O2O00000O10`Th`0"
      2.01.02 마스크 크기 size List of Int Y [1080, 1920]
    2.02 영역 area Float Y 620
    2.03 그룹 라벨링 여부 iscrowd Int Y 0
    2.04 이미지ID image_id Int Y 30932
    2.05 바운딩 박스 bbox List of Int Y [
    100,
    50,
    38,
    28
    ]
    2.06 카테고리 ID category_id Int Y 127
    2.07 주석 ID id Int Y 154663
    2.08 지칭 문장 referring_expression String Y "가방에 넣어 다닐 수 있는 물티슈를 건네줘"
    2.09 토큰 token List of String Y [
    "▁가방",
    "에",
    "▁넣어",
    "▁다",
    "닐",
    "▁수",
    "▁있는",
    "▁물",
    "티",
    "슈",
    "를",
    "▁건",
    "네",
    "줘“
    ]
    2.1 토큰 길이 token_length Int Y 14
    3 카테고리 정보 categories List of Dictionary Y -
      3.01 슈퍼 클래스 supercategory String Y "Daily supplies"
    3.02 물체ID category_id Int Y 16
    3.03 용도 usage_id Int Y 3
    3.04 물체 영문 이름 name String Y "Wet tissue"
    3.05 물체 한글 이름 korean_name String Y “물티슈”
    3.06 무게 weight Float Y 0.1

     

    데이터 포맷(물체 세그멘테이션, 텍스트 라벨링)

    데이터 포맷(물체 세그멘테이션, 텍스트 라벨링)

    json 예시

    {
        "images": {
            "file_name": "008037_000000.png",
            "depth_file_name": "008037_000000.npy",
            "height": 1080,
            "width": 1920,
            "depth_height": 1024,
            "depth_width": 1024,
            "id": 2008037000000,
            "camera_info": {
                "depth_scale": 10,
                "camera_type": "azure_kinect"
            },
            "environment": "living_01",
            "working_stage": "ready",
            "luminous_intensity": 1150,
            "camera_angle": "각도조건3"
        },
        "annotations": [
            {
                "segmentation": {
                    "counts":
    "Zdm`0                 "size": [
                        1080,
                        1920
                    ]
                },
                "area": 58520.0,
                "iscrowd": 0,
                "image_id": 2008037000000,
                "bbox": [
                    513,
                    426,
                    821,
                    616
                ],
                "category_id": 4,
                "id": 2008037000000,
                "referring_expression": "저 은색 납작한 형태의 노트북을 위쪽으로 빨리 가져와",
                "token": [
                    "▁저",
                    "▁",
                    "은",
                    "색",
                    "▁",
                    "납",
                    "작",
                    "한",
                    "▁형태",
                    "의",
                    "▁노트북",
                    "을",
                    "▁위",
                    "쪽으로",
                    "▁빨리",
                    "▁가져",
                    "와"
                ],
                "token_length": 17
            },...        
        ],
        "categories": [
            {
                "supercategory": "Daily supplies",
                "category_id": 4,
                "usage_id": 1,
                "name": "Laptop",
                "korean_name": "노트북",
                "weight": 1.0
            },...        
        ]
    }

  • 데이터셋 구축 담당자

    수행기관(주관) : ㈜미디어그룹사람과숲
    수행기관(주관)
    책임자명 전화번호 대표이메일 담당업무
    김지빈 02-830-8584 kjb@humanf.co.kr 데이터 가공/검수
    수행기관(참여)
    수행기관(참여)
    기관명 담당업무
    광주과학기술원 데이터 획득/수집/정제, AI 모델링, 저작도구 개발
    ㈜이펙트원 데이터 획득/수집/정제
    ㈜하이지노 데이터 획득/수집
    데이터 관련 문의처
    데이터 관련 문의처
    담당자명 전화번호 이메일
    김지빈 02-830-8583 kjb@humanf.co.kr
    이태윤 02-830-8583 lty@humanf.co.kr
    AI모델 관련 문의처
    AI모델 관련 문의처
    담당자명 전화번호 이메일
    김강민 062-715-5356 kgmin156@gm.gist.ac.kr
    이상범 062-715-5356 saturnbum@gmail.com
    저작도구 관련 문의처
    저작도구 관련 문의처
    담당자명 전화번호 이메일
    김강민 062-715-5356 kgmin156@gm.gist.ac.kr
    남동우 062-715-5356 77ndw77@gmail.com
보건의료 데이터 개방 안내

보건의료 데이터는 온라인 및 오프라인 안심존을 통해 개방됩니다.

안심존이란 안심존 이용메뉴얼 안심존 이용신청 데이터 열람신청
  • 인터넷과 물리적으로 분리된 온라인·오프라인 공간으로 의료 데이터를 포함하여 보안 조치가 요구되는 데이터를 다운로드 없이 접근하고 분석 가능
    * 온라인 안심존 : 보안이 보장된 온라인 네트워크를 통해 집, 연구실, 사무실 등 어디서나 접속하여 데이터에 접근하고 분석
    * 오프라인 안심존 : 추가적인 보안이 필요한 데이터를 대상으로 지정된 물리적 공간에서만 접속하여 데이터에 접근하고 분석

    1. AI 허브 접속
      신청자
    2. 안심존
      사용신청
      신청자신청서류 제출*
    3. 심사구축기관
    4. 승인구축기관
    5. 데이터 분석 활용신청자
    6. 분석모델반출신청자
  • 1. 기관생명윤리위원회(IRB) 심의 결과 통지서 [IRB 알아보기] [공용IRB 심의신청 가이드라인]
    2. 기관생명윤리위원회(IRB) 승인된 연구계획서
    3. 신청자 소속 증빙 서류 (재직증명서, 재학증명서, 근로계약서 등 택1)
    4. 안심존 이용 신청서 [다운로드]
    5. 보안서약서 [다운로드]
    ※ 상기 신청서 및 첨부 서류를 완비한 후 신청을 진행하셔야 정상적으로 절차가 이루어집니다.

  • 신청 및 이용관련 문의는 safezone1@aihub.kr 또는 02-525-7708, 7709로 문의

데이터셋 다운로드 승인이 완료 된 후 API 다운로드 서비스를 이용하실 수 있습니다.

API 다운로드 파일은 분할 압축되어 다운로드 됩니다. 분할 압축 해제를 위해서는 분할 압축 파일들의 병합이 필요하며 리눅스 명령어 사용이 필요합니다.

리눅스 OS 계열에서 다운로드 받으시길 권장하며 윈도우에서 파일 다운로드 시 wsl(리눅스용 윈도우 하위 시스템) 설치가 필요합니다.

※ 파일 병합 리눅스 명령어

find "폴더경로" -name "파일명.zip.part*" -print0 | sort -zt'.' -k2V | xargs -0 cat > "파일명.zip"

- 해당 명령어 실행 시, 실행 경로 위치에 병합 압축 파일이 생성됩니다.

- 병합된 파일 용량이 0일 경우, 제대로 병합이 되지 않은 상태이니 "폴더경로"가 제대로 입력되었는지 확인 부탁드립니다.

※ 데이터셋 소개 페이지에서 다운로드 버튼 클릭하여 승인이 필요합니다.

오프라인 데이터 이용 안내

본 데이터는 K-ICT 빅데이터센터에서도 이용하실 수 있습니다.

K-ICT 빅데이터센터는 데이터 안심구역으로 지정되어
다양한 데이터(미개방 데이터 포함)를 분석할 수 있는 오프라인 분석공간을 제공하고 있습니다.

데이터 안심구역 이용절차 및 신청은 K-ICT빅데이터센터 홈페이지를 참고하시기 바랍니다.

국방데이터 이용신청 탭 이미지

국방데이터 개방 안내

본 데이터는 국방데이터로 군사 보안에 따라 AI허브에서 데이터를 제공하지 않으며,
군 담당자를 통한 별도의 사용 신청이 필요합니다.