콘텐츠로 건너뛰기 메뉴로 건너뛰기 푸터로 건너뛰기
데이터를 불러오고 있습니다
데이터를 저장하고 있습니다
#자연어 #로보틱스

BETA 제조환경 사람-로봇 공유 작업 데이터

제조환경 사람-로봇 공유 작업 데이터 아이콘 이미지
  • 분야로보틱스
  • 유형 3D , 이미지 , 텍스트
  • 생성 방식LMM
구축년도 : 2024 갱신년월 : 2025-04 조회수 : 179 다운로드 : 3 용량 :
샘플 데이터 ?

샘플데이터는 데이터의 이해를 돕기 위해 별도로 가공하여 제공하는 정보로써 원본 데이터와 차이가 있을 수 있으며,
데이터에 따라서 민감한 정보는 일부 마스킹(*) 처리가 되어 있을 수 있습니다.

※ 25년 신규 개방되는 데이터로, 데이터 활용성 검토, 이용자 관점의 개선의견 수렴 등을 통해 수정/보완될 수 있으며 최종데이터, 샘플데이터, 산출물 등은 변경될 수 있습니다.

※ 내국인만 데이터 신청이 가능합니다.

  • 데이터 변경이력

    데이터 변경이력
    버전 일자 변경내용 비고
    1.0 2025-04-16 데이터 개방 Beta Version

    데이터 히스토리

    데이터 히스토리
    일자 변경내용 비고
    2025-04-16 산출물 전체 공개

    소개

    제조, 물류 등 작업이 필요한 산업 현장에서 사람-로봇 간 공유 작업을 위한 VLM(Vison-Language Model) 기반 미세조정(Fine-tuning) 데이터

    구축목적

    - 로봇을 적극 도입하는 물류 자동화 기술의 고도화 
    - 사람-로봇 공유 작업을 위한 표준화된 이미지-텍스트 벤치마크
  • 데이터 구축 규모
     - 3D CAD 스캔데이터 200세트(*.obj, *.mtl, *.png, *.json)
     - 실제/가상 환경 촬영 데이터 100,000세트(*.png, *.npy, *.json)

     

    데이터 분포

    데이터 분포
    구분 내용
    이미지캡션
    중복성
    유사도
    0%
    이미지캡션
    어절 수
    9,928,340개
    촬영 조도
    분포 
    구분 구성비
    0~999 39%
    1,000~1,999 52%
    2,000~3,000 9%
    3D 물체
    대분류 분포
    구분 구성비
    도구 및 장비 41.84%
    자재 및 부품 30.42%
    보관 및 포장 11.27%
    안전 및 보호 9.47%
    기타 물품 7.00%
    촬영 각도
    분포
    구분 구성비
    각도조건1
    (0°~30°)
    34%
    각도조건2
    (30°~60°)
    34%
    각도조건3
    (60°~90°)
    32%
    실제 환경 촬영
    이미지 수
    10,000건
    가상 환경 촬영
    이미지 수
    90,000건
    3D 물체
    종류 수
    200종
    이미지캡션
    문장 수
    500,000개
    이미지캡션
    토큰 수
    9,928,340개
  • 저작도구 설명서 및 저작도구 다운로드

    저작도구 설명서 다운로드 저작도구 다운로드
  • AI 모델 상세 설명서 다운로드

    AI 모델 상세 설명서 다운로드 AI 모델 다운로드

    [참조 물체 위치 검출 (Referring Expression Comprehension)] - PolyFormer

    참조 물체 위치 검출 (Referring Expression Comprehension) - PolyFormer

    - "Polyformer: Referring image segmentation as sequential polygon generation." CVPR 2023
    - 선정 사유: 기존 픽셀 레벨로 해결한 다른 모델과 다른 접근이 polygon을 예측하는 방식을 픽셀 레벨로 문제를 해결한 다른 모델의 모듈과 함께 사용해 성능을 향상하고자 선정
    - 특징: 기존 픽셀 레벨로 해결했던 segmentatio 및 detection 문제를 polygon을 예측하는 문제로 바꾸어 문제를 해결함. 이를 위해 regression-based transformer decoder를 제안
    - AI 모델 적용 인공지능 활용 예시: 물체의 정확한 형상까지 원하는 경우가 아닌 경우 더 높은 정확도로 물체가 놓여 있는 위치를 검출할 수 있기 때문에 목표 물체까지의 로봇 내비게이션과 같은 작업에 사용될 수 있음

     

    [참조 이미지 분할 (Referring Image Segmentation)] - LAVT

    참조 이미지 분할 (Referring Image Segmentation) - LAVT
    - LAVT: Language-Aware Vision Transformer for Referring Image Segmentation, CVPR, 2022
    - RIS 태스크를 수행할 수 있는 모델
    - 선정 사유: 2024년 기준 RIS 최고 성능 모델
    - 특징: 이미지 transformer에 언어 인코더에서 나온 특징을 직접적으로 사용
    - AI 모델 적용 인공지능 활용 예시: 로봇이 제조/물류 환경에서 사람과 함께 작업할 때, 물체의 공식적 명칭뿐 아니라 물체의 특징(크기, 색상, 위치 등)을 통한 표현을 통해서도 물체를 인식하고 협력 작업에 활용

  • 설명서 및 활용가이드 다운로드

    데이터 설명서 다운로드 구축활용가이드 다운로드

    데이터 구성

    데이터 구성
    Key Description 타입
    images 이미지 정보 Dictionary
    file_name RGB 파일명 String
    depth_file_name Depth 파일명 String
    height RGB 이미지 높이 Int
    width RGB 이미지 넓이 Int
    depth_height Depth 이미지 높이 Int
    depth_width Depth 이미지 넓이 Int
    id 이미지 식별 ID Int
    camera_info 카메라 정보 Dictionary
    depth_scale 깊이 정보 Int
    camera_type 카메라 종류 String
    environment 촬영 환경 String
    working_stage 작업 단계 String
    luminous_intensity 조도 Int
    angle_type 각도 종류 String
    annotiations 어노테이션 정보 List of Dictionary
    segmentation 이미지 세그멘테이션 정보 Dictionary
    counts 런 렝스 부호화
    (Run-length encoding, RLE)
    압축방식을 사용한 마스크 정보
    RLE
    size RLE 적용되는 이미지 크기 List of Int
    area RLE 적용되는 마스크 영역 크기 Float
    bbox BBox 좌표값 List of Int
    category_id 물체 클래스 ID 번호 Int
    referring_expression 캡션 문장 String
    token 캡션 토큰 변환 형태 List of String
    token_length 토큰 길이 Int
    categories 물체 카테고리 정보 List of Dictionary
    supercategory 물체 용도 분류 String
    usage_id 물체 용도 분류 번호 Int
    name 물체 영문 이름 String
    korean_name 물체 국문 이름 String

     

    어노테이션 포맷

    어노테이션 포맷
    No 항목 한글명 항목 영문명 타입 필수여부 작성예시
    1 이미지 정보 images Dictionary Y -
      1.01 파일 이름  file_name String Y "000050_000002.png"
    1.02 깊이 파일 이름 depth_file_name String Y "000050_000002.npy"
    1.03 높이 height Int Y 1080
    1.04 너비 width Int Y 1920
    1.05 깊이 높이 depth_height Int Y 1024
    1.06 깊이 너비 depth_width Int Y 1024
    1.07 이미지ID id Int Y 30932
    1.08 카메라 정보 camera_info Dictionary Y -
      1.08.01 깊이 정보 스케일 depth_scale Int Y 10
      1.08.02 카메라 타입 camera_type String Y "azure_kinect"
    1.09 환경 environment String Y "home01"
    1.1 작업단계 working_stage String Y "ready"
    1.11 조도 luminous_intensity Int Y 1000
    1.12 각도조건 angle_type String Y “각도조건1”
    2 라벨링 정보 annotiations List of Dictionary Y -
      2.01 물체 마스크 segmentation Dictionary Y  
    -
      2.01.01 마스크 RLE counts RLE Y

    “cUeU12eQ14M3L4M3L

    4L4M3L4L5L3L4M3L4L4

    M3L4L4M3L3N1N3M2O

    1N2O2M2N2O1N3M2O

    1N2O2M2N2O1000000

    O1000000O2O000O10

    00000O1000001N10000

    O1000000O101O000O

    10000O1000000O2O00000O

    10`Th`0"

      2.01.02 마스크 크기 size List of Int Y [1080, 1920]
    2.02 영역 area Float Y 620
    2.03 그룹 라벨링 여부 iscrowd Int Y 0
    2.04 이미지ID image_id Int Y 30932
    2.05 바운딩 박스 bbox List of Int Y [
    100,
    50,
    38,
    28
    ]
    2.06 카테고리 ID category_id Int Y 127
    2.07 주석 ID id Int Y 154663
    2.08 지칭 문장 referring_expression String Y "주황색 금속 형질로 보이는 가스디퓨저 좀 집어와"
    2.09 토큰 token List of String Y [
    "▁주",
    "황",
    "색",
    "▁금",
    "속",
    "▁형",
    "질",
    ‘로",
    "▁보이는",
    "▁",
    "가스",
    "디",
    "퓨",
    "저",
    "▁좀",
    "▁집",
    "어",
    "와"
    ]
    2.1 토큰 길이 token_length Int Y 18
    3 카테고리 정보 categories List of Dictionary Y -
      3.01 슈퍼 클래스 supercategory String Y "Tool"
    3.02 물체ID category_id Int Y 127
    3.03 용도 usage_id Int Y 3
    3.04 물체 영문 이름 name String Y "Gas diffuser"
    3.05 물체 한글 이름 korean_name String Y “가스디퓨저”
    3.06 무게 weight Float Y 0.3

     

    데이터 포맷(물체 세그멘테이션, 텍스트 라벨링)

    데이터포맷(물체 세그멘테이션, 텍스트 라벨링)

    json 예시

    {
        "images": {
            "file_name": "000271_000002.png",
            "depth_file_name": "000271_000002.npy",
            "height": 1080,
            "width": 1920,
            "depth_height": 1024,
            "depth_width": 1024,
            "id": 1000271000002,
            "camera_info": {
                "depth_scale": 10,
                "camera_type": "azure_kinect"
            },
            "environment": "factory_r_00",
            "working_stage": "ready",
            "luminous_intensity": 1720,
        "camera_angle":  "각도조건2"
        },
        "annotations": [
            {
                "segmentation": {
                    "counts":
    "bn`e08_Q13M2O1N1O2O001O00100O010O010O10O010O01onN@iP1?WoNDfP1=YoNChP1=WoNDhP1                 "size": [
                        1080,
                        1920
                    ]
                },
                "area": 2671.0,
                "iscrowd": 0,
                "image_id": 1000271000002,
                "bbox": [
                    653,
                    246,
                    94,
                    63
                ],
                "category_id": 2,
                "id": 1000271000002,
                "referring_expression": "이 긴 모양의 가스토치는 미술 작업에서 녹여야 하는 재료를 가열할 때 유용한 물건입니다",
                "token": [
                    "▁이",
                    "▁긴",
                    "▁모양",
                    "의",
                    "▁",
                    "가스",
                    "토",
                    "치는",
                    "▁",
                    "미술",
                    "▁작업",
                    "에서",
                    "▁녹",
                    "여",
                    "야",
                    "▁하는",
                    "▁재",
                    "료",
                    "를",
                    "▁가",
                    "열",
                    "할",
                    "▁때",
                    "▁유용한",
                    "▁물건",
                    "입니다"
                ],
                "token_length": 26
            },  ...
        ],
        "categories": [
            {
                "supercategory": "Tools",
                "category_id": 2,
                "usage_id": 0,
                "name": "Gas torch",
                "korean_name": "가스토치",
                "weight": 1.0
            } ...
        ]
    }

  • 데이터셋 구축 담당자

    수행기관(주관) : ㈜미디어그룹사람과숲
    수행기관(주관)
    책임자명 전화번호 대표이메일 담당업무
    김지빈 02-830-8584 kjb@humanf.co.kr 데이터 가공/검수
    수행기관(참여)
    수행기관(참여)
    기관명 담당업무
    광주과학기술원 데이터 획득/수집/정제, AI 모델링, 저작도구 개발
    ㈜이펙트원 데이터 획득/수집/정제
    ㈜하이지노 데이터 획득/수집
    데이터 관련 문의처
    데이터 관련 문의처
    담당자명 전화번호 이메일
    김지빈 02-830-8583 kjb@humanf.co.kr
    이태윤 02-830-8583 lty@humanf.co.kr
    AI모델 관련 문의처
    AI모델 관련 문의처
    담당자명 전화번호 이메일
    김강민 062-715-5356 kgmin156@gm.gist.ac.kr
    이상범 062-715-5356 saturnbum@gmail.com
    저작도구 관련 문의처
    저작도구 관련 문의처
    담당자명 전화번호 이메일
    김강민 062-715-5356 kgmin156@gm.gist.ac.kr
    남동우 062-715-5356 77ndw77@gmail.com
보건의료 데이터 개방 안내

보건의료 데이터는 온라인 및 오프라인 안심존을 통해 개방됩니다.

안심존이란 안심존 이용메뉴얼 안심존 이용신청 데이터 열람신청
  • 인터넷과 물리적으로 분리된 온라인·오프라인 공간으로 의료 데이터를 포함하여 보안 조치가 요구되는 데이터를 다운로드 없이 접근하고 분석 가능
    * 온라인 안심존 : 보안이 보장된 온라인 네트워크를 통해 집, 연구실, 사무실 등 어디서나 접속하여 데이터에 접근하고 분석
    * 오프라인 안심존 : 추가적인 보안이 필요한 데이터를 대상으로 지정된 물리적 공간에서만 접속하여 데이터에 접근하고 분석

    1. AI 허브 접속
      신청자
    2. 안심존
      사용신청
      신청자신청서류 제출*
    3. 심사구축기관
    4. 승인구축기관
    5. 데이터 분석 활용신청자
    6. 분석모델반출신청자
  • 1. 기관생명윤리위원회(IRB) 심의 결과 통지서 [IRB 알아보기] [공용IRB 심의신청 가이드라인]
    2. 기관생명윤리위원회(IRB) 승인된 연구계획서
    3. 신청자 소속 증빙 서류 (재직증명서, 재학증명서, 근로계약서 등 택1)
    4. 안심존 이용 신청서 [다운로드]
    5. 보안서약서 [다운로드]
    ※ 상기 신청서 및 첨부 서류를 완비한 후 신청을 진행하셔야 정상적으로 절차가 이루어집니다.

  • 신청 및 이용관련 문의는 safezone1@aihub.kr 또는 02-525-7708, 7709로 문의

데이터셋 다운로드 승인이 완료 된 후 API 다운로드 서비스를 이용하실 수 있습니다.

API 다운로드 파일은 분할 압축되어 다운로드 됩니다. 분할 압축 해제를 위해서는 분할 압축 파일들의 병합이 필요하며 리눅스 명령어 사용이 필요합니다.

리눅스 OS 계열에서 다운로드 받으시길 권장하며 윈도우에서 파일 다운로드 시 wsl(리눅스용 윈도우 하위 시스템) 설치가 필요합니다.

※ 파일 병합 리눅스 명령어

find "폴더경로" -name "파일명.zip.part*" -print0 | sort -zt'.' -k2V | xargs -0 cat > "파일명.zip"

- 해당 명령어 실행 시, 실행 경로 위치에 병합 압축 파일이 생성됩니다.

- 병합된 파일 용량이 0일 경우, 제대로 병합이 되지 않은 상태이니 "폴더경로"가 제대로 입력되었는지 확인 부탁드립니다.

※ 데이터셋 소개 페이지에서 다운로드 버튼 클릭하여 승인이 필요합니다.

오프라인 데이터 이용 안내

본 데이터는 K-ICT 빅데이터센터에서도 이용하실 수 있습니다.

K-ICT 빅데이터센터는 데이터 안심구역으로 지정되어
다양한 데이터(미개방 데이터 포함)를 분석할 수 있는 오프라인 분석공간을 제공하고 있습니다.

데이터 안심구역 이용절차 및 신청은 K-ICT빅데이터센터 홈페이지를 참고하시기 바랍니다.

국방데이터 이용신청 탭 이미지

국방데이터 개방 안내

본 데이터는 국방데이터로 군사 보안에 따라 AI허브에서 데이터를 제공하지 않으며,
군 담당자를 통한 별도의 사용 신청이 필요합니다.