콘텐츠로 건너뛰기 메뉴로 건너뛰기 푸터로 건너뛰기
데이터를 불러오고 있습니다
데이터를 저장하고 있습니다
#컴퓨터 비전 #로보틱스

BETA 물류공간 예측 데이터

물류공간 예측 데이터 아이콘 이미지
  • 분야교통물류
  • 유형 센서 , 이미지 , 텍스트
  • 생성 방식LMM
구축년도 : 2024 갱신년월 : 2025-04 조회수 : 246 다운로드 : 14 용량 :
샘플 데이터 ?

샘플데이터는 데이터의 이해를 돕기 위해 별도로 가공하여 제공하는 정보로써 원본 데이터와 차이가 있을 수 있으며,
데이터에 따라서 민감한 정보는 일부 마스킹(*) 처리가 되어 있을 수 있습니다.

※ 25년 신규 개방되는 데이터로, 데이터 활용성 검토, 이용자 관점의 개선의견 수렴 등을 통해 수정/보완될 수 있으며 최종데이터, 샘플데이터, 산출물 등은 변경될 수 있습니다

※ 내국인만 데이터 신청이 가능합니다.

  • 데이터 변경이력

    데이터 변경이력
    버전 일자 변경내용 비고
    1.0 2025-04-17 데이터 개방 Beta Version

    데이터 히스토리

    데이터 히스토리
    일자 변경내용 비고
    2025-04-17 산출물 전체 공개

    소개

    □ 물류 품목 표준화 및 물류공간 예측이 가능한 AI 학습용 입·출고 물품 이미지 및 품목 분류 데이터 구축

    구축목적

    □ 물류산업 디지털 전환을 가져다주는 두 가지 핵심 기술은 'AI'와 '로봇' 
    □ 창고 자동화는 초창기 자율이동로봇(AMR) 단순 도입 형태에서 최근 AI와 로봇을 결합하는 형태로 진화
    □ 본 과제를 통해 구축된 데이터를 활용하여 물류산업 디지털 전환 촉진 가속화
  • □ 데이터 구축 규모

    데이터 구축 규모
    RFP 제시량 원시데이터 수량 원천데이터 수량 라벨링 데이터 수량
    입출고 물품 이미지
    / 물품 분류 표준화를 위한 품목 분류
    데이터 8만건 이상
    RGB 이미지 124,999장 RGB 이미지 122,378장 가공 데이터 122,378건
    ※ (입고물품)이미지 캡션 60,512건

     

    □ 입고 물품 규격 분포

    입고 물품 규격 분포
    구분 비율(%) 수량(건)
    극소형 81.41 49,261
    소형 11.74 7,108
    중형 3.75 2,272
    대형 1.98 1,196
    특대형 0.8 484
    특수 0.32 191
    합계 100 60,512

     

    □ 출고 물품 규격 분포

    출고 물품 규격 분포
    구분 비율(%) 수량(건)
    극소형 45.31 28,032
    소형 30.68 18,981
    중형 13.19 8,159
    대형 4.85 3,000
    특대형 4.52 2,795
    특수 1.45 899
    합계 100 61,866

     

    □ 캡션 어절 수

    캡션 어절 수
    어절 수 비율(%) 수량(건)
    28 0.07% 43
    29 0.29% 175
    30 0.65% 394
    31 1.10% 664
    32 1.39% 842
    33 1.89% 1,146
    34 3.29% 1,991
    35 4.32% 2,612
    36 4.73% 2,861
    37 5.29% 3,203
    38 5.63% 3,407
    39 6.60% 3,993
    40 7.27% 4,401
    41 6.95% 4,207
    42 6.48% 3,919
    43 5.55% 3,361
    44 5.73% 3,465
    45 5.06% 3,063
    46 4.25% 2,574
    47 3.69% 2,234
    48 2.58% 1,563
    49 2.26% 1,370
    50 2.11% 1,278
    51 1.59% 964
    52 1.53% 927
    53 1.30% 784
    54 1.10% 663
    55 1.04% 629
    56 1.00% 606
    57 0.80% 483
    58 0.72% 437
    59 0.57% 343
    60 0.51% 311
    61 0.47% 287
    62 0.38% 231
    63 0.31% 185
    64 0.27% 162
    65 0.20% 124
    66 0.18% 108
    67 0.19% 114
    68 0.12% 75
    69 0.09% 57
    70 0.08% 49
    71 0.09% 56
    72 0.05% 33
    73 0.05% 28
    74 0.04% 23
    75 0.03% 19
    76 0.02% 12
    77 0.01% 8
    78 0.01% 7
    79 0.01% 7
    80 0.00% 3
    81 0.01% 5
    82 0.00% 2
    83 0.00% 1
    84 0.00% 1
    85 0.00% 2
    합계 100 60,512

     

    □ 입고 물품 형태 분포

    입고 물품 형태 분포
    구분 비율(%) 수량(건)
    비정형 78.95 47,775
    정형 21.05 12,737
    합계 100 60,512

     

    □ 출고 물품 형태 분포

    출고 물품 형태 분포
    구분 비율(%) 수량(건)
    정형 100 61,866
    합계 100 61,866

     

    □ 입고 물품 중분류 분포

    입고 물품 중분류 분포
    중분류 비율(%) 수량(건)   중분류 비율(%) 수량(건)
    조미료 8.1 4,904   휴대폰액세서리 1 603
    유제품 0.08 46 영상가전 0.01 6
    축산가공식품 0.08 48 음향가전 0.72 435
    수산가공식품 0.64 390 멀티미디어장비 0.12 72
    대용식재료 0.39 233 주방가전 0.59 354
    통조림/병 2.5 1,510 건강/냉난방가전 0.29 174
    농산가공식품 0.25 150 생활가전 0.38 228
    절임/발효식품 0.94 567 카메라/캠코더용품 0.02 12
    분말류 2.15 1,304 가전주변기기 0.06 36
    즉석/편의식품 4.44 2,688 거실가구 0.04 24
    영유아식품 0.15 90 장식가구 0.4 243
    건강식품 0.04 24 인테리어소품 0.53 323
    과자류 2.88 1,743 주방가구 0.04 24
    음료류 3.79 2,294 침구단품 0.02 12
    빵류/떡류 0.19 114 커튼/블라인드 0.04 24
    커피/코코아 0.63 384 DIY용품 2.87 1,736
    차류 0.59 356 원예용품 0.71 428
    주류 3.61 2,182 패션의류 2.06 1,247
    기타가공식품 0.05 30 유아동의류 0.04 24
    농산물 1.39 840 스포츠웨어 0.01 6
    수산물 0.01 6 언더웨어 0.1 62
    위생용품 2.46 1,489 기타의류 0.04 24
    일용잡화 0.68 409 골프 0.06 36
    애완용품 2.26 1,368 야구 0.03 18
    자동차용품 3.02 1,825 배드민턴 0.09 54
    주방용품 16.54 10,007 축구 0.05 30
    청소/욕실용품 4.7 2,842 탁구 0.05 30
    세탁용품 1.79 1,086 테니스/스쿼시 0.01 6
    생활용품 6.84 4,136 등산 0.1 60
    수집품 0.03 18 자전거 0.28 168
    건강의료용품 0.06 36 오토바이/스쿠터 0.02 12
    공구 1.23 743 캠핑 1.34 811
    영유아용품 0.97 587 헬스 0.28 168
    화장품 1.84 1,112 스포츠액세서리 0.34 204
    기타일상용품 0.06 39 요가/필라테스 0.17 102
    의약외품 0.76 462 수상스포츠 0.03 18
    의료기기 0.03 18 롤러/보드 0.02 12
    의료용품 0.34 204 기타레저용품 0.08 48
    문구/사무용품 4.26 2,577 남성가방 0.1 60
    완구 2 1,213 남성신발 0.02 12
    서적 0.35 210 여성가방 0.37 225
    악기 0.02 12 여성신발 0.12 72
    음반 0.04 24 여행용가방/소품 0.05 30
    음반/비디오소모품 0.01 6 장갑 0.03 18
    기타교육/문화용품 0.01 6 지갑 0.1 60
    컴퓨터/주변기기 1.33 804 패션소품 0.59 359
    PC액세서리 0.05 30 신발용품 0.18 108
    네트워크장비 0.05 30 유야동패션잡화 0.03 18
    노트북액세서리 0.06 36 양말 0.06 38
    통신가전 0.31 190 유니섹스신발 0.36 216
          합계 100 60,512

     

    □ 출고 물품 중분류 분포

    출고 물품 중분류 분포
    중분류 비율(%) 수량(건)   중분류 비율(%) 수량(건)
    조미료 3.16 1,957   문구/사무용품 1.14 704
    유제품 0.61 378 완구 0.15 90
    축산가공식품 0.72 444 컴퓨터/주변기기 0.71 438
    수산가공식품 1.9 1,176 네트워크장비 0.03 18
    대용식재료 0.52 324 노트북액세서리 0.16 102
    통조림/병 0.77 474 게임기/타이틀 0.07 42
    농산가공식품 0.49 303 통신가전 0.02 12
    절임/발효식품 0.96 594 휴대폰액세서리 0.09 54
    어육/연식품류 0.49 306 음향가전 0.19 120
    분말류 0.17 108 멀티미디어장비 0.15 90
    즉석/편의식품 5.09 3,148 주방가전 1.01 622
    영유아식품 0.72 446 건강/냉난방가전 1.08 671
    건강식품 1.72 1,067 생활가전 0.39 240
    과자류 5.55 3,432 카메라/캠코더용품 0.02 12
    음료류 2.16 1,337 가전주변기기 0.01 6
    빵류/떡류 1.64 1,012 거실가구 1.16 720
    커피/코코아 0.05 30 장식가구 0.96 596
    차류 0.66 411 인테리어소품 1.37 849
    주류 0.02 12 주방가구 0.46 282
    가공식품세트류 0.38 234 침구단품 1.32 814
    농산물 0.77 474 침구세트 0.06 36
    축산물 0.22 136 커튼/블라인드 0.04 24
    수산물 0.03 18 DIY용품 0.8 492
    신선식품세트류 0.01 6 원예용품 0.78 485
    위생용품 5.49 3,399 패션의류 0.01 6
    일용잡화 0.15 90 스포츠웨어 0.02 12
    애완용품 5.11 3,159 언더웨어 0.17 108
    자동차용품 2.83 1,750 캠핑 0.05 30
    주방용품 25.76 15,938 헬스 0.96 594
    청소/욕실용품 3.27 2,026 남성신발 0.01 6
    세탁용품 4.17 2,577 여성가방 0.1 60
    생활용품 2.86 1,769 여성신발 0.02 12
    수집품 0.7 432 여행용가방/소품 0.33 204
    건강의료용품 0.11 66 장갑 0.03 18
    공구 0.35 219 패션소품 0.06 36
    영유아용품 1.92 1,188 유아동패션잡화 0.01 6
    화장품 3.72 2,299 양말 0.01 6
    의약외품 0.6 372 유니섹스신발 0.1 60
    의료용품 0.13 78 - - -
          합계 100 61,866

     

    □ 캡션 중복성

    캡션 중복성
    구분 비율() 수량(건)
    0회 99.997 60,510
    1회 0.003 2
    합계 100 60,512
  • 저작도구 설명서 및 저작도구 다운로드

    저작도구 설명서 다운로드 저작도구 다운로드
  • AI 모델 상세 설명서 다운로드

    AI 모델 상세 설명서 다운로드 AI 모델 다운로드

    □ 학습 모델

    학습 모델
    Task명 모델명 지표 목표치 결과값
    Multimodal image classification Dynamic MLP Accuracy 0.8 이상 0.8
    3D Reconstruction PSGN 3D IoU 0.7 이상 0.77

     

     1) 정보 기반 이미지 분류

    Dynamic MLP

    ‘DynamicMLP’는 미세 분류 작업에서 발생하는 근본적인 문제, 즉 시각적으로 매우 유사한 종들을 구별하는 어려움을 해결하기 위한 방법을 제안한다. 논문의 핵심 아이디어는 이미지의 시각적 특징만으로는 구분이 어려운 경우에 지리적 위치와 촬영 시간과 같은 추가 정보를 활용하여 분류 성능을 향상시켰다.

    'DynamicMLP’ 모델 구조 개요도
    [‘DynamicMLP’ 모델 구조 개요도]


    이 모델의 가장 큰 특징 중 하나는 ‘DynamicMLP’라는 새로운 구조의 도입이다. 기존의 다중 모달 방법들이 단일 차원에서만 특징을 융합하는 한계가 있었던 것에 반해, ‘DynamicMLP’는 더 높고 넓은 차원에서 다중 모달 특징들을 상호작용시킨다. 이 구조는 이미지 표현 위에서 작동하며, 위치와 날짜 정보로부터 학습된 임베딩에 의해 매개변수화되는 특징을 가진다.

    논문은 세 가지 버전의 ‘DynamicMLP’를 제안한다. 기본 구현인 ‘Dynamic MLP-A’, 더 깊은 임베딩 레이어를 가진 ‘Dynamic MLP-B’, 그리고 연결 입력을 활용한 ‘Dynamic MLP-C’가 그것이다. 각 버전은 서로 다른 장점을 가지고 있으며, 특히 ‘Dynamic MLP-C’는 가장 우수한 성능을 보여주었다.

    실험 결과는 iNaturalist 2017, 2018, 2021과 같은 주요 미세 분류 데이터셋에서 최고 성능을 달성했으며, 특히 FGVC8 대회에서 94.75의 top-1 정확도로 3위를 차지하는 성과를 거두었다. t-SNE 시각화를 통해 시각적으로 유사하지만 다른 카테고리에 속하는 이미지들의 특징 표현이 더 잘 구분됨을 확인할 수 있었다.

     

     2) 3D 재구성

    A Point Set Generation Network for 3D Object Reconstruction from a Single Image

    ‘A Point Set Generation Network for 3D Object Reconstruction from a Single Image’는  단일 2D 이미지로부터 3D 객체를 재구성하는 방법을 제시한다. 기존의 3D 생성 방식들이 볼륨 그리드나 이미지 컬렉션과 같은 규칙적인 표현을 사용했던 것과 달리, 이 연구는 포인트 클라우드 좌표를 직접 출력하는 새로운 접근법을 채택했다는 점에서 독창성을 가진다.

    ‘A Point Set Generation Network for 3D Object Reconstruction from a Single Image’ 모델 구조 개요도
    [‘A Point Set Generation Network for 3D Object Reconstruction from a Single Image’ 모델 구조 개요도]


    논문의 핵심은 포인트 클라우드 표현 방식과 이를 학습하기 위한 독특한 손실 함수의 설계에 있다. 포인트 클라우드는 기하학적 변환과 변형에 대해 연결성을 업데이트할 필요가 없어 단순한 조작이 가능하다는 장점을 가진다. 또한 복잡한 프리미티브나 조합적 연결 패턴을 인코딩할 필요가 없어 학습이 용이하다는 특징이 있다.

    특히 주목할 만한 점은 Earth Mover's Distance(EMD)를 기반으로 한 손실 함수의 도입이다. 이는 동일한 기하학적 형상이 서로 다른 포인트 클라우드 표현을 가질 수 있는 문제를 해결하며, 기존의 L2 타입 손실과는 달리 할당 문제를 효과적으로 해결할 수 있게 한다. 이를 통해 end-to-end 학습이 가능해졌으며, 단일 이미지에서 3D 구조를 복원할 때 발생하는 본질적인 모호성도 다룰 수 있게 되었다.

    이 연구의 최종 결과물은 조건부 형상 샘플러로, 입력 이미지로부터 여러 개의 그럴듯한 3D 포인트 클라우드를 예측할 수 있다. 이 모델은 보이는 부분의 깊이를 추정하고 나머지 객체 기하학을 추론하는 능력을 갖추었으며, 여러 가능한 완성 형태를 평가할 수 있다. 실험 결과, 이 접근법은 단일 이미지 기반 3D 재구성 벤치마크에서 기존의 최신 방법들을 능가하는 성능을 보여주었으며, 3D 형상 완성 작업에서도 강력한 성능을 입증했다.

     

    □ 유효성 검사 환경

    유효성 검증 항목(입고 물품)
    유효성 검증 항목
    항목명 정보 기반 이미지 분류 성능(입고물품)
    검증 방법 데이터 학습 후 테스트셋 대상 분류 정확도 지표 확인
    목적 정형 센서 데이터를 활용한 멀티모달 이미지 분류 성능 확인
    지표 Accuracy
    측정 산식 유효성 검사 환경-측정 산식
    도커 이미지 DynamicMLP.tar.gz
    실행 파일명 eval.py 
    유효성 검증 환경
    CPU Intel(R) Core(TM) i7-9800X CPU @ 3.80GHz
    Memory 62G
    GPU GeForce GTX 1080 Ti * 4
    Storage 1.8 TB
    OS Ubuntu (20.04)
    유효성 검증 모델 학습 및 검증 조건
    개발 언어 Python 3.8.10
    프레임워크 CUDA 11.6, Pytorch 1.13.1
    학습 알고리즘 DynamicMLP
    학습 조건 batch_size = 512
    optimizer = SGD
    max_epoch = 500
    istart_lr = 0.04
    momentum=0.9
    weight_decay = 0.0001
    파일 형식 이미지데이터 : jpg
    라벨링데이터 : json
    전체 구축 데이터 대비 모델에 적용되는 비율 100
    모델 학습 과정별 데이터 분류 및 비율 정보 • 학습용 데이터셋: 41,188 (비율 : 8)
    • 검증용 데이터셋: 10,297 (비율 : 1)
    • 평가용 데이터셋: 10,297 (비율 : 1)

     

    유효성 검증 항목(출고물품)
    유효성 검증 항목
    항목명 3D 생성 성능(출고 물품)
    검증 방법 3D 생성을 통해 생성된 모델의 부피와 실제 물품의 부피 비교
    목적 이미지를 통한 물품 부피 추정 성능 확인
    지표 3D IoU
    측정 산식 서비스 활용 모델-측정 산식
    도커 이미지 A-Point-Set-Generation-Network-for-3D-Object-Reconstruction-from-a-Single-Image.tar.gz
    실행 파일명 eval.py
    유효성 검증 환경
    CPU Intel(R) Xeon(R) Silver 4210 CPU @ 2.20GHz
    Memory 251G
    GPU GeForce RTX 2080 Ti * 8
    Storage 3.6TB
    OS Ubuntu (20.04)
    유효성 검증 모델 학습 및 검증 조건
    개발 언어 Python 3.8.10
    프레임워크 CUDA 11.6, Pytorch 1.13.1
    학습 알고리즘 PSGN
    학습 조건 batch_size = 32
    optimizer = Adam
    max_epoch = 50
    lr = 0.001
    파일 형식 이미지데이터 : jpg
    라벨링데이터 : json
    전체 구축 데이터 대비 모델에 적용되는 비율 100
    모델 학습 과정별 데이터 분류 및 비율 정보 • 학습용 데이터셋: 49,620장 (8,270개 물품) (비율 : 8)
    • 검증용 데이터셋: 6,204장 (1,034개 물품) (비율 : 1)
    • 평가용 데이터셋: 6,204장 (1,034개 물품) (비율 : 1)
    제한사항 학습 및 평가시 물품 단위로 데이터 처리

     

    □ 서비스 활용 모델

    ExpansionNet v2

    ‘ExpansionNetV2’는 이미지 캡션 생성을 위한 새로운 모델로, 입력 시퀀스의 고정된 길이 제한을 극복하기 위해 개발되었다. 이 모델은 기존 어텐션 기반 시스템과 달리 입력 데이터를 확장하여 다양한 시퀀스 길이를 처리할 수 있는 메커니즘을 도입하였다. 이를 통해 고정된 길이 제한을 초월하고, 더 유연하고 효율적인 데이터 처리를 가능하게 하였다.

    ‘ExpansionNetV2’  모델 구조
    [‘ExpansionNetV2’  모델 구조]



    ‘ExpansionNetV2’의 핵심 기술은 Static Expansion과 Dynamic Expansion이다. Static Expansion은 고정된 길이로 확장하여 양방향 처리를 지원하고, Dynamic Expansion은 가변적 길이 확장을 통해 자동 회귀와 양방향 처리를 모두 지원한다. 이 확장 메커니즘은 시퀀스 처리에서 성능 병목 현상을 완화하며, 다양한 길이의 데이터를 효율적으로 다룰 수 있도록 설계되었다.또한, 기존 접근 방식보다 최대 2.8배 빠른 엔드투엔드 학습 전략을 통해 학습 성능과 비용 효율성을 크게 향상시켰다.

    모델 구조는 Swin-Transformer 기반의 인코더-디코더 구조로 구성되어 있다. 인코더는 Static Expansion 블록을 사용해 이미지 특징을 추출하고 변환하며, 디코더는 Dynamic Expansion 블록과 교차 어텐션을 활용하여 입력 시퀀스를 처리하고 캡션을 생성한다. 최종 출력은 선형 투영층과 분류 층을 통해 도출된다. 이 과정에서 교차 엔트로피 손실과 CIDEr-D 최적화 손실을 함께 사용하여 높은 품질의 캡션을 생성한다.

    성능 평가 결과, ExpansionNetV2는 MS COCO 2014 데이터 세트을 기준으로 오프라인 CIDEr-D 143.7점, 온라인 CIDEr-D 140.8점을 기록하며, 기존 모델보다 빠른 학습 속도와 우수한 성능을 입증하였다. 특히 BLEU, METEOR, ROUGE, CIDEr-D 등 다양한 평가 지표에서 높은 점수를 기록하며 최신 모델들과 비교해 경쟁력을 입증하였다. 또한, 훈련 시간은 기존 모델 대비 최대 2.8배 빠르며, 대규모 데이터 세트을 활용한 생성 모델과 비교해도 훨씬 적은 데이터와 자원으로 높은 성능을 달성하였다.

    다만, 새로운 객체나 개념에 대한 일반화 성능은 최신 대규모 사전 학습 기반 모델에 비해 다소 떨어질 수 있다. 그럼에도 불구하고, ExpansionNetV2는 제한된 리소스로도 높은 성능을 요구하는 비전-언어 통합 작업에 적합하며, 학습 효율성과 확장성을 고려한 설계를 통해 이미지 캡션 생성 분야에서 새로운 가능성을 제시한다.

  • 설명서 및 활용가이드 다운로드

    데이터 설명서 다운로드 구축활용가이드 다운로드

    □ 데이터 구성 및 포맷

    데이터 구성 및 포맷
    구분 원시데이터 원천데이터 라벨링데이터 Other 데이터
    데이터 형태 이미지 이미지 물품정보, 폴리곤 어노테이션, 이미지 캡션 정형(센서) 데이터, 창고 정보 등
    데이터 포맷 JPG JPG JSON JSON, CSV

     

    □ 어노테이션 포맷

    어노테이션 포맷
    구분 속성명 타입 필수여부 설명 범위 비고
    1 info object Y 일반 정보 - -
      1-1 info.contributor string Y 데이터 구축기업 - 흥일기업 컨소시엄
    1-2 info.project_name string Y 데이터 구축과제명 - 물류공간 예측 데이터
    2 images[] array Y 이미지 정보 - -
      2-1 images[].id number Y 이미지 ID - -
    2-2 images[].file_name string Y 이미지 파일명 - -
    2-3 images[].width number Y 이미지 너비 0~1920 1920
    2-4 images[].height number Y 이미지 높이 0~1080 1080
    2-5 images[].shot_id number Y 촬영 번호 1~2 -
      2-6 images[].cam_id number Y 카메라 번호 1~3 -
    3 annotations[] array Y 어노테이션 정보 - -
      3-1 annotations[].id number Y 어노테이션 ID - -
    3-2 annotations[].image_id number Y 어노테이션 대상 이미지 ID - -
    3-3 annotations[].category_id number Y 카테고리 ID - KAN 상품분류코드
    대분류코드
    3-4 annotations[].segmentation array Y 세그멘테이션 라벨링 - 폴리곤 형식
    3-5 annotations[].area number Y 라벨링 면적 - 폴리곤 면적
    3-6 annotations[].bbox array Y 바운딩박스 라벨링 - xywh 포맷
    3-7 annotations[].iscrowd number N 군중객체 여부 0 저작도구 로드시 필요
    3-8 annotations[].attributes object Y 물품 정보 - -
        3-8-1 annotations[].attributes.length number Y 물품 길이 0~120 단위 : cm
        3-8-2 annotations[].attributes.width number Y 물품 너비 0~120 단위 : cm
        3-8-3 annotations[].attributes.height number Y 물품 높이 0~120 단위 : cm
        3-8-4 annotations[].attributes.weight number Y 물품 무게 0~99 단위 : kg
        3-8-5 annotations[].attributes.fragile boolean Y 파손주의 물품 true, false 입고물품 분류
        3-8-6 annotations[].attributes.refrigerate boolean Y 보냉재 필요물품 true, false 입고물품 분류
        3-8-7 annotations[].attributes.irregular boolean Y 비정형물품 true, false -
        3-8-8 annotations[].attributes.barcode string Y 바코드 - 바코드 정보 선택적 활용,
    물류업체 관리코드 사용 가능 
        3-8-9 annotations[].attributes.product_name string Y 상품명 - -
        3-8-10 annotations[].attributes.KAN_code string Y KAN분류코드 - 8자리 코드
        3-8-11 annotations[].attributes.size_id number Y 물품 규격 정보 - 1:극소형
    2:소형
    ...
    6:특수
        3-8-12 annotations[].attributes.caption string N 이미지 캡션 - 입고물품 캡션 추가 구축
    4 categories array Y 카테고리 정보 - -
      4-1 categories[].id number Y 대분류 ID - 1:가공식품
    2:신선식품
    ...
    11:패션잡화
    4-2 categories[].name string Y 대분류명 - -

     

    □ 데이터 실제 예시

    데이터 실제 예시 1데이터 실제 예시 2

    데이터 실제 예시 3
    <상품 특성 및 캡션 상세 예시>

  • 데이터셋 구축 담당자

    수행기관(주관) : 흥일기업(주)
    수행기관(주관)
    책임자명 전화번호 대표이메일 담당업무
    전병훈 02-6283-0156 bhjeon@hungil.co.kr 데이터 구축 총괄, 데이터 정제, 데이터 가공
    수행기관(참여)
    수행기관(참여)
    기관명 담당업무
    아세아도(주) 데이터 수집
    국립한밭대학교 산학협력단 AI 모델 개발
    데이터 관련 문의처
    데이터 관련 문의처
    담당자명 전화번호 이메일
    흥일기업(주) 전병훈 차장 02-6283-0156 bhjeon@hungil.co.kr
    흥일기업(주) 육효진 대리 02-6283-0156 hjyuk@hungil.co.kr
    AI모델 관련 문의처
    AI모델 관련 문의처
    담당자명 전화번호 이메일
    국립한밭대학교 산학협력단 최동걸 교수 042-821-1213 dgchoi@hanbat.ac.kr
    국립한밭대학교 산학협력단 유용현 연구원 010-9144-2165 yonghyeon0316 @gmail.com
    저작도구 관련 문의처
    저작도구 관련 문의처
    담당자명 전화번호 이메일
    흥일기업(주) 전병훈 차장 02-6283-0156 bhjeon@hungil.co.kr
    흥일기업(주) 육효진 대리 02-6283-0156 hjyuk@hungil.co.kr
보건의료 데이터 개방 안내

보건의료 데이터는 온라인 및 오프라인 안심존을 통해 개방됩니다.

안심존이란 안심존 이용메뉴얼 안심존 이용신청 데이터 열람신청
  • 인터넷과 물리적으로 분리된 온라인·오프라인 공간으로 의료 데이터를 포함하여 보안 조치가 요구되는 데이터를 다운로드 없이 접근하고 분석 가능
    * 온라인 안심존 : 보안이 보장된 온라인 네트워크를 통해 집, 연구실, 사무실 등 어디서나 접속하여 데이터에 접근하고 분석
    * 오프라인 안심존 : 추가적인 보안이 필요한 데이터를 대상으로 지정된 물리적 공간에서만 접속하여 데이터에 접근하고 분석

    1. AI 허브 접속
      신청자
    2. 안심존
      사용신청
      신청자신청서류 제출*
    3. 심사구축기관
    4. 승인구축기관
    5. 데이터 분석 활용신청자
    6. 분석모델반출신청자
  • 1. 기관생명윤리위원회(IRB) 심의 결과 통지서 [IRB 알아보기] [공용IRB 심의신청 가이드라인]
    2. 기관생명윤리위원회(IRB) 승인된 연구계획서
    3. 신청자 소속 증빙 서류 (재직증명서, 재학증명서, 근로계약서 등 택1)
    4. 안심존 이용 신청서 [다운로드]
    5. 보안서약서 [다운로드]
    ※ 상기 신청서 및 첨부 서류를 완비한 후 신청을 진행하셔야 정상적으로 절차가 이루어집니다.

  • 신청 및 이용관련 문의는 safezone1@aihub.kr 또는 02-525-7708, 7709로 문의

데이터셋 다운로드 승인이 완료 된 후 API 다운로드 서비스를 이용하실 수 있습니다.

API 다운로드 파일은 분할 압축되어 다운로드 됩니다. 분할 압축 해제를 위해서는 분할 압축 파일들의 병합이 필요하며 리눅스 명령어 사용이 필요합니다.

리눅스 OS 계열에서 다운로드 받으시길 권장하며 윈도우에서 파일 다운로드 시 wsl(리눅스용 윈도우 하위 시스템) 설치가 필요합니다.

※ 파일 병합 리눅스 명령어

find "폴더경로" -name "파일명.zip.part*" -print0 | sort -zt'.' -k2V | xargs -0 cat > "파일명.zip"

- 해당 명령어 실행 시, 실행 경로 위치에 병합 압축 파일이 생성됩니다.

- 병합된 파일 용량이 0일 경우, 제대로 병합이 되지 않은 상태이니 "폴더경로"가 제대로 입력되었는지 확인 부탁드립니다.

※ 데이터셋 소개 페이지에서 다운로드 버튼 클릭하여 승인이 필요합니다.

오프라인 데이터 이용 안내

본 데이터는 K-ICT 빅데이터센터에서도 이용하실 수 있습니다.

K-ICT 빅데이터센터는 데이터 안심구역으로 지정되어
다양한 데이터(미개방 데이터 포함)를 분석할 수 있는 오프라인 분석공간을 제공하고 있습니다.

데이터 안심구역 이용절차 및 신청은 K-ICT빅데이터센터 홈페이지를 참고하시기 바랍니다.

국방데이터 이용신청 탭 이미지

국방데이터 개방 안내

본 데이터는 국방데이터로 군사 보안에 따라 AI허브에서 데이터를 제공하지 않으며,
군 담당자를 통한 별도의 사용 신청이 필요합니다.