※ 25년 신규 개방되는 데이터로, 데이터 활용성 검토, 이용자 관점의 개선의견 수렴 등을 통해 수정/보완될 수 있으며 최종데이터, 샘플데이터, 산출물 등은 변경될 수 있습니다
-
데이터 변경이력
데이터 변경이력 버전 일자 변경내용 비고 1.0 2025-04-17 데이터 개방 Beta Version 데이터 히스토리
데이터 히스토리 일자 변경내용 비고 2025-04-17 산출물 전체 공개 소개
□ 물류 품목 표준화 및 물류공간 예측이 가능한 AI 학습용 입·출고 물품 이미지 및 품목 분류 데이터 구축
구축목적
□ 물류산업 디지털 전환을 가져다주는 두 가지 핵심 기술은 'AI'와 '로봇' □ 창고 자동화는 초창기 자율이동로봇(AMR) 단순 도입 형태에서 최근 AI와 로봇을 결합하는 형태로 진화 □ 본 과제를 통해 구축된 데이터를 활용하여 물류산업 디지털 전환 촉진 가속화
-
메타데이터 구조표 데이터 영역 교통물류 데이터 유형 센서 , 이미지 , 텍스트 데이터 형식 jpg(이미지), csv(센서 측정 데이터) 데이터 출처 직접 물품 크기, 무게 측정 및 이미지 촬영 라벨링 유형 바운딩박스, 세그맨테이션, 이미지 캡션, 물품 품목 분류 라벨링 형식 json 데이터 활용 서비스 입출고 물품 품목 분류 모델, 물품 크기 추정을 통한 물류공간 예측, 물품 정보 기반 자동화 물류 처리 로봇 개발 데이터 구축년도/
데이터 구축량2024년/122,378 -
□ 데이터 구축 규모
데이터 구축 규모 RFP 제시량 원시데이터 수량 원천데이터 수량 라벨링 데이터 수량 입출고 물품 이미지
/ 물품 분류 표준화를 위한 품목 분류
데이터 8만건 이상RGB 이미지 124,999장 RGB 이미지 122,378장 가공 데이터 122,378건
※ (입고물품)이미지 캡션 60,512건□ 입고 물품 규격 분포
입고 물품 규격 분포 구분 비율(%) 수량(건) 극소형 81.41 49,261 소형 11.74 7,108 중형 3.75 2,272 대형 1.98 1,196 특대형 0.8 484 특수 0.32 191 합계 100 60,512 □ 출고 물품 규격 분포
출고 물품 규격 분포 구분 비율(%) 수량(건) 극소형 45.31 28,032 소형 30.68 18,981 중형 13.19 8,159 대형 4.85 3,000 특대형 4.52 2,795 특수 1.45 899 합계 100 61,866 □ 캡션 어절 수
캡션 어절 수 어절 수 비율(%) 수량(건) 28 0.07% 43 29 0.29% 175 30 0.65% 394 31 1.10% 664 32 1.39% 842 33 1.89% 1,146 34 3.29% 1,991 35 4.32% 2,612 36 4.73% 2,861 37 5.29% 3,203 38 5.63% 3,407 39 6.60% 3,993 40 7.27% 4,401 41 6.95% 4,207 42 6.48% 3,919 43 5.55% 3,361 44 5.73% 3,465 45 5.06% 3,063 46 4.25% 2,574 47 3.69% 2,234 48 2.58% 1,563 49 2.26% 1,370 50 2.11% 1,278 51 1.59% 964 52 1.53% 927 53 1.30% 784 54 1.10% 663 55 1.04% 629 56 1.00% 606 57 0.80% 483 58 0.72% 437 59 0.57% 343 60 0.51% 311 61 0.47% 287 62 0.38% 231 63 0.31% 185 64 0.27% 162 65 0.20% 124 66 0.18% 108 67 0.19% 114 68 0.12% 75 69 0.09% 57 70 0.08% 49 71 0.09% 56 72 0.05% 33 73 0.05% 28 74 0.04% 23 75 0.03% 19 76 0.02% 12 77 0.01% 8 78 0.01% 7 79 0.01% 7 80 0.00% 3 81 0.01% 5 82 0.00% 2 83 0.00% 1 84 0.00% 1 85 0.00% 2 합계 100 60,512 □ 입고 물품 형태 분포
입고 물품 형태 분포 구분 비율(%) 수량(건) 비정형 78.95 47,775 정형 21.05 12,737 합계 100 60,512 □ 출고 물품 형태 분포
출고 물품 형태 분포 구분 비율(%) 수량(건) 정형 100 61,866 합계 100 61,866 □ 입고 물품 중분류 분포
입고 물품 중분류 분포 중분류 비율(%) 수량(건) 중분류 비율(%) 수량(건) 조미료 8.1 4,904 휴대폰액세서리 1 603 유제품 0.08 46 영상가전 0.01 6 축산가공식품 0.08 48 음향가전 0.72 435 수산가공식품 0.64 390 멀티미디어장비 0.12 72 대용식재료 0.39 233 주방가전 0.59 354 통조림/병 2.5 1,510 건강/냉난방가전 0.29 174 농산가공식품 0.25 150 생활가전 0.38 228 절임/발효식품 0.94 567 카메라/캠코더용품 0.02 12 분말류 2.15 1,304 가전주변기기 0.06 36 즉석/편의식품 4.44 2,688 거실가구 0.04 24 영유아식품 0.15 90 장식가구 0.4 243 건강식품 0.04 24 인테리어소품 0.53 323 과자류 2.88 1,743 주방가구 0.04 24 음료류 3.79 2,294 침구단품 0.02 12 빵류/떡류 0.19 114 커튼/블라인드 0.04 24 커피/코코아 0.63 384 DIY용품 2.87 1,736 차류 0.59 356 원예용품 0.71 428 주류 3.61 2,182 패션의류 2.06 1,247 기타가공식품 0.05 30 유아동의류 0.04 24 농산물 1.39 840 스포츠웨어 0.01 6 수산물 0.01 6 언더웨어 0.1 62 위생용품 2.46 1,489 기타의류 0.04 24 일용잡화 0.68 409 골프 0.06 36 애완용품 2.26 1,368 야구 0.03 18 자동차용품 3.02 1,825 배드민턴 0.09 54 주방용품 16.54 10,007 축구 0.05 30 청소/욕실용품 4.7 2,842 탁구 0.05 30 세탁용품 1.79 1,086 테니스/스쿼시 0.01 6 생활용품 6.84 4,136 등산 0.1 60 수집품 0.03 18 자전거 0.28 168 건강의료용품 0.06 36 오토바이/스쿠터 0.02 12 공구 1.23 743 캠핑 1.34 811 영유아용품 0.97 587 헬스 0.28 168 화장품 1.84 1,112 스포츠액세서리 0.34 204 기타일상용품 0.06 39 요가/필라테스 0.17 102 의약외품 0.76 462 수상스포츠 0.03 18 의료기기 0.03 18 롤러/보드 0.02 12 의료용품 0.34 204 기타레저용품 0.08 48 문구/사무용품 4.26 2,577 남성가방 0.1 60 완구 2 1,213 남성신발 0.02 12 서적 0.35 210 여성가방 0.37 225 악기 0.02 12 여성신발 0.12 72 음반 0.04 24 여행용가방/소품 0.05 30 음반/비디오소모품 0.01 6 장갑 0.03 18 기타교육/문화용품 0.01 6 지갑 0.1 60 컴퓨터/주변기기 1.33 804 패션소품 0.59 359 PC액세서리 0.05 30 신발용품 0.18 108 네트워크장비 0.05 30 유야동패션잡화 0.03 18 노트북액세서리 0.06 36 양말 0.06 38 통신가전 0.31 190 유니섹스신발 0.36 216 합계 100 60,512 □ 출고 물품 중분류 분포
출고 물품 중분류 분포 중분류 비율(%) 수량(건) 중분류 비율(%) 수량(건) 조미료 3.16 1,957 문구/사무용품 1.14 704 유제품 0.61 378 완구 0.15 90 축산가공식품 0.72 444 컴퓨터/주변기기 0.71 438 수산가공식품 1.9 1,176 네트워크장비 0.03 18 대용식재료 0.52 324 노트북액세서리 0.16 102 통조림/병 0.77 474 게임기/타이틀 0.07 42 농산가공식품 0.49 303 통신가전 0.02 12 절임/발효식품 0.96 594 휴대폰액세서리 0.09 54 어육/연식품류 0.49 306 음향가전 0.19 120 분말류 0.17 108 멀티미디어장비 0.15 90 즉석/편의식품 5.09 3,148 주방가전 1.01 622 영유아식품 0.72 446 건강/냉난방가전 1.08 671 건강식품 1.72 1,067 생활가전 0.39 240 과자류 5.55 3,432 카메라/캠코더용품 0.02 12 음료류 2.16 1,337 가전주변기기 0.01 6 빵류/떡류 1.64 1,012 거실가구 1.16 720 커피/코코아 0.05 30 장식가구 0.96 596 차류 0.66 411 인테리어소품 1.37 849 주류 0.02 12 주방가구 0.46 282 가공식품세트류 0.38 234 침구단품 1.32 814 농산물 0.77 474 침구세트 0.06 36 축산물 0.22 136 커튼/블라인드 0.04 24 수산물 0.03 18 DIY용품 0.8 492 신선식품세트류 0.01 6 원예용품 0.78 485 위생용품 5.49 3,399 패션의류 0.01 6 일용잡화 0.15 90 스포츠웨어 0.02 12 애완용품 5.11 3,159 언더웨어 0.17 108 자동차용품 2.83 1,750 캠핑 0.05 30 주방용품 25.76 15,938 헬스 0.96 594 청소/욕실용품 3.27 2,026 남성신발 0.01 6 세탁용품 4.17 2,577 여성가방 0.1 60 생활용품 2.86 1,769 여성신발 0.02 12 수집품 0.7 432 여행용가방/소품 0.33 204 건강의료용품 0.11 66 장갑 0.03 18 공구 0.35 219 패션소품 0.06 36 영유아용품 1.92 1,188 유아동패션잡화 0.01 6 화장품 3.72 2,299 양말 0.01 6 의약외품 0.6 372 유니섹스신발 0.1 60 의료용품 0.13 78 - - - 합계 100 61,866 □ 캡션 중복성
캡션 중복성 구분 비율() 수량(건) 0회 99.997 60,510 1회 0.003 2 합계 100 60,512 -
-
AI 모델 상세 설명서 다운로드
AI 모델 상세 설명서 다운로드 AI 모델 다운로드□ 학습 모델
학습 모델 Task명 모델명 지표 목표치 결과값 Multimodal image classification Dynamic MLP Accuracy 0.8 이상 0.8 3D Reconstruction PSGN 3D IoU 0.7 이상 0.77 1) 정보 기반 이미지 분류
Dynamic MLP ‘DynamicMLP’는 미세 분류 작업에서 발생하는 근본적인 문제, 즉 시각적으로 매우 유사한 종들을 구별하는 어려움을 해결하기 위한 방법을 제안한다. 논문의 핵심 아이디어는 이미지의 시각적 특징만으로는 구분이 어려운 경우에 지리적 위치와 촬영 시간과 같은 추가 정보를 활용하여 분류 성능을 향상시켰다.
[‘DynamicMLP’ 모델 구조 개요도]
이 모델의 가장 큰 특징 중 하나는 ‘DynamicMLP’라는 새로운 구조의 도입이다. 기존의 다중 모달 방법들이 단일 차원에서만 특징을 융합하는 한계가 있었던 것에 반해, ‘DynamicMLP’는 더 높고 넓은 차원에서 다중 모달 특징들을 상호작용시킨다. 이 구조는 이미지 표현 위에서 작동하며, 위치와 날짜 정보로부터 학습된 임베딩에 의해 매개변수화되는 특징을 가진다.
논문은 세 가지 버전의 ‘DynamicMLP’를 제안한다. 기본 구현인 ‘Dynamic MLP-A’, 더 깊은 임베딩 레이어를 가진 ‘Dynamic MLP-B’, 그리고 연결 입력을 활용한 ‘Dynamic MLP-C’가 그것이다. 각 버전은 서로 다른 장점을 가지고 있으며, 특히 ‘Dynamic MLP-C’는 가장 우수한 성능을 보여주었다.
실험 결과는 iNaturalist 2017, 2018, 2021과 같은 주요 미세 분류 데이터셋에서 최고 성능을 달성했으며, 특히 FGVC8 대회에서 94.75의 top-1 정확도로 3위를 차지하는 성과를 거두었다. t-SNE 시각화를 통해 시각적으로 유사하지만 다른 카테고리에 속하는 이미지들의 특징 표현이 더 잘 구분됨을 확인할 수 있었다.2) 3D 재구성
A Point Set Generation Network for 3D Object Reconstruction from a Single Image ‘A Point Set Generation Network for 3D Object Reconstruction from a Single Image’는 단일 2D 이미지로부터 3D 객체를 재구성하는 방법을 제시한다. 기존의 3D 생성 방식들이 볼륨 그리드나 이미지 컬렉션과 같은 규칙적인 표현을 사용했던 것과 달리, 이 연구는 포인트 클라우드 좌표를 직접 출력하는 새로운 접근법을 채택했다는 점에서 독창성을 가진다.
[‘A Point Set Generation Network for 3D Object Reconstruction from a Single Image’ 모델 구조 개요도]
논문의 핵심은 포인트 클라우드 표현 방식과 이를 학습하기 위한 독특한 손실 함수의 설계에 있다. 포인트 클라우드는 기하학적 변환과 변형에 대해 연결성을 업데이트할 필요가 없어 단순한 조작이 가능하다는 장점을 가진다. 또한 복잡한 프리미티브나 조합적 연결 패턴을 인코딩할 필요가 없어 학습이 용이하다는 특징이 있다.
특히 주목할 만한 점은 Earth Mover's Distance(EMD)를 기반으로 한 손실 함수의 도입이다. 이는 동일한 기하학적 형상이 서로 다른 포인트 클라우드 표현을 가질 수 있는 문제를 해결하며, 기존의 L2 타입 손실과는 달리 할당 문제를 효과적으로 해결할 수 있게 한다. 이를 통해 end-to-end 학습이 가능해졌으며, 단일 이미지에서 3D 구조를 복원할 때 발생하는 본질적인 모호성도 다룰 수 있게 되었다.
이 연구의 최종 결과물은 조건부 형상 샘플러로, 입력 이미지로부터 여러 개의 그럴듯한 3D 포인트 클라우드를 예측할 수 있다. 이 모델은 보이는 부분의 깊이를 추정하고 나머지 객체 기하학을 추론하는 능력을 갖추었으며, 여러 가능한 완성 형태를 평가할 수 있다. 실험 결과, 이 접근법은 단일 이미지 기반 3D 재구성 벤치마크에서 기존의 최신 방법들을 능가하는 성능을 보여주었으며, 3D 형상 완성 작업에서도 강력한 성능을 입증했다.□ 유효성 검사 환경
유효성 검증 항목(입고 물품) 유효성 검증 항목 항목명 정보 기반 이미지 분류 성능(입고물품) 검증 방법 데이터 학습 후 테스트셋 대상 분류 정확도 지표 확인 목적 정형 센서 데이터를 활용한 멀티모달 이미지 분류 성능 확인 지표 Accuracy 측정 산식 도커 이미지 DynamicMLP.tar.gz 실행 파일명 eval.py 유효성 검증 환경 CPU Intel(R) Core(TM) i7-9800X CPU @ 3.80GHz Memory 62G GPU GeForce GTX 1080 Ti * 4 Storage 1.8 TB OS Ubuntu (20.04) 유효성 검증 모델 학습 및 검증 조건 개발 언어 Python 3.8.10 프레임워크 CUDA 11.6, Pytorch 1.13.1 학습 알고리즘 DynamicMLP 학습 조건 batch_size = 512
optimizer = SGD
max_epoch = 500
istart_lr = 0.04
momentum=0.9
weight_decay = 0.0001파일 형식 이미지데이터 : jpg 라벨링데이터 : json 전체 구축 데이터 대비 모델에 적용되는 비율 100 모델 학습 과정별 데이터 분류 및 비율 정보 • 학습용 데이터셋: 41,188 (비율 : 8)
• 검증용 데이터셋: 10,297 (비율 : 1)
• 평가용 데이터셋: 10,297 (비율 : 1)유효성 검증 항목(출고물품) 유효성 검증 항목 항목명 3D 생성 성능(출고 물품) 검증 방법 3D 생성을 통해 생성된 모델의 부피와 실제 물품의 부피 비교 목적 이미지를 통한 물품 부피 추정 성능 확인 지표 3D IoU 측정 산식 도커 이미지 A-Point-Set-Generation-Network-for-3D-Object-Reconstruction-from-a-Single-Image.tar.gz 실행 파일명 eval.py 유효성 검증 환경 CPU Intel(R) Xeon(R) Silver 4210 CPU @ 2.20GHz Memory 251G GPU GeForce RTX 2080 Ti * 8 Storage 3.6TB OS Ubuntu (20.04) 유효성 검증 모델 학습 및 검증 조건 개발 언어 Python 3.8.10 프레임워크 CUDA 11.6, Pytorch 1.13.1 학습 알고리즘 PSGN 학습 조건 batch_size = 32
optimizer = Adam
max_epoch = 50
lr = 0.001파일 형식 이미지데이터 : jpg 라벨링데이터 : json 전체 구축 데이터 대비 모델에 적용되는 비율 100 모델 학습 과정별 데이터 분류 및 비율 정보 • 학습용 데이터셋: 49,620장 (8,270개 물품) (비율 : 8)
• 검증용 데이터셋: 6,204장 (1,034개 물품) (비율 : 1)
• 평가용 데이터셋: 6,204장 (1,034개 물품) (비율 : 1)제한사항 학습 및 평가시 물품 단위로 데이터 처리 □ 서비스 활용 모델
ExpansionNet v2 ‘ExpansionNetV2’는 이미지 캡션 생성을 위한 새로운 모델로, 입력 시퀀스의 고정된 길이 제한을 극복하기 위해 개발되었다. 이 모델은 기존 어텐션 기반 시스템과 달리 입력 데이터를 확장하여 다양한 시퀀스 길이를 처리할 수 있는 메커니즘을 도입하였다. 이를 통해 고정된 길이 제한을 초월하고, 더 유연하고 효율적인 데이터 처리를 가능하게 하였다.
[‘ExpansionNetV2’ 모델 구조]
‘ExpansionNetV2’의 핵심 기술은 Static Expansion과 Dynamic Expansion이다. Static Expansion은 고정된 길이로 확장하여 양방향 처리를 지원하고, Dynamic Expansion은 가변적 길이 확장을 통해 자동 회귀와 양방향 처리를 모두 지원한다. 이 확장 메커니즘은 시퀀스 처리에서 성능 병목 현상을 완화하며, 다양한 길이의 데이터를 효율적으로 다룰 수 있도록 설계되었다.또한, 기존 접근 방식보다 최대 2.8배 빠른 엔드투엔드 학습 전략을 통해 학습 성능과 비용 효율성을 크게 향상시켰다.
모델 구조는 Swin-Transformer 기반의 인코더-디코더 구조로 구성되어 있다. 인코더는 Static Expansion 블록을 사용해 이미지 특징을 추출하고 변환하며, 디코더는 Dynamic Expansion 블록과 교차 어텐션을 활용하여 입력 시퀀스를 처리하고 캡션을 생성한다. 최종 출력은 선형 투영층과 분류 층을 통해 도출된다. 이 과정에서 교차 엔트로피 손실과 CIDEr-D 최적화 손실을 함께 사용하여 높은 품질의 캡션을 생성한다.
성능 평가 결과, ExpansionNetV2는 MS COCO 2014 데이터 세트을 기준으로 오프라인 CIDEr-D 143.7점, 온라인 CIDEr-D 140.8점을 기록하며, 기존 모델보다 빠른 학습 속도와 우수한 성능을 입증하였다. 특히 BLEU, METEOR, ROUGE, CIDEr-D 등 다양한 평가 지표에서 높은 점수를 기록하며 최신 모델들과 비교해 경쟁력을 입증하였다. 또한, 훈련 시간은 기존 모델 대비 최대 2.8배 빠르며, 대규모 데이터 세트을 활용한 생성 모델과 비교해도 훨씬 적은 데이터와 자원으로 높은 성능을 달성하였다.
다만, 새로운 객체나 개념에 대한 일반화 성능은 최신 대규모 사전 학습 기반 모델에 비해 다소 떨어질 수 있다. 그럼에도 불구하고, ExpansionNetV2는 제한된 리소스로도 높은 성능을 요구하는 비전-언어 통합 작업에 적합하며, 학습 효율성과 확장성을 고려한 설계를 통해 이미지 캡션 생성 분야에서 새로운 가능성을 제시한다. -
설명서 및 활용가이드 다운로드
데이터 설명서 다운로드 구축활용가이드 다운로드□ 데이터 구성 및 포맷
데이터 구성 및 포맷 구분 원시데이터 원천데이터 라벨링데이터 Other 데이터 데이터 형태 이미지 이미지 물품정보, 폴리곤 어노테이션, 이미지 캡션 정형(센서) 데이터, 창고 정보 등 데이터 포맷 JPG JPG JSON JSON, CSV □ 어노테이션 포맷
어노테이션 포맷 구분 속성명 타입 필수여부 설명 범위 비고 1 info object Y 일반 정보 - - 1-1 info.contributor string Y 데이터 구축기업 - 흥일기업 컨소시엄 1-2 info.project_name string Y 데이터 구축과제명 - 물류공간 예측 데이터 2 images[] array Y 이미지 정보 - - 2-1 images[].id number Y 이미지 ID - - 2-2 images[].file_name string Y 이미지 파일명 - - 2-3 images[].width number Y 이미지 너비 0~1920 1920 2-4 images[].height number Y 이미지 높이 0~1080 1080 2-5 images[].shot_id number Y 촬영 번호 1~2 - 2-6 images[].cam_id number Y 카메라 번호 1~3 - 3 annotations[] array Y 어노테이션 정보 - - 3-1 annotations[].id number Y 어노테이션 ID - - 3-2 annotations[].image_id number Y 어노테이션 대상 이미지 ID - - 3-3 annotations[].category_id number Y 카테고리 ID - KAN 상품분류코드
대분류코드3-4 annotations[].segmentation array Y 세그멘테이션 라벨링 - 폴리곤 형식 3-5 annotations[].area number Y 라벨링 면적 - 폴리곤 면적 3-6 annotations[].bbox array Y 바운딩박스 라벨링 - xywh 포맷 3-7 annotations[].iscrowd number N 군중객체 여부 0 저작도구 로드시 필요 3-8 annotations[].attributes object Y 물품 정보 - - 3-8-1 annotations[].attributes.length number Y 물품 길이 0~120 단위 : cm 3-8-2 annotations[].attributes.width number Y 물품 너비 0~120 단위 : cm 3-8-3 annotations[].attributes.height number Y 물품 높이 0~120 단위 : cm 3-8-4 annotations[].attributes.weight number Y 물품 무게 0~99 단위 : kg 3-8-5 annotations[].attributes.fragile boolean Y 파손주의 물품 true, false 입고물품 분류 3-8-6 annotations[].attributes.refrigerate boolean Y 보냉재 필요물품 true, false 입고물품 분류 3-8-7 annotations[].attributes.irregular boolean Y 비정형물품 true, false - 3-8-8 annotations[].attributes.barcode string Y 바코드 - 바코드 정보 선택적 활용,
물류업체 관리코드 사용 가능3-8-9 annotations[].attributes.product_name string Y 상품명 - - 3-8-10 annotations[].attributes.KAN_code string Y KAN분류코드 - 8자리 코드 3-8-11 annotations[].attributes.size_id number Y 물품 규격 정보 - 1:극소형
2:소형
...
6:특수3-8-12 annotations[].attributes.caption string N 이미지 캡션 - 입고물품 캡션 추가 구축 4 categories array Y 카테고리 정보 - - 4-1 categories[].id number Y 대분류 ID - 1:가공식품
2:신선식품
...
11:패션잡화4-2 categories[].name string Y 대분류명 - - □ 데이터 실제 예시
<상품 특성 및 캡션 상세 예시> -
데이터셋 구축 담당자
수행기관(주관) : 흥일기업(주)
수행기관(주관) 책임자명 전화번호 대표이메일 담당업무 전병훈 02-6283-0156 bhjeon@hungil.co.kr 데이터 구축 총괄, 데이터 정제, 데이터 가공 수행기관(참여)
수행기관(참여) 기관명 담당업무 아세아도(주) 데이터 수집 국립한밭대학교 산학협력단 AI 모델 개발 데이터 관련 문의처
데이터 관련 문의처 담당자명 전화번호 이메일 흥일기업(주) 전병훈 차장 02-6283-0156 bhjeon@hungil.co.kr 흥일기업(주) 육효진 대리 02-6283-0156 hjyuk@hungil.co.kr AI모델 관련 문의처
AI모델 관련 문의처 담당자명 전화번호 이메일 국립한밭대학교 산학협력단 최동걸 교수 042-821-1213 dgchoi@hanbat.ac.kr 국립한밭대학교 산학협력단 유용현 연구원 010-9144-2165 yonghyeon0316 @gmail.com 저작도구 관련 문의처
저작도구 관련 문의처 담당자명 전화번호 이메일 흥일기업(주) 전병훈 차장 02-6283-0156 bhjeon@hungil.co.kr 흥일기업(주) 육효진 대리 02-6283-0156 hjyuk@hungil.co.kr
-
인터넷과 물리적으로 분리된 온라인·오프라인 공간으로 의료 데이터를 포함하여 보안 조치가 요구되는 데이터를 다운로드 없이 접근하고 분석 가능
* 온라인 안심존 : 보안이 보장된 온라인 네트워크를 통해 집, 연구실, 사무실 등 어디서나 접속하여 데이터에 접근하고 분석
* 오프라인 안심존 : 추가적인 보안이 필요한 데이터를 대상으로 지정된 물리적 공간에서만 접속하여 데이터에 접근하고 분석 -
- AI 허브 접속
신청자 - 안심존
사용신청신청자신청서류 제출* - 심사구축기관
- 승인구축기관
- 데이터 분석 활용신청자
- 분석모델반출신청자
- AI 허브 접속
-
1. 기관생명윤리위원회(IRB) 심의 결과 통지서 [IRB 알아보기] [공용IRB 심의신청 가이드라인]
2. 기관생명윤리위원회(IRB) 승인된 연구계획서
3. 신청자 소속 증빙 서류 (재직증명서, 재학증명서, 근로계약서 등 택1)
4. 안심존 이용 신청서 [다운로드]
5. 보안서약서 [다운로드]
※ 상기 신청서 및 첨부 서류를 완비한 후 신청을 진행하셔야 정상적으로 절차가 이루어집니다. -
신청 및 이용관련 문의는 safezone1@aihub.kr 또는 02-525-7708, 7709로 문의
데이터셋 다운로드 승인이 완료 된 후 API 다운로드 서비스를 이용하실 수 있습니다.
API 다운로드 파일은 분할 압축되어 다운로드 됩니다. 분할 압축 해제를 위해서는 분할 압축 파일들의 병합이 필요하며 리눅스 명령어 사용이 필요합니다.
리눅스 OS 계열에서 다운로드 받으시길 권장하며 윈도우에서 파일 다운로드 시 wsl(리눅스용 윈도우 하위 시스템) 설치가 필요합니다.
※ 파일 병합 리눅스 명령어
find "폴더경로" -name "파일명.zip.part*" -print0 | sort -zt'.' -k2V | xargs -0 cat > "파일명.zip"
- 해당 명령어 실행 시, 실행 경로 위치에 병합 압축 파일이 생성됩니다.
- 병합된 파일 용량이 0일 경우, 제대로 병합이 되지 않은 상태이니 "폴더경로"가 제대로 입력되었는지 확인 부탁드립니다.
※ 데이터셋 소개 페이지에서 다운로드 버튼 클릭하여 승인이 필요합니다.
오프라인 데이터 이용 안내
본 데이터는 K-ICT 빅데이터센터에서도 이용하실 수 있습니다.
다양한 데이터(미개방 데이터 포함)를 분석할 수 있는 오프라인 분석공간을 제공하고 있습니다.
데이터 안심구역 이용절차 및 신청은 K-ICT빅데이터센터 홈페이지를 참고하시기 바랍니다.
국방데이터 개방 안내
본 데이터는 국방데이터로 군사 보안에 따라 AI허브에서 데이터를 제공하지 않으며,
군 담당자를 통한 별도의 사용 신청이 필요합니다.