AI-Hub

#컴퓨터 비전 #로보틱스

BETA 물류공간 예측 데이터

분야교통물류
유형 센서 , 이미지 , 텍스트
생성 방식LMM

구축년도 : 2024 갱신년월 : 2025-04 조회수 : 246 다운로드 : 14 용량 :

샘플 데이터

※샘플데이터는 데이터의 이해를 돕기 위해 별도로 가공하여 제공하는 정보로써 원본 데이터와 차이가 있을 수 있으며,
데이터에 따라서 민감한 정보는 일부 마스킹(*) 처리가 되어 있을 수 있습니다.

소개 파일 목록 (API 다운로드)

※ 25년 신규 개방되는 데이터로, 데이터 활용성 검토, 이용자 관점의 개선의견 수렴 등을 통해 수정/보완될 수 있으며 최종데이터, 샘플데이터, 산출물 등은 변경될 수 있습니다

※ 내국인만 데이터 신청이 가능합니다.

문의하기 목록

데이터 변경이력

데이터 변경이력
버전	일자	변경내용	비고
1.0	2025-04-17	데이터 개방	Beta Version

데이터 히스토리

데이터 히스토리
일자	변경내용	비고
2025-04-17	산출물 전체 공개

소개

□ 물류 품목 표준화 및 물류공간 예측이 가능한 AI 학습용 입·출고 물품 이미지 및 품목 분류 데이터 구축

구축목적

□ 물류산업 디지털 전환을 가져다주는 두 가지 핵심 기술은 'AI'와 '로봇' 
□ 창고 자동화는 초창기 자율이동로봇(AMR) 단순 도입 형태에서 최근 AI와 로봇을 결합하는 형태로 진화
□ 본 과제를 통해 구축된 데이터를 활용하여 물류산업 디지털 전환 촉진 가속화

메타데이터 구조표
데이터 영역	교통물류	데이터 유형	센서 , 이미지 , 텍스트
데이터 형식	jpg(이미지), csv(센서 측정 데이터)	데이터 출처	직접 물품 크기, 무게 측정 및 이미지 촬영
라벨링 유형	바운딩박스, 세그맨테이션, 이미지 캡션, 물품 품목 분류	라벨링 형식	json
데이터 활용 서비스	입출고 물품 품목 분류 모델, 물품 크기 추정을 통한 물류공간 예측, 물품 정보 기반 자동화 물류 처리 로봇 개발	데이터 구축년도/ 데이터 구축량	2024년/122,378

□ 데이터 구축 규모

데이터 구축 규모
RFP 제시량	원시데이터 수량	원천데이터 수량	라벨링 데이터 수량
입출고 물품 이미지 / 물품 분류 표준화를 위한 품목 분류 데이터 8만건 이상	RGB 이미지 124,999장	RGB 이미지 122,378장	가공 데이터 122,378건 ※ (입고물품)이미지 캡션 60,512건

□ 입고 물품 규격 분포

입고 물품 규격 분포
구분	비율(%)	수량(건)
극소형	81.41	49,261
소형	11.74	7,108
중형	3.75	2,272
대형	1.98	1,196
특대형	0.8	484
특수	0.32	191
합계	100	60,512

□ 출고 물품 규격 분포

출고 물품 규격 분포
구분	비율(%)	수량(건)
극소형	45.31	28,032
소형	30.68	18,981
중형	13.19	8,159
대형	4.85	3,000
특대형	4.52	2,795
특수	1.45	899
합계	100	61,866

□ 캡션 어절 수

캡션 어절 수
어절 수	비율(%)	수량(건)
28	0.07%	43
29	0.29%	175
30	0.65%	394
31	1.10%	664
32	1.39%	842
33	1.89%	1,146
34	3.29%	1,991
35	4.32%	2,612
36	4.73%	2,861
37	5.29%	3,203
38	5.63%	3,407
39	6.60%	3,993
40	7.27%	4,401
41	6.95%	4,207
42	6.48%	3,919
43	5.55%	3,361
44	5.73%	3,465
45	5.06%	3,063
46	4.25%	2,574
47	3.69%	2,234
48	2.58%	1,563
49	2.26%	1,370
50	2.11%	1,278
51	1.59%	964
52	1.53%	927
53	1.30%	784
54	1.10%	663
55	1.04%	629
56	1.00%	606
57	0.80%	483
58	0.72%	437
59	0.57%	343
60	0.51%	311
61	0.47%	287
62	0.38%	231
63	0.31%	185
64	0.27%	162
65	0.20%	124
66	0.18%	108
67	0.19%	114
68	0.12%	75
69	0.09%	57
70	0.08%	49
71	0.09%	56
72	0.05%	33
73	0.05%	28
74	0.04%	23
75	0.03%	19
76	0.02%	12
77	0.01%	8
78	0.01%	7
79	0.01%	7
80	0.00%	3
81	0.01%	5
82	0.00%	2
83	0.00%	1
84	0.00%	1
85	0.00%	2
합계	100	60,512

□ 입고 물품 형태 분포

입고 물품 형태 분포
구분	비율(%)	수량(건)
비정형	78.95	47,775
정형	21.05	12,737
합계	100	60,512

□ 출고 물품 형태 분포

출고 물품 형태 분포
구분	비율(%)	수량(건)
정형	100	61,866
합계	100	61,866

□ 입고 물품 중분류 분포

입고 물품 중분류 분포
중분류	비율(%)	수량(건)	중분류	비율(%)	수량(건)
조미료	8.1	4,904	휴대폰액세서리	1	603
유제품	0.08	46	영상가전	0.01	6
축산가공식품	0.08	48	음향가전	0.72	435
수산가공식품	0.64	390	멀티미디어장비	0.12	72
대용식재료	0.39	233	주방가전	0.59	354
통조림/병	2.5	1,510	건강/냉난방가전	0.29	174
농산가공식품	0.25	150	생활가전	0.38	228
절임/발효식품	0.94	567	카메라/캠코더용품	0.02	12
분말류	2.15	1,304	가전주변기기	0.06	36
즉석/편의식품	4.44	2,688	거실가구	0.04	24
영유아식품	0.15	90	장식가구	0.4	243
건강식품	0.04	24	인테리어소품	0.53	323
과자류	2.88	1,743	주방가구	0.04	24
음료류	3.79	2,294	침구단품	0.02	12
빵류/떡류	0.19	114	커튼/블라인드	0.04	24
커피/코코아	0.63	384	DIY용품	2.87	1,736
차류	0.59	356	원예용품	0.71	428
주류	3.61	2,182	패션의류	2.06	1,247
기타가공식품	0.05	30	유아동의류	0.04	24
농산물	1.39	840	스포츠웨어	0.01	6
수산물	0.01	6	언더웨어	0.1	62
위생용품	2.46	1,489	기타의류	0.04	24
일용잡화	0.68	409	골프	0.06	36
애완용품	2.26	1,368	야구	0.03	18
자동차용품	3.02	1,825	배드민턴	0.09	54
주방용품	16.54	10,007	축구	0.05	30
청소/욕실용품	4.7	2,842	탁구	0.05	30
세탁용품	1.79	1,086	테니스/스쿼시	0.01	6
생활용품	6.84	4,136	등산	0.1	60
수집품	0.03	18	자전거	0.28	168
건강의료용품	0.06	36	오토바이/스쿠터	0.02	12
공구	1.23	743	캠핑	1.34	811
영유아용품	0.97	587	헬스	0.28	168
화장품	1.84	1,112	스포츠액세서리	0.34	204
기타일상용품	0.06	39	요가/필라테스	0.17	102
의약외품	0.76	462	수상스포츠	0.03	18
의료기기	0.03	18	롤러/보드	0.02	12
의료용품	0.34	204	기타레저용품	0.08	48
문구/사무용품	4.26	2,577	남성가방	0.1	60
완구	2	1,213	남성신발	0.02	12
서적	0.35	210	여성가방	0.37	225
악기	0.02	12	여성신발	0.12	72
음반	0.04	24	여행용가방/소품	0.05	30
음반/비디오소모품	0.01	6	장갑	0.03	18
기타교육/문화용품	0.01	6	지갑	0.1	60
컴퓨터/주변기기	1.33	804	패션소품	0.59	359
PC액세서리	0.05	30	신발용품	0.18	108
네트워크장비	0.05	30	유야동패션잡화	0.03	18
노트북액세서리	0.06	36	양말	0.06	38
통신가전	0.31	190	유니섹스신발	0.36	216
			합계	100	60,512

□ 출고 물품 중분류 분포

출고 물품 중분류 분포
중분류	비율(%)	수량(건)	중분류	비율(%)	수량(건)
조미료	3.16	1,957	문구/사무용품	1.14	704
유제품	0.61	378	완구	0.15	90
축산가공식품	0.72	444	컴퓨터/주변기기	0.71	438
수산가공식품	1.9	1,176	네트워크장비	0.03	18
대용식재료	0.52	324	노트북액세서리	0.16	102
통조림/병	0.77	474	게임기/타이틀	0.07	42
농산가공식품	0.49	303	통신가전	0.02	12
절임/발효식품	0.96	594	휴대폰액세서리	0.09	54
어육/연식품류	0.49	306	음향가전	0.19	120
분말류	0.17	108	멀티미디어장비	0.15	90
즉석/편의식품	5.09	3,148	주방가전	1.01	622
영유아식품	0.72	446	건강/냉난방가전	1.08	671
건강식품	1.72	1,067	생활가전	0.39	240
과자류	5.55	3,432	카메라/캠코더용품	0.02	12
음료류	2.16	1,337	가전주변기기	0.01	6
빵류/떡류	1.64	1,012	거실가구	1.16	720
커피/코코아	0.05	30	장식가구	0.96	596
차류	0.66	411	인테리어소품	1.37	849
주류	0.02	12	주방가구	0.46	282
가공식품세트류	0.38	234	침구단품	1.32	814
농산물	0.77	474	침구세트	0.06	36
축산물	0.22	136	커튼/블라인드	0.04	24
수산물	0.03	18	DIY용품	0.8	492
신선식품세트류	0.01	6	원예용품	0.78	485
위생용품	5.49	3,399	패션의류	0.01	6
일용잡화	0.15	90	스포츠웨어	0.02	12
애완용품	5.11	3,159	언더웨어	0.17	108
자동차용품	2.83	1,750	캠핑	0.05	30
주방용품	25.76	15,938	헬스	0.96	594
청소/욕실용품	3.27	2,026	남성신발	0.01	6
세탁용품	4.17	2,577	여성가방	0.1	60
생활용품	2.86	1,769	여성신발	0.02	12
수집품	0.7	432	여행용가방/소품	0.33	204
건강의료용품	0.11	66	장갑	0.03	18
공구	0.35	219	패션소품	0.06	36
영유아용품	1.92	1,188	유아동패션잡화	0.01	6
화장품	3.72	2,299	양말	0.01	6
의약외품	0.6	372	유니섹스신발	0.1	60
의료용품	0.13	78	-	-	-
			합계	100	61,866

□ 캡션 중복성

캡션 중복성
구분	비율()	수량(건)
0회	99.997	60,510
1회	0.003	2
합계	100	60,512

저작도구 설명서 및 저작도구 다운로드
저작도구 설명서 다운로드 저작도구 다운로드

AI 모델 상세 설명서 다운로드

AI 모델 상세 설명서 다운로드 AI 모델 다운로드

□ 학습 모델

학습 모델
Task명	모델명	지표	목표치	결과값
Multimodal image classification	Dynamic MLP	Accuracy	0.8 이상	0.8
3D Reconstruction	PSGN	3D IoU	0.7 이상	0.77

1) 정보 기반 이미지 분류

Dynamic MLP

‘DynamicMLP’는 미세 분류 작업에서 발생하는 근본적인 문제, 즉 시각적으로 매우 유사한 종들을 구별하는 어려움을 해결하기 위한 방법을 제안한다. 논문의 핵심 아이디어는 이미지의 시각적 특징만으로는 구분이 어려운 경우에 지리적 위치와 촬영 시간과 같은 추가 정보를 활용하여 분류 성능을 향상시켰다.

'DynamicMLP’ 모델 구조 개요도
[‘DynamicMLP’ 모델 구조 개요도]

이 모델의 가장 큰 특징 중 하나는 ‘DynamicMLP’라는 새로운 구조의 도입이다. 기존의 다중 모달 방법들이 단일 차원에서만 특징을 융합하는 한계가 있었던 것에 반해, ‘DynamicMLP’는 더 높고 넓은 차원에서 다중 모달 특징들을 상호작용시킨다. 이 구조는 이미지 표현 위에서 작동하며, 위치와 날짜 정보로부터 학습된 임베딩에 의해 매개변수화되는 특징을 가진다.

논문은 세 가지 버전의 ‘DynamicMLP’를 제안한다. 기본 구현인 ‘Dynamic MLP-A’, 더 깊은 임베딩 레이어를 가진 ‘Dynamic MLP-B’, 그리고 연결 입력을 활용한 ‘Dynamic MLP-C’가 그것이다. 각 버전은 서로 다른 장점을 가지고 있으며, 특히 ‘Dynamic MLP-C’는 가장 우수한 성능을 보여주었다.

실험 결과는 iNaturalist 2017, 2018, 2021과 같은 주요 미세 분류 데이터셋에서 최고 성능을 달성했으며, 특히 FGVC8 대회에서 94.75의 top-1 정확도로 3위를 차지하는 성과를 거두었다. t-SNE 시각화를 통해 시각적으로 유사하지만 다른 카테고리에 속하는 이미지들의 특징 표현이 더 잘 구분됨을 확인할 수 있었다.

2) 3D 재구성

A Point Set Generation Network for 3D Object Reconstruction from a Single Image

‘A Point Set Generation Network for 3D Object Reconstruction from a Single Image’는 단일 2D 이미지로부터 3D 객체를 재구성하는 방법을 제시한다. 기존의 3D 생성 방식들이 볼륨 그리드나 이미지 컬렉션과 같은 규칙적인 표현을 사용했던 것과 달리, 이 연구는 포인트 클라우드 좌표를 직접 출력하는 새로운 접근법을 채택했다는 점에서 독창성을 가진다.

[‘A Point Set Generation Network for 3D Object Reconstruction from a Single Image’ 모델 구조 개요도]

논문의 핵심은 포인트 클라우드 표현 방식과 이를 학습하기 위한 독특한 손실 함수의 설계에 있다. 포인트 클라우드는 기하학적 변환과 변형에 대해 연결성을 업데이트할 필요가 없어 단순한 조작이 가능하다는 장점을 가진다. 또한 복잡한 프리미티브나 조합적 연결 패턴을 인코딩할 필요가 없어 학습이 용이하다는 특징이 있다.

특히 주목할 만한 점은 Earth Mover's Distance(EMD)를 기반으로 한 손실 함수의 도입이다. 이는 동일한 기하학적 형상이 서로 다른 포인트 클라우드 표현을 가질 수 있는 문제를 해결하며, 기존의 L2 타입 손실과는 달리 할당 문제를 효과적으로 해결할 수 있게 한다. 이를 통해 end-to-end 학습이 가능해졌으며, 단일 이미지에서 3D 구조를 복원할 때 발생하는 본질적인 모호성도 다룰 수 있게 되었다.

이 연구의 최종 결과물은 조건부 형상 샘플러로, 입력 이미지로부터 여러 개의 그럴듯한 3D 포인트 클라우드를 예측할 수 있다. 이 모델은 보이는 부분의 깊이를 추정하고 나머지 객체 기하학을 추론하는 능력을 갖추었으며, 여러 가능한 완성 형태를 평가할 수 있다. 실험 결과, 이 접근법은 단일 이미지 기반 3D 재구성 벤치마크에서 기존의 최신 방법들을 능가하는 성능을 보여주었으며, 3D 형상 완성 작업에서도 강력한 성능을 입증했다.

□ 유효성 검사 환경

유효성 검증 항목(입고 물품)
유효성 검증 항목
항목명	정보 기반 이미지 분류 성능(입고물품)
검증 방법	데이터 학습 후 테스트셋 대상 분류 정확도 지표 확인
목적	정형 센서 데이터를 활용한 멀티모달 이미지 분류 성능 확인
지표	Accuracy
측정 산식
도커 이미지	DynamicMLP.tar.gz
실행 파일명	eval.py
유효성 검증 환경
CPU	Intel(R) Core(TM) i7-9800X CPU @ 3.80GHz
Memory	62G
GPU	GeForce GTX 1080 Ti * 4
Storage	1.8 TB
OS	Ubuntu (20.04)
유효성 검증 모델 학습 및 검증 조건
개발 언어	Python 3.8.10
프레임워크	CUDA 11.6, Pytorch 1.13.1
학습 알고리즘	DynamicMLP
학습 조건	batch_size = 512 optimizer = SGD max_epoch = 500 istart_lr = 0.04 momentum=0.9 weight_decay = 0.0001
파일 형식	이미지데이터 : jpg
파일 형식	라벨링데이터 : json
전체 구축 데이터 대비 모델에 적용되는 비율	100
모델 학습 과정별 데이터 분류 및 비율 정보	• 학습용 데이터셋: 41,188 (비율 : 8) • 검증용 데이터셋: 10,297 (비율 : 1) • 평가용 데이터셋: 10,297 (비율 : 1)

유효성 검증 항목(출고물품)
유효성 검증 항목
항목명	3D 생성 성능(출고 물품)
검증 방법	3D 생성을 통해 생성된 모델의 부피와 실제 물품의 부피 비교
목적	이미지를 통한 물품 부피 추정 성능 확인
지표	3D IoU
측정 산식
도커 이미지	A-Point-Set-Generation-Network-for-3D-Object-Reconstruction-from-a-Single-Image.tar.gz
실행 파일명	eval.py
유효성 검증 환경
CPU	Intel(R) Xeon(R) Silver 4210 CPU @ 2.20GHz
Memory	251G
GPU	GeForce RTX 2080 Ti * 8
Storage	3.6TB
OS	Ubuntu (20.04)
유효성 검증 모델 학습 및 검증 조건
개발 언어	Python 3.8.10
프레임워크	CUDA 11.6, Pytorch 1.13.1
학습 알고리즘	PSGN
학습 조건	batch_size = 32 optimizer = Adam max_epoch = 50 lr = 0.001
파일 형식	이미지데이터 : jpg
파일 형식	라벨링데이터 : json
전체 구축 데이터 대비 모델에 적용되는 비율	100
모델 학습 과정별 데이터 분류 및 비율 정보	• 학습용 데이터셋: 49,620장 (8,270개 물품) (비율 : 8) • 검증용 데이터셋: 6,204장 (1,034개 물품) (비율 : 1) • 평가용 데이터셋: 6,204장 (1,034개 물품) (비율 : 1)
제한사항	학습 및 평가시 물품 단위로 데이터 처리

□ 서비스 활용 모델

ExpansionNet v2

‘ExpansionNetV2’는 이미지 캡션 생성을 위한 새로운 모델로, 입력 시퀀스의 고정된 길이 제한을 극복하기 위해 개발되었다. 이 모델은 기존 어텐션 기반 시스템과 달리 입력 데이터를 확장하여 다양한 시퀀스 길이를 처리할 수 있는 메커니즘을 도입하였다. 이를 통해 고정된 길이 제한을 초월하고, 더 유연하고 효율적인 데이터 처리를 가능하게 하였다.

‘ExpansionNetV2’ 모델 구조
[‘ExpansionNetV2’ 모델 구조]

‘ExpansionNetV2’의 핵심 기술은 Static Expansion과 Dynamic Expansion이다. Static Expansion은 고정된 길이로 확장하여 양방향 처리를 지원하고, Dynamic Expansion은 가변적 길이 확장을 통해 자동 회귀와 양방향 처리를 모두 지원한다. 이 확장 메커니즘은 시퀀스 처리에서 성능 병목 현상을 완화하며, 다양한 길이의 데이터를 효율적으로 다룰 수 있도록 설계되었다.또한, 기존 접근 방식보다 최대 2.8배 빠른 엔드투엔드 학습 전략을 통해 학습 성능과 비용 효율성을 크게 향상시켰다.

모델 구조는 Swin-Transformer 기반의 인코더-디코더 구조로 구성되어 있다. 인코더는 Static Expansion 블록을 사용해 이미지 특징을 추출하고 변환하며, 디코더는 Dynamic Expansion 블록과 교차 어텐션을 활용하여 입력 시퀀스를 처리하고 캡션을 생성한다. 최종 출력은 선형 투영층과 분류 층을 통해 도출된다. 이 과정에서 교차 엔트로피 손실과 CIDEr-D 최적화 손실을 함께 사용하여 높은 품질의 캡션을 생성한다.

성능 평가 결과, ExpansionNetV2는 MS COCO 2014 데이터 세트을 기준으로 오프라인 CIDEr-D 143.7점, 온라인 CIDEr-D 140.8점을 기록하며, 기존 모델보다 빠른 학습 속도와 우수한 성능을 입증하였다. 특히 BLEU, METEOR, ROUGE, CIDEr-D 등 다양한 평가 지표에서 높은 점수를 기록하며 최신 모델들과 비교해 경쟁력을 입증하였다. 또한, 훈련 시간은 기존 모델 대비 최대 2.8배 빠르며, 대규모 데이터 세트을 활용한 생성 모델과 비교해도 훨씬 적은 데이터와 자원으로 높은 성능을 달성하였다.

다만, 새로운 객체나 개념에 대한 일반화 성능은 최신 대규모 사전 학습 기반 모델에 비해 다소 떨어질 수 있다. 그럼에도 불구하고, ExpansionNetV2는 제한된 리소스로도 높은 성능을 요구하는 비전-언어 통합 작업에 적합하며, 학습 효율성과 확장성을 고려한 설계를 통해 이미지 캡션 생성 분야에서 새로운 가능성을 제시한다.

설명서 및 활용가이드 다운로드

데이터 설명서 다운로드 구축활용가이드 다운로드

□ 데이터 구성 및 포맷

데이터 구성 및 포맷
구분	원시데이터	원천데이터	라벨링데이터	Other 데이터
데이터 형태	이미지	이미지	물품정보, 폴리곤 어노테이션, 이미지 캡션	정형(센서) 데이터, 창고 정보 등
데이터 포맷	JPG	JPG	JSON	JSON, CSV

□ 어노테이션 포맷

어노테이션 포맷
구분			속성명	타입	필수여부	설명	범위	비고
1			info	object	Y	일반 정보	-	-
	1-1		info.contributor	string	Y	데이터 구축기업	-	흥일기업 컨소시엄
	1-2		info.project_name	string	Y	데이터 구축과제명	-	물류공간 예측 데이터
2			images[]	array	Y	이미지 정보	-	-
	2-1		images[].id	number	Y	이미지 ID	-	-
	2-2		images[].file_name	string	Y	이미지 파일명	-	-
	2-3		images[].width	number	Y	이미지 너비	0~1920	1920
	2-4		images[].height	number	Y	이미지 높이	0~1080	1080
	2-5		images[].shot_id	number	Y	촬영 번호	1~2	-
	2-6		images[].cam_id	number	Y	카메라 번호	1~3	-
3			annotations[]	array	Y	어노테이션 정보	-	-
	3-1		annotations[].id	number	Y	어노테이션 ID	-	-
	3-2		annotations[].image_id	number	Y	어노테이션 대상 이미지 ID	-	-
	3-3		annotations[].category_id	number	Y	카테고리 ID	-	KAN 상품분류코드 대분류코드
	3-4		annotations[].segmentation	array	Y	세그멘테이션 라벨링	-	폴리곤 형식
	3-5		annotations[].area	number	Y	라벨링 면적	-	폴리곤 면적
	3-6		annotations[].bbox	array	Y	바운딩박스 라벨링	-	xywh 포맷
	3-7		annotations[].iscrowd	number	N	군중객체 여부	0	저작도구 로드시 필요
	3-8		annotations[].attributes	object	Y	물품 정보	-	-
		3-8-1	annotations[].attributes.length	number	Y	물품 길이	0~120	단위 : cm
		3-8-2	annotations[].attributes.width	number	Y	물품 너비	0~120	단위 : cm
		3-8-3	annotations[].attributes.height	number	Y	물품 높이	0~120	단위 : cm
		3-8-4	annotations[].attributes.weight	number	Y	물품 무게	0~99	단위 : kg
		3-8-5	annotations[].attributes.fragile	boolean	Y	파손주의 물품	true, false	입고물품 분류
		3-8-6	annotations[].attributes.refrigerate	boolean	Y	보냉재 필요물품	true, false	입고물품 분류
		3-8-7	annotations[].attributes.irregular	boolean	Y	비정형물품	true, false	-
		3-8-8	annotations[].attributes.barcode	string	Y	바코드	-	바코드 정보 선택적 활용, 물류업체 관리코드 사용 가능
		3-8-9	annotations[].attributes.product_name	string	Y	상품명	-	-
		3-8-10	annotations[].attributes.KAN_code	string	Y	KAN분류코드	-	8자리 코드
		3-8-11	annotations[].attributes.size_id	number	Y	물품 규격 정보	-	1:극소형 2:소형 ... 6:특수
		3-8-12	annotations[].attributes.caption	string	N	이미지 캡션	-	입고물품 캡션 추가 구축
4			categories	array	Y	카테고리 정보	-	-
	4-1		categories[].id	number	Y	대분류 ID	-	1:가공식품 2:신선식품 ... 11:패션잡화
	4-2		categories[].name	string	Y	대분류명	-	-

□ 데이터 실제 예시

데이터 실제 예시 1 데이터 실제 예시 2

데이터 실제 예시 3
<상품 특성 및 캡션 상세 예시>

데이터셋 구축 담당자

수행기관(주관) : 흥일기업(주)

수행기관(주관)
책임자명	전화번호	대표이메일	담당업무
전병훈	02-6283-0156	bhjeon@hungil.co.kr	데이터 구축 총괄, 데이터 정제, 데이터 가공

수행기관(참여)

수행기관(참여)
기관명	담당업무
아세아도(주)	데이터 수집
국립한밭대학교 산학협력단	AI 모델 개발

데이터 관련 문의처

데이터 관련 문의처
담당자명	전화번호	이메일
흥일기업(주) 전병훈 차장	02-6283-0156	bhjeon@hungil.co.kr
흥일기업(주) 육효진 대리	02-6283-0156	hjyuk@hungil.co.kr

AI모델 관련 문의처

AI모델 관련 문의처
담당자명	전화번호	이메일
국립한밭대학교 산학협력단 최동걸 교수	042-821-1213	dgchoi@hanbat.ac.kr
국립한밭대학교 산학협력단 유용현 연구원	010-9144-2165	yonghyeon0316 @gmail.com

저작도구 관련 문의처

저작도구 관련 문의처
담당자명	전화번호	이메일
흥일기업(주) 전병훈 차장	02-6283-0156	bhjeon@hungil.co.kr
흥일기업(주) 육효진 대리	02-6283-0156	hjyuk@hungil.co.kr

보건의료 데이터 개방 안내

보건의료 데이터는 온라인 및 오프라인 안심존을 통해 개방됩니다.

안심존이란 안심존 이용메뉴얼 안심존 이용신청 데이터 열람신청

인터넷과 물리적으로 분리된 온라인·오프라인 공간으로 의료 데이터를 포함하여 보안 조치가 요구되는 데이터를 다운로드 없이 접근하고 분석 가능
* 온라인 안심존 : 보안이 보장된 온라인 네트워크를 통해 집, 연구실, 사무실 등 어디서나 접속하여 데이터에 접근하고 분석
* 오프라인 안심존 : 추가적인 보안이 필요한 데이터를 대상으로 지정된 물리적 공간에서만 접속하여 데이터에 접근하고 분석
1. AI 허브 접속
  신청자
2. 안심존
  사용신청신청자신청서류 제출*
3. 심사구축기관
4. 승인구축기관
5. 데이터 분석 활용신청자
6. 분석모델반출신청자
1. 기관생명윤리위원회(IRB) 심의 결과 통지서 [IRB 알아보기] [공용IRB 심의신청 가이드라인]
2. 기관생명윤리위원회(IRB) 승인된 연구계획서
3. 신청자 소속 증빙 서류 (재직증명서, 재학증명서, 근로계약서 등 택1)
4. 안심존 이용 신청서 [다운로드]
5. 보안서약서 [다운로드]
※ 상기 신청서 및 첨부 서류를 완비한 후 신청을 진행하셔야 정상적으로 절차가 이루어집니다.
신청 및 이용관련 문의는 safezone1@aihub.kr 또는 02-525-7708, 7709로 문의