상품 이미지 소개
기본탭
데이터셋명 | 상품 이미지 | |||
---|---|---|---|---|
데이터 분야 | 비전 | 데이터 유형 | 이미지 | |
구축기관 | 롯데정보통신 | 데이터 관련 문의처 | 담당자명 | 전시형(롯데정보통신) |
가공기관 | 에이모 | 전화번호 | 02-2028-9010 | |
검수기관 | 롯데정보통신, 에이모 | 이메일 | sihyoung.jurn@lotte.net | |
구축 데이터량 | 60만 | 구축년도 | 2020년 | |
버전 | 1.0 | 최종수정일자 | 2021.06.25 | |
소개 | 물류창고, 무인 스토어 등에서 탐지, 식별 솔루션에 활용될 수 있는 상품 이미지 데이터 | |||
주요 키워드 | 상품분류, 상품인식, 상품이미지, 무인매장, 키오스크, 셀프결제 | |||
저작권 및 이용정책 | 본 데이터는 과학기술정보통신부가 주관하고 한국지능정보사회진흥원이 지원하는 '인공지능 학습용 데이터 구축사업'으로 구축된 데이터입니다. [데이터 이용정책 상세보기] | |||
데이터설명서 | 자료보기 | 구축활용가이드 | 자료보기 | |
샘플데이터 | 다운로드 | 교육활용동영상 | 영상보기 | |
저작도구 | 다운로드 | AI모델 | 업데이트 중 |
데이터 변경이력
버전 | 일자 | 변경내용 | 비고 |
---|---|---|---|
1.0 | 2021.06.25 | 데이터 최초 개방 |
구축 목적
- 소상공인 자동화 매장 구축을 위해 활용 가치가 높은 10,000종 이상의 상품에 대해 데이터를 구축해서 다양한 상품 분류 서비스 개발에 활용될 목적으로 구축됨
활용 분야
- 유통 매장 진열 상품을 분류하는 서비스, 선반,셀프결제대 상품 인식 하여 결제 하는 서비스, 결품 확인 서비스 등 활용 가능
소개

- 본 데이터셋은 일반적으로 이미지 분류 기술의 학습에 활용하는 이미지 및 라벨(정답) 쌍의 약 10,000 종 이상의 상품 데이터셋으로 구성되어있다.
- 다양한 응용 서비스에 활용될 수 있도록 상품 촬영의 다양한 각도별 고품질 이미지를 제공하며, 연구자가 다양한 실험을 진행할 수 있기에 충분한 양으로 구성하였다.
- 이는 상용화 단계에서 강력한 사전 학습 vision AI 모델을 만들 수 있는 양이다.
- 본 데이터셋을 통해 응용서비스를 구축하고, 이를 공유하여 AI 기술 개발과 확산을 실현하고, 나아가 AI 기술의 지속적 고도화에 기여 할 것으로 기대한다.
구축 내용 및 제공 데이터량
- 본 데이터셋은 14개 대분류의 약 10,000개 이상 상품으로 구성되어 있다
대분류 | 수량 |
---|---|
과자 | 1,693 |
디저트 | 77 |
면류 | 208 |
상온HMR | 1,093 |
생활용품 | 1,112 |
소스 | 736 |
유제품 | 291 |
음료 | 1,130 |
의약외품 | 203 |
이/미용 | 2,019 |
주류 | 496 |
커피차 | 508 |
통조림/안주 | 322 |
홈클린 | 392 |
합계 | 10,280 |
- - 단수 상품 이미지 72만장, 복수 상품 이미지 72만장 총 144만장 제공됨
대분류 | 이미지 수량 |
---|---|
10,000개 상품*3개 높이(0도,30도,60도) * 24개 각도(단수상품) | 720,000 |
10,000개 상품*3개 높이(0도,30도,60도) * 24개 각도(복수상품) | 720,000 |
합계 | 1,440,000 |
대표도면
구분 | 예시 |
---|---|
Pitch | ![]()
|
Roll | ![]()
|

필요성
- 유통매장의 상품을 인식하고 분류하는 서비스 개발을 위한 국내 상품 데이터셋 부재
- 상품이 진열되어 있는 다양한 Pitch와 Roll에 대한 분류 정확도를 높이기 위한 고품질 이미지 데이터셋 부재
- 다양한 제품군의 균일한 분포의 상품 이미지 데이터셋 부재
- 이러한 상품 이미지 데이터를 구축하기 위해 소상공인들이 투자할 여력이 없으며, 해당 데이터셋 활용을 통해 새로운 응용 서비스를 개발하고 적용하기 어렵움
- 이번 10,000 종 이상에 대한 상품 이미지와 라벨링 데이터 제공함에 따라 다양한 View(각도)의 상품 데이터를 활용해서 소상공인들이 활용가능한 다양한 탐지(Detection), 인지(Recognize), 정보(Information), 유사상품(Similar) 제공 서비스 제공
데이터 구조
- 어노테이션 포맷
NO | 항목명 | 설명 | |||
---|---|---|---|---|---|
1 | comp_cd | 제조사 코드 | |||
1-1 | div_cd | 분류 코드 | |||
1-1-1 | item_cd | 상품코드 | |||
1-1-2 | item_no | 상품번호 | |||
1-1-3 | div_l | 대분류 | |||
1-1-4 | div_m | 중분류 | |||
1-1-5 | div_s | 소분류 | |||
1-1-6 | div_n | 세분류 | |||
1-1-7 | comp_nm | 제조사 | |||
1-1-8 | prod_nm | 상품명 | |||
1-1-9 | vessel | 용기 | |||
1-1-10 | volume | 용량 | |||
1-1-11 | barcd | 바코드번호 | |||
1-1-12 | width | 가로 | |||
1-1-13 | length | 세로 | |||
1-1-14 | height | 높이 | |||
1-1-15 | img_prod_nm | 상품명(이미지상) | |||
1-1-16 | nutrition_info | 영양기능정보 | |||
2 | annotation | 어노테이션 정보 | |||
2-1 | folder | 이미지 디렉토리명 | |||
2-2 | filename | 이미지 파일명 | |||
2-3 | path | 이미지 파일 경로 | |||
2-4 | source | 출처 정보 | |||
2-4-1 | database | DB명 | |||
2-5 | size | 이미지 파일 크기 | |||
2-5-1 | width | 너비 픽셀 | |||
2-5-2 | height | 높이 픽셀 | |||
2-5-3 | depth | 차원(RGB: 3) | |||
2-6 | segmented | 분할 여부 | |||
2-7 | object | 라벨링 객체 정보 | |||
2-7-1 | name | 상품코드 | |||
2-7-2 | pose | 방향 | |||
2-7-3 | truncated | 객체의 영역 초과 | |||
2-7-4 | difficult | 난이도 | |||
2-7-5 | bndbox | 바운딩 박스 좌표 | |||
2-7-5-1 | xmin | x최솟값 | |||
2-7-5-2 | ymin | y최솟값 | |||
2-7-5-3 | xmax | x최댓값 | |||
2-7-5-4 | ymax | y최댓값 |
데이터셋 구축 담당자
수행기관(주관) : 롯데정보통신
책임자 | 전화번호 | 대표이메일 | 담당업무 |
---|---|---|---|
전시형 | 02-2028-9010 | sihyoung.jurn@lotte.net | · 데이터구축 총괄 · AI 모델 개발 · 응용서비스 데모서비스 개발 |
수행기관(참여)
기관명 | 담당업무 | 기관명 | 담당업무 |
---|---|---|---|
케이원정보통신 | · 원천데이터 구매, 촬영 | 에이모 | · 데이터 가공 (크라우드소싱 활용) · 결과물 검수 및 검증 |