상품 이미지

상품 이미지

데이터셋명 상품 이미지
데이터 분야 비전 데이터 유형 이미지
구축기관 롯데정보통신 데이터 관련 문의처 담당자명 전시형
가공기관 에이모 전화번호 02-2626-4000
검수기관 롯데정보통신, 에이모 이메일 aidata@lotte.net
구축 데이터량 60만 구축년도 2020년
버전 1.0 최종수정일자 2021.06.25
소개 물류창고, 무인 스토어 등에서 탐지, 식별 솔루션에 활용될 수 있는 상품 이미지 데이터
주요 키워드 상품분류, 상품인식, 상품이미지, 무인매장, 키오스크, 셀프결제
저작권 및 이용정책 본 데이터는 과학기술정보통신부가 주관하고 한국지능정보사회진흥원이 지원하는 '인공지능 학습용 데이터 구축사업'으로 구축된 데이터입니다. [데이터 이용정책 상세보기]
데이터설명서 자료보기 구축활용가이드 자료보기
샘플데이터 다운로드 교육활용동영상 영상보기
저작도구 다운로드 AI모델 다운로드
데이터 변경이력
버전 일자 변경내용 비고
1.0 2021.06.25 데이터 최초 개방  
구축 목적
  • 소상공인 자동화 매장 구축을 위해 활용 가치가 높은 10,000종 이상의 상품에 대해 데이터를 구축해서 다양한 상품 분류 서비스 개발에 활용될 목적으로 구축됨
활용 분야
  • 유통 매장 진열 상품을 분류하는 서비스, 선반,셀프결제대 상품 인식 하여 결제 하는 서비스, 결품 확인 서비스 등 활용 가능
소개
상품 이미지 소개 이미지

 

  • 본 데이터셋은 일반적으로 이미지 분류 기술의 학습에 활용하는 이미지 및 라벨(정답) 쌍의 약 10,000 종 이상의 상품 데이터셋으로 구성되어있다. 
  • 다양한 응용 서비스에 활용될 수 있도록 상품 촬영의 다양한 각도별 고품질 이미지를 제공하며, 연구자가 다양한 실험을 진행할 수 있기에 충분한 양으로 구성하였다. 
  • 이는 상용화 단계에서 강력한 사전 학습 vision AI 모델을 만들 수 있는 양이다. 
  • 본 데이터셋을 통해 응용서비스를 구축하고, 이를 공유하여 AI 기술 개발과 확산을 실현하고, 나아가 AI 기술의 지속적 고도화에 기여 할 것으로 기대한다. 
구축 내용 및 제공 데이터량
  • 본 데이터셋은 14개 대분류의 약 10,000개 이상 상품으로 구성되어 있다
     
구축 내용 및 제공 데이터량 표
대분류 수량
과자 1,693
디저트 77
면류 208
상온HMR 1,093
생활용품 1,112
소스 736
유제품 291
음료 1,130
의약외품 203
이/미용 2,019
주류 496
커피차 508
통조림/안주 322
홈클린 392
합계 10,280

 

  • - 단수 상품 이미지 72만장, 복수 상품 이미지 72만장 총 144만장 제공됨
     
구축 내용 및 제공 데이터량 표
대분류 이미지 수량
10,000개 상품*3개 높이(0도,30도,60도) * 24개 각도(단수상품) 720,000
10,000개 상품*3개 높이(0도,30도,60도) * 24개 각도(복수상품) 720,000
합계 1,440,000
대표도면
대표도면 표
구분 예시
Pitch 대표도면 이미지-1

 

Roll 대표도면 이미지-2

 

 

대표도면 촬영상품이미지
필요성
  • 유통매장의 상품을 인식하고 분류하는 서비스 개발을 위한 국내 상품 데이터셋 부재
  • 상품이 진열되어 있는 다양한 Pitch와 Roll에 대한 분류 정확도를 높이기 위한 고품질 이미지 데이터셋 부재
  • 다양한 제품군의 균일한 분포의 상품 이미지 데이터셋 부재
  • 이러한 상품 이미지 데이터를 구축하기 위해 소상공인들이 투자할 여력이 없으며, 해당 데이터셋 활용을 통해 새로운 응용 서비스를 개발하고 적용하기 어렵움
  • 이번 10,000 종 이상에 대한 상품 이미지와 라벨링 데이터 제공함에 따라 다양한 View(각도)의 상품 데이터를 활용해서 소상공인들이 활용가능한 다양한 탐지(Detection), 인지(Recognize), 정보(Information), 유사상품(Similar) 제공 서비스 제공
데이터 구조
  • 어노테이션 포맷
어노테이션 포맷 표
NO 항목명 설명
1       comp_cd 제조사 코드
  1-1     div_cd 분류 코드
    1-1-1   item_cd 상품코드
    1-1-2   item_no 상품번호
    1-1-3   div_l 대분류
    1-1-4   div_m 중분류
    1-1-5   div_s 소분류
    1-1-6   div_n 세분류
    1-1-7   comp_nm 제조사
    1-1-8   prod_nm 상품명
    1-1-9   vessel 용기
    1-1-10   volume 용량
    1-1-11   barcd 바코드번호
    1-1-12   width 가로
    1-1-13   length 세로
    1-1-14   height 높이
    1-1-15   img_prod_nm 상품명(이미지상)
    1-1-16   nutrition_info 영양기능정보
2       annotation 어노테이션 정보
  2-1     folder 이미지 디렉토리명
  2-2     filename 이미지 파일명
  2-3     path 이미지 파일 경로
  2-4     source 출처 정보
    2-4-1   database DB명
  2-5     size 이미지 파일 크기
    2-5-1   width 너비 픽셀
    2-5-2   height 높이 픽셀
    2-5-3   depth 차원(RGB: 3)
  2-6     segmented 분할 여부
  2-7     object 라벨링 객체 정보
    2-7-1   name 상품코드
    2-7-2   pose 방향
    2-7-3   truncated 객체의 영역 초과
    2-7-4   difficult 난이도
    2-7-5   bndbox 바운딩 박스 좌표
      2-7-5-1 xmin x최솟값
      2-7-5-2 ymin y최솟값
      2-7-5-3 xmax x최댓값
      2-7-5-4 ymax y최댓값
데이터셋 구축 담당자
수행기관(주관) : 롯데정보통신
수행기관(주관)
책임자 전화번호 대표이메일 담당업무
전시형 02-2626-4000 aidata@lotte.net · 데이터구축 총괄
· AI 모델 개발
· 응용서비스 데모서비스 개발
수행기관(참여)
수행기관(참여)
기관명 담당업무 기관명 담당업무
케이원정보통신 · 원천데이터 구매, 촬영 에이모 · 데이터 가공 (크라우드소싱 활용)
· 결과물 검수 및 검증