농산물 품질(QC) 이미지

농산물 품질(QC) 이미지

데이터셋명 농산물 품질(QC) 이미지
데이터 분야 농축수산 데이터 유형 이미지
구축기관 경상대학교 산학협력단 데이터 관련 문의처 담당자명 홍동혁(경북대학교)
가공기관 기바엔터내셔날, 경북대학교 전화번호 053-956-7006
검수기관 이조인테크, 경북대학교 이메일 bear0011@knu.ac.kr
구축 데이터량 30만 구축년도 2020년
버전 1.0 최종수정일자 2021.06.18
소개 농산물 상품 등급 분류를 위한 농산물(20종) 상품 등급 이미지 데이터
주요 키워드 농산물 품질, 농산물 품종별 품질기준 분류
저작권 및 이용정책 본 데이터는 과학기술정보통신부가 주관하고 한국지능정보사회진흥원이 지원하는 '인공지능 학습용 데이터 구축사업'으로 구축된 데이터입니다. [데이터 이용정책 상세보기]
데이터설명서 자료보기 구축활용가이드 자료보기
샘플데이터 다운로드 교육활용동영상 영상보기
저작도구 다운로드 AI모델 다운로드
데이터 변경이력
버전 일자 변경내용 비고
1.0 2021.06.18 데이터 최초 개방  
구축 목적
  • 인공지능 학습을 위한 학습용 농산물 이미지 데이를 수집, 정제를 거친 후 메타데이터가 추가된 농산물의 품질을 판단하는 AI학습용 데이터를 만드는 것이 목적인 데이터셋
활용 분야
  • 농산물 10종의 품질을 국가가 정해놓은 기준으로 일반소비자 또는 농가에서 인공지능 프로그램을 이용하여 정확하게 파악할 수 있는 기준을 제공하는 데이터셋으로서 농산물 품질에 대한 AI 요약기술 개발에 용이함
소개
  • 우리나라 농산물 중 시설재배 품목을 제외, 소비량이 많고 수입 의존도가 낮은 10개의 품목을 선정 : 농림축산식품부 농산물 도매시장 통계연보 (2017년, 2018년)를 참조하여 과제 수행 기간에 이미지 확보에 어려움이 없고 거래량이 충분한 상위 10개의 청과품목 (무, 배추, 양파, 마늘, 양배추, 감, 사과, 배, 감귤, 감자)를 선정하여 농산물 품질을 구분할 수 있는 기준과 품질 분류를 제공하는 원천 데이터를 확보

 

농산물 품질 소개 이미지

 

구축 내용 및 제공 데이터량
  • 원문데이터 60만 건 (농산물 10 품목에 대하여 각 6만 건 씩 확보하여 농산물 품질 기준으로 특, 상, 보통 품으로 분류)을 활용하여 확보된 원시데이터 60만 건 중 정제과정을 거쳐 30만 건 선정, 가공/검수 검증 작업을 거쳐 AI응용서비스에 적용하여 AI응용서비스 개발 (농산물 품질 검증 App, Web 버전)
     
  • 데이터 세부사항
    데이터 세부사항 표
    구조 1. 파일 유형 : png
    2. 파일명 : 작물명_
    형태 대상 농작물을 촬영한 이미지 파일
    품질 - 해상도(1만 화소 이상) AI 학습 모델 머신 러닝에 실질적으로 활용할 데이터
    - 해상도(100만 화소 이상) 이미지 및 가공 처리로 품질 높음
    가공 형태 1. 이미지 전처리
       - 인공지능이 학습 가능한 형태로 이미지 파일 편집
    2. 이미지 라벨링
       - 농산물 품질등급에 따라 이미지 분류
    3. 파일네이밍
       - 데이터 관리의 용이성을 위하여 파일명을 수정
    메타데이터 작물의 종류, 품종의 종류, 촬영각도, 촬영장비, 촬영장소, 촬영날짜, 장소, 크기, 부피
    라이선스 직접 촬영한 데이터로 라이선스 없음
대표도면

농산물 품질 대표도면 이미지
대표도면
카메라 위치 Top 1 카메라 FR 45o
2 카메라
FR 90o
3 카메라
DI 45o
4 카메라
DI 90o
5 카메라
이미지
각도
이미지 번호 1 2 3 4 5 0o
6 7 8 9 10 90o
11 12 13 14 15 180o
16 17 18 19 20 270o
↓상품의 뒷면
카메라 위치 Top 1 카메라 FR 45o
2 카메라
FR 90o
3 카메라
DI 45o
4 카메라
DI 90o
5 카메라
이미지
각도
이미지 번호 21 22 23 24 25 0o
26 27 28 29 30 90o
31 32 33 34 35 180o
36 37 38 39 40 270o

<5대 카메라를 이용한 농산물 이미지 촬영 방법>

필요성
  • 인공지능 개발을 위한 학습용 데이터는 방대한 양과 목적에 맞는 양질의 데이터를 필요로 함
  • 농산물 품질(QC) 이미지 데이터셋의 경우, 이를 위하여 명확하게 목표를 수립하고 대상 영역에 대한 분석, 데이터의 수집 방안, 가공 및 수립 방안, 수집된 데이터의 품질 평가 및 관리 방안, 최신 데이터의 확보를 통한 학습용 데이터의 최적화 방안이 마련되어야 함
  • 농산물 품질 데이터 수집/저장/정제 도구를 활용하여 농산물 품질에 대한 AI응용서비스 개발을 위하여 반드시 필요한 데이터셋
데이터 구조
  • 데이터 구성
    데이터 세부사항 표
    구조 1. 파일 유형 : png
    2. 파일명 : 작물명_
    형태 대상 농작물을 촬영한 이미지 파일
    품질 - 해상도(1만 화소 이상) AI 학습 모델 머신 러닝에 실질적으로 활용할 데이터
    - 해상도(100만 화소 이상) 이미지 및 가공 처리로 품질 높음
    가공 형태 1. 이미지 전처리
       - 인공지능이 학습 가능한 형태로 이미지 파일 편집
    2. 이미지 라벨링
       - 농산물 품질등급에 따라 이미지 분류
    3. 파일네이밍
       - 데이터 관리의 용이성을 위하여 파일명을 수정
    메타데이터 작물의 종류, 품종의 종류, 촬영각도, 촬영장비, 촬영장소, 촬영날짜, 장소, 크기, 부피
    라이선스 직접 촬영한 데이터로 라이선스 없음

 

  • 어노테이션 포맷
    어노테이션 포맷 표
    no 항목명 설명 필수여부
    1     image 이미지 정보 Y
    1-1   identifier 파일명  
    1-2   imsize 이미지 파일 크기 Y
    1-3   copyright 이미지 저작권 소유자  
    1-4   date 데이터 취득 일자  
    1-5   resolution 해상도 Y
    1-6   bit 비트값 Y
    1-7   F-Stop 조리개 투과량 Y
    1-8   exposure time 노출 시간 Y
    1-9   ISO ISO 감도 Y
    1-10   focal length 초점 거리 Y
    1-11   full aperture 조리개 최대 개방 수치 Y
    1-12   view angle 화각  
    1-13   white balance 화이트 밸런스 Y
    1-14   depth RGB 여부  
    2     regions 관련 정보  
    2-1   type 어노테이션 종류  
    2-2   boxcomers 어노테이션 좌표 값  
    2-3   ansize 이미지 영역 사이즈  
    2-4   class 클래스명  
    2-5   tags 분류항목  
      2-5-1 truncated 대상체 잘림 여부  
      2-5-2 종ID 종 아이디 정보 Y
      2-5-3 과일 종류 과일 종류 정보 Y
      2-5-4 품질 등급 품질 등급 정보 Y
      2-5-5 촬영면 상, 하부 정보 Y
      2-5-6 verticality angle 촬영 수직각도 Y
      2-5-7 horizontality angle 촬영 수평각도 Y
      2-5-8 height 품목의 높이 Y
      2-5-9 width 품목의 너비 Y
      2-5-10 weight 품목의 무게 Y
      2-5-11 Instance 대상체  
      2-5-12 Instance Upper 대상체 상위 레벨  
      2-5-13 GPS 위도 GPS 위도 값  
      2-5-14 GPS 경도 GPS 경도 값  
    2-6   instance_uri 온톨로지 uri 정보  
    2-7 2-7-1 sem_ext 의미확장 정보  
      2-7-2 property:locatedln 의미확장 지역정보 Y
      2-7-3 property:relatedTerm 의미확장 연관정보  
      2-7-4 property:description 의미확장 상세정보  
데이터셋 구축 담당자
수행기관(주관) : 경상대학교 산학협력단
수행기관 (주관)
책임자명 전화번호 대표이메일 담당업무
홍동혁 053-956-7006 bear0011@knu.ac.kr · 원천데이터 촬영 및 현지조사
· 데이터구축 총괄
수행기관(참여)
수행기관(참여)
기관명 담당업무 기관명 담당업무
경북대학교
산학협력단
· 데이터 수집 기획, 데이터 수집, 데이터 저장 기바인터내셔날(주) · 농산물 품질(QC) 이미지 수집, 정제, 가공, 검수, 검증
· 데이터 서버 관리
· 크라우드 소싱 플랫폼 개발
· AI응용서비스 BETA 개발 기획, 응용서비스 개발
혁신과미래
사회적협동조합
· 요약문 작성(크라우드소싱 활용)
크라우드소싱 플랫폼 관리, 크라우드 워커 인력관리
(주)이노하이퍼 · AI 모델 개발 기획, 정제, 가공 업무
(주)이조인테크 · AI 요약모델을 활용한 응용서비스 개발 기획, 데이터 검수 업무