시설 작물 질병 진단 이미지

시설 작물 질병 진단 이미지

데이터셋명 시설 작물 질병 진단
데이터 분야 농축수산 데이터 유형 이미지
구축기관 라온피플 데이터 관련 문의처 담당자명 감명곤(라온피플)
가공기관 미래농업포럼, 전주정보문화산업진흥원 전화번호 031-698-3360
검수기관 전주정보문화산업진흥원 이메일 kammk73@laonpeople.com
구축 데이터량 34만 구축년도 2020년
버전 1.0 최종수정일자 2021.06.25
소개 시설작물의 질병 진단을 위한 주요 시설원예작물(10종)질병 이미지 데이터
주요 키워드 농업, 스마트팜, 시설 작물, 작물 질병, 질병 진단, 질병 예찰, 작물 질병 데이터셋
저작권 및 이용정책 본 데이터는 과학기술정보통신부가 주관하고 한국지능정보사회진흥원이 지원하는 '인공지능 학습용 데이터 구축사업'으로 구축된 데이터입니다. [데이터 이용정책 상세보기]
데이터설명서 자료보기 v1 자료보기 v2 구축활용가이드 자료보기
샘플데이터 다운로드 교육활용동영상 영상보기
저작도구 다운로드 AI모델 다운로드
데이터 변경이력
버전 일자 변경내용 비고
1.0 2021.06.25 데이터 최초 개방  
구축 목적
  • 시설 작물의 질병 진단 및 처방 목적의 학습 데이터 구축
활용 분야
  • AI 기반 스마트 병해충 진단 및 예찰을 위한 AI 비전 기술 개발
소개
  • 시설 재배 작물로 분류되는 총 12 종의 작물에서 자주 발생하는 20 종의 질병을 선별, 각 질병에 대한 비정상(발병) 이미지 및 대응 부위의 정상 이미지를 포함한 AI 학습용 데이터를 구축함.
  • 국내 발병 사례 기반으로 우선순위를 두어 접근성과 활용도를 목표하였으며, 재사용에 제한이 없도록 저작권 문제를 완전히 해결한 원천 데이터만을 취급함.
  • 이미지 전체에 대한 질병 유무 태깅에 그치지 않고, 촬영 부위와 발병된 질병의 명칭, 피해 정도, 발병 부위의 위치 정보를 모두 명기하여, 데이터의 활용도에 따라 작물 질병에 대한 고차원 연구 및 고도화 된 상용화 서비스를 기대할 수 있음.

 

시설 작물 질병 진단 소개 이미지

 

구축 내용 및 제공 데이터량
  • 실제 촬영본 45만 건 (정상 41만 건, 질병 4만 건)을 활용하여, 각각 정상 작물 이미지 12만 건, 질병 원본 이미지 2만 건, 질병 증    강  이미지 20만 건을 포함, 작물 12종에 대해 총 46만 건의 시설    작물 질병 학습 데이터 도출
  • 촬영 사진 내에서 관찰 대상인 부위를 관심 영역으로써 bounding box annotation을 1차 수행, 해당 영역 내에서 관찰되는 정상/질병에 대한 class number 할당
  • 질병으로 분류된 이미지를 바탕으로 각종 transform 기법으로 변환  된 증강 데이터 생성
    구축 내용 및 제공 데이터량 표
    구분 시설 작물 질병
    작물명 질병명 구축수량
    0 정상 - 204,909
    1 가지 가지잎곰팡이병 7,271
    가지흰가루병 4,057
    2 고추 고추마일드모틀바이러스 54,429
    고추점무늬병 9,053
    3 단호박 단호박점무늬병 10,549
    단호박흰가루병 8,537
    4 딸기 딸기잿빛곰팡이병 12,981
    딸기흰가루병 11,950
    5 상추 상추균핵병 22,234
    상추노균병 22,793
    6 수박 수박탄저병 10,286
    수박흰가루병 7,518
    7 애호박 애호박점무늬병 3,278
    8 쥬키니
    호박
    오이녹반모자이크바이러스 22,935
    9 오이 오이모자이크바이러스 4,411
    10 참외 참외노균병 5,677
    참외흰가루병 6,017
    11 토마토 토마토잎곰팡이병 11,792
    토마토황화잎말이바이러스 15,246
    12 포도 포도노균병 2,950
    합계     459,873

 

대표도면
대표도면대표도면-2 참외노균병대표도면-3 참외흰가루병

 

필요성
  • 작물 재배에 있어 작물에 발생하는 질병을 조기에 진단하는 것은 매우 중요하나 제한된 인력으로 모든 작물을 진단하는 것은 한계가 있음.
  • 이에 대해 작업자가 미처 판단하지 못한 작물 질병을 진단하고 작업자의 오판을 보조하는 목적의 AI 자동화 시스템의 구축은 상기 문제점의 대안이 될 것으로 기대됨.
  • AI 자동화 시스템을 구축하기 위한 선결 조건은 방대한 데이터를 확보하여 AI 모델을 학습하는 것이나, 현재 공개된 데이터베이스는 낮은 접근성 및 환경적 차이로 현실에 맞지 않은 경우가 많음
  • 이에 대한민국에서 많이 재배되는 시설 작물 중 크게 피해를 입히는 질병을 선정, 피해 정도를 구분하여 구축함. 
  • 구축 시 예찰과 진단을 동시에 실현 가능한 AI 모델을 산출할 수 있도록 다양한 메타 속성을 추가함. 
  • 더불어 향후 예찰, 진단 시스템 이외에도 시설 작물 재배 연구에 있어 AI를 쉽게 접목할 수 있도록 서비스를 제공하고자 함.
데이터 구조
  • 데이터 구성
    데이터 구성 표
    데이터 셋 데이터 구성 데이터 예시 데이터 형식
    시설 작물
    방해 이미지
    ▶ 병해에 대한 진전도별
         이미지
       - 정상, 초기, 중기, 말기
         구분별이미지

    ▶ 촬영 환경(위치, 시간 등) 및
        질병코드 분류(대상작물, 질병)
        등 메타정보 포함

    <정상작물이미지>

    데이터구성_정상작물

    <감염작물이미지>

    데이터구성_감염작물

    JPEG파일,
    JSON 파일

     

  • 어노테이션 포맷
    어노테이션 포맷 표
    분류 항목 형식 종류 예시
    이미지 정보
    (description)
    파일 이름
    (image)
    문자열 X 01.jpeg
    취득 일자
    (date)
    문자열 X 2020/11/30
    촬영 지역
    (region)
    정수 X 12
    이미지 높이
    (height)
    정수 X 3024
    이미지 너비
    (width)
    정수 X 4032
    과제 번호
    (task)
    정수 77, 78, 79, 80 77
    촬영 유형
    (type)
    정수 0 (정상)
    1 (질병)
    2 (해충)
    3 (충해)
    1
    학습용정보
    (annotations)
    질병/해충 코드
    (disease)
    정수 0, 1, ..., 20 14
    작물 코드
    (crop)
    정수 0, 1, ..., 12 9
    촬영 부위
    (area)
    정수 0, 1, ..., 7 3
    작물 생육단계
    (grow)
    정수 11 (육묘기)
    12 (생장기)
    13 (착화/과실기)
    12
    질병 피해 정도
    (risk)
    정수 0 (정상)
    1 (초기)
    2 (중기)
    3 (말기)
    2
    주목 객체의
    bbox 좌표
    (points)
    딕셔너리 {xtl, ytl, xbr, ybr} {"xtl": 100, "ytl": 200,
    "xbr": 1100, "ybr": 1200}
데이터셋 구축 담당자
수행기관(주관) : 라온피플
수행기관(주관) 표
책임자명 전화번호 대표이메일 담당업무
감명곤 031-698-3360 kammk73@laonpeople.com · 수행 관리 총괄
· AI 학습용 데이터 모델 분석 및 설계
· AI 학습용 데이터 알고리즘 개발
· AI 학습용 데이터 모델 구축 및 검증
· 검수 완료 데이터 증강 
· AI 학습용 데이터 품질 검증

 

수행기관(참여)
수행기관(참여) 표
기관명 담당업무 기관명 담당업무
원투씨엠 · 병해충 진단 AI를 활용한 응용서비스 개발 기획 및 구축
· 응용서비스 진행에 필요한 콘텐츠 DB구축
인프라큐브 · 응용서비스 개발 (AI 연계 APP)
㈜팜한농 · 데이터 수집 기획
· 현장 데이터 수집(정상작물)
· 자체 보유 데이터 제공
미래농업포럼 · 피해 작물 데이터 수집(질병/해충)
· 수집 데이터 가공 (질병/해충 데이터)
· 크라우드소싱 인력 관리
전주정보문화산업진흥원 · 수집 데이터 정제/가공(정상작물 데이터)
· 크라우드소싱 인력 교육 진행 및 관리
· 품질 표준화 및 관리
· 생태계 활성화(교육 과정 개발, 해커톤 대회 개최 등)