농업 지식베이스

농업 지식베이스

데이터셋명 농업 지식베이스
데이터 분야 농축수산 데이터 유형 이미지
구축기관 ㈜더아이엠씨 구축기관 연락처 담당자명 이태환
가공기관 전화번호 053-744-0707
검수기관 이메일 theimc@theimc.co.kr
구축 데이터량 8.6만 구축년도 2018년
버전 1.0 최종수정일자 2019.01.01
소개 시설 원예 작물 병해충의 토마토, 장미의 정상 및 병해충 감염 이미지 데이터 3만 장과 10,000개의 농업 관련 표제어 추출한 농업 용어 사전을 제공하는 지식베이스
주요 키워드 토마토 잎파리 사진, 토마토 사진, 병해충 이미지, 농업 관련 표제어, 농작물 병해충 이미지, 농업 용어, 농림 사업 정보
저작권 및 이용정책 본 데이터는 과학기술정보통신부가 주관하고 한국지능정보사회진흥원이 지원하는 '인공지능 학습용 데이터 구축사업'으로 구축된 데이터입니다. [데이터 이용정책 상세보기]
데이터설명서
구축활용가이드
샘플데이터 교육활용동영상
데이터 변경이력
버전 일자 변경내용 비고
1.0 2019.01.01 데이터 최초 개방  
필요성
  • 농업과 빅데이터의 결합으로 농업 생산성 제고, 각종 질병과 자연재해 예방은 물론 소비자의 행동과 생각까지도 분석할 수 있는 시대가 도래
  • 농업 생산과 농촌 생활 등 농업·농촌 시스템을 아우르는 가치사슬에 ICT 기술이 융·복합되면서 생산의 고도화, 유통의 효율화, 경영의 선진화를 통해 소비자 만족까지 고려하는 기술생태계의 탄생 기대
  • 농업 지식베이스 기반의 지능정보서비스를 제공함으로써 ‘농업 속으로 들어온 빅데이터’로 귀농귀촌인, 농업경영인 등 영농 상황에 따른 맞춤형 농림사업 안내를 통한 과학적 의사결정 지원
     
구축내용
  • 시설 원예작물 병해충 진단을 위한 이미지 데이터 수집
  • 농업경영체 관련 정보, 지원사업 지급 정보, 관련 상담사례 정보의 언어분석을 통한 표제어 후보 추출 및 텍스트 마이닝 기법을 통한 용어사전 구축
  • 입력 질의의 추론을 통한 영농 상황 정보 제공 및 사업 안내가 가능한 형태의 지식베이스 구축 
지식베이스 구조
1) 시설원예작물 병해충 이미지

 

  • 토마토, 장미의 정상 및 병해충 감염 이미지 데이터 3만장
  • 토마토 11종, 장미 6종으로 촬영 가이드에 따라 온습도, 촬영각도, 장소 등의 메타정보를 포함하여 데이터 셋 구축

 

2) 농업 용어사전

 

  • 원천 데이터로 수집 된 문서 및 웹에서 추출한 텍스트 데이터와 STT 엔진을 통해 전사된 농업 분야 상담 데이터로부터 텍스트 마이닝 기법을 사용해 키워드 추출
  • 각각의 데이터에 대한 표제어 후보군 선정 후 수작업으로 검증작업을 거쳐 10,000개의 농업 관련 표제어 추출
  • 각 표제어에 대한 정의정보와 연결정보(동의어, 상/하위어, 연관어) 구축

 

3) 농림사업 정보 지식베이스

 

  • 당해에 시행되는 농식품 사업 중 농업인을 대상으로 하는 사업 중 , 농식품 전문가를 통해 활용성이 높은 안내 대상 사업 119개 선별
  • 세부 지침서가 존재하는 사업에 대해 추가적인 정보를 추출하여 지원 정책분야 지식베이스 구축
  • 사업 대상 및 목적에 따라 사업대상, 사용용도, 시설·장비의 정의 및 분류체계를 클래스로 정의하고, 연결정보인 자격요건, 지원 금액 및 한도, 지원항목을 연결정보로 정의
활용예시
  • 농가에서 촬영 된 토마토, 장미 사진의 입력을 통한 병해충 판별 서비스
  • 기초 정보(나이, 지역, 영농기간, 농업경영체 등록 유무 등) 입력에 따른 영농 상황 파악 및 맞춤형 농림 사업을 안내하는 지능형 검색 서비스
촬영 이미지 데이터
<장미 이미지 데이터셋 예시>
<토마토 이미지 데이터셋 예시>
<토마토 - 잎곰팡이병, 점무늬병 (좌) / 재배시설 촬영현장 (우)>
<농작물 병해충이미지 데이터로 학습하여 개발된 AI 프로그램을 통한 병해충 판독 구현 화면>
데이터 구축 담당자
수행기관(주관) : (주)더아이엠씨