콘텐츠로 건너뛰기 메뉴로 건너뛰기 푸터로 건너뛰기
데이터를 불러오고 있습니다
데이터를 저장하고 있습니다
#디지털 트랩 # 해충 # 영상인식 # 학습데이터 # 인공지능

NEW 디지털 트랩 포집 해충 데이터

디지털 트랩 포집 해충 데이터 아이콘 이미지
  • 분야농축수산
  • 유형 이미지
구축년도 : 2022 갱신년월 : 2023-12 조회수 : 4,868 다운로드 : 273 용량 :
샘플 데이터 ?

샘플데이터는 데이터의 이해를 돕기 위해 별도로 가공하여 제공하는 정보로써 원본 데이터와 차이가 있을 수 있으며,
데이터에 따라서 민감한 정보는 일부 마스킹(*) 처리가 되어 있을 수 있습니다.

※ 내국인만 데이터 신청이 가능합니다.

  • 데이터 변경이력

    데이터 변경이력
    버전 일자 변경내용 비고
    1.1 2023-12-22 데이터 최종 개방
    1.0 2023-07-26 데이터 개방(Beta Version)

    데이터 히스토리

    데이터 히스토리
    일자 변경내용 비고
    2024-01-12 산출물 전체 공개

    소개

    AI를 활용하여 국내 발새 해충을 조기에 발견하여 신속하고 효과적인 초기 대응이 가능하기 위하여 자동화된 해충 감지 및 분류가 가능할 수 있는 양질의 학습용 데이터를 구축하고 이를 개방하여 해충으로 인해 발생되는 농가 피해를 최소화하기 위한 체계구축의 기반을 마련하고자 함

    구축목적

    - 해충 분야 인공지능 학습용 데이터 구축ㆍ개방을 통해 관련 산업에 지능화 혁신을 촉진하고
    일자리 창출
    인공지능 개발에 핵심인 인공지능 학습용 데이터를 구축ㆍ개방하여 국가ㆍ사회 전반의 지능화 혁신 서비스를 빠르게 확산 촉진
    - 인공지능 학습용 데이터 수집, 정제ㆍ가공, 검증 등에 직접고용과 함께 크라우드소싱 방식을
    도입하여 일자리 창출 극대화
    - AI 응용모델을 개발함으로써 해충 예찰, 예방, 방재 등의 다양한 AI 솔루션이 가능함을 증명함
  • 1. 데이터 구축 규모

    구분 종류 획득 규모 목적 확보방안
    이미지 데이터 끈끈이형 갈색날개매미충 148 끈끈이형 트랩에 포집된 해충 탐지 및 분류에 활용되는 객체 직접 수집
    미국선녀벌레 764
    썩덩나무노린재 11,326
    작은뿌리파리 62,305
    흰점도둑나방 14,176
    페로폰트랩형 톱다리개미허리노린재 26,536 페로몬 트랩에 포집된 해충 탐지 및 분류에 활용되는 객체 직접 수집
    유아등형 담배거세미나방 17074 유아등형 트랩에 포집된 해충 탐지 및 분류에 활용되는 객체 직접 수집
    썩덩나무노린재 4874
    전체 데이터 합계 137,203
    어노테이션 및 환경 데이터 끈끈이형 갈색날개매미충 118 끈끈이형 트랩에 포집된 해충 탐지 및 분류에 활용되는 객체 직접 수집
    미국선녀벌레 612
    썩덩나무노린재 9,061
    작은뿌리파리 49,843
    흰점도둑나방 11,340
    페로폰트랩형 톱다리개미허리노린재 22,228 페로몬 트랩에 포집된 해충 탐지 및 분류에 활용되는 객체 직접 수집
    유아등형 담배거세미나방 13,660 유아등형 트랩에 포집된 해충 탐지 및 분류에 활용되는 객체 직접 수집
    썩덩나무노린재 4,900
    미국선녀벌레 3,005
    전체 데이터 합계 140,208

     

    2. 데이터 분포
       - 해충당 어노테이션 수량 분포

    구분 종류 획득 규모 비율
    이미지 데이터 끈끈이형 갈색날개매미충 148 0.11%
    미국선녀벌레 764 0.56%
    썩덩나무노린재 11,326 8.25%
    작은뿌리파리 62,305 45.41%
    흰점도둑나방 14,176 10.33%
    페로폰트랩형 톱다리개미허리노린재 26,536 19.34%
    유아등형 담배거세미나방 17074 12.44%
    썩덩나무노린재 4874 3.55%
    전체 데이터 합계 137,203
    어노테이션 및 환경 데이터 끈끈이형 갈색날개매미충 118 0.08%
    미국선녀벌레 612 0.44%
    썩덩나무노린재 9,061 6.46%
    작은뿌리파리 49,843 35.55%
    흰점도둑나방 11,340 8.09%
    페로폰트랩형 톱다리개미허리노린재 22,228 15.85%
    유아등형 담배거세미나방 13,660 9.74%
    썩덩나무노린재 4,900 3.49%
    미국선녀벌레 3,005 2.14%
    전체 데이터 합계 140,208

     

    - 습도에 따른 분포

    습도에 따른 분포 차트

    - 온도에 따른 분포

    온도에 따른 분포 차트

     

    - 지역별 데이터 취득 분포

    지역별 데이터 취득 분포 차트

  • 저작도구 설명서 및 저작도구 다운로드

    저작도구 설명서 다운로드 저작도구 다운로드
  • AI 모델 상세 설명서 다운로드

    AI 모델 상세 설명서 다운로드 AI 모델 다운로드

    1. 모델 학습
    - RGB 영상 데이터
    instance segmentation 의 해충 객체 탐지를 위하여 Mask-Rcnn 알고리즘에 학습을 진행하며 검증용 데이터 세트 와 시험용 데이터 세트를 전체 데이터 세트의 10%로 제시한다. 본 사업에서는 이미지 데이터 세트를 13만장 이상 구축하므로 최소 검증과 시험을 모두 각 3만5천 장 이상으로 통일 하여 준비하는 것을 제안함.

      학습 검증 시험
    개요 - MaskRcnn 기반학습
    - 로컬 학습 서버 활용
    - 학습 도중 모델 성과 평가 및 비교
    - mAP 점수등
    - 모델 학습 완료 후
    - 모델 테스트
    데이터 비율 80% 10% 10%

     

    - 환경 데이터
    RGB영상 시점의 환경 센싱 데이터. 검증용 데이터 세트 와 시험용 데이터 세트를 전체 데이터 세트의 10%로 제시한다. 본 사업에서는 이미지 데이터 세트를 13만장 이상 구축하므로 최소 검증과 시험을 모두 각 1만3천 장 이상으로 통일 하여 준비하는 것을 제안함.

      학습 검증 시험
    개요 - RandonForest 기반학습
    - 로컬 학습 서버 활용
    - 학습 도중 모델 성과 평가 및 비교
    - MAE 점수등
    - 모델 학습 완료 후
    - 모델 테스트
    데이터 비율 80% 10% 10%

     

    2. 서비스 활용 예시
    ▪ 포집된 해충을 AI로 인식하여 전국의 해충 발생 예측, 해충 발생 종류, 방제
    방법, 시기 등을 분석하여 국가작물병해충관리시스템과 연계한 해충 발생 지도 서비스 

    서비스 활용 예시

     

    3. 기타정보
    - 독립성
      NIA 데이터와 중복 되지 않도록 직접 촬영을 통하여 구축
    - 대표성
     직접 트랩에 포집된 해충 데이터로 부터 RGB 영상 및 환경 데이터를 포함함.

  • 데이터 성능 점수

    측정값 (%)
    기준값 (%)

    데이터 성능 지표

    데이터 성능 지표
    번호 측정항목 AI TASK 학습모델 지표명 기준값 점수 측정값 점수
    1 해충 생육 환경 분석 모델 Classification RandomForest MAE 10 % 0.695 %
    2 해충 인스턴스 세그먼테이션 모델 성능 Segmentation Detectron2 mAP 80 % 98.631 %

    ※ 데이터 성능 지표가 여러 개일 경우 각 항목을 클릭하면 해당 지표의 값이 그래프에 표기됩니다.

    ※ AI모델 평가 지표에 따라 측정값의 범위, 판단 기준이 달라질 수 있습니다. (ex. 오류율의 경우, 낮을수록 좋은 성능을 내는 것으로 평가됩니다)

  • 설명서 및 활용가이드 다운로드

    데이터 설명서 다운로드 구축활용가이드 다운로드

    1. 데이터 설명
    ● 해충 분야 인공지능 학습용 데이터 구축ㆍ개방을 통해 관련 산업에 지능화 혁신을 촉진하고 일자리 창출
    ● 인공지능 개발에 핵심인 인공지능 학습용 데이터를 구축ㆍ개방하여 국가ㆍ사회 전반의 지능화 혁신 서비스를 빠르게 확산 촉진
    ● 인공지능 학습용 데이터 수집, 정제ㆍ가공, 검증 등에 직접고용과 함께 크라우드소싱 방식을 도입하여 일자리 창출 극대화
    ● AI 응용모델을 개발함으로써 해충 예찰, 예방, 방재 등의 다양한 AI 솔루션이 가능함을 증명함 

     

    2. 어노테이션 포맷

    구분 속성명 타입 필수여부 설명 범위
    1 Meta object      
      1-1 Image_FileName String Y 이미지 파일명  
    1-2 Image_get_date String Y 이미지 촬영일시  
    1-3 Env_get_date String Y 환경 정보 측정일시  
    1-4 Image_get_Location String Y 이미지 촬영 위치 정보  
    1-5 Copyright String Y 이미지 저작권 정보 “서우엠에스”
    1-6 Camera Name String Y 필수 “1”~“10”
    1-7 Insect Name String N 해충명 “미국선녀벌레“,
    “갈색날개매미충“,
    “담배거세미나방“,
    “흰점도둑나방“,
    “썩덩나무노린재“,
    “작은뿌리파리“,
    “톱다리개미허리노린재“
    1-8 get state String Y 해충 설치지역 인제곤충바이오센터1,
    인제곤충바이오센터2,
    인제곤충바이오센터3,
    강원도농산물원종장1,
    강원도농산물원종장2,
    강원도농산물원종장3,
    강원도자연환경연구공원1,
    강원도자연환경연구공원2,
    강원도자연환경연구공원3,
    우포잠자리나라1,
    우포잠자리나라2,
    우포잠자리나라3,
    영양군생태공원사업소1,
    영양군생태공원사업소2,
    영양군생태공원사업소3,
    잠사곤충사업장1,
    잠사곤충사업장2,
    잠사곤충사업장3,
    예천군곤충연구소1,
    예천군곤충연구소2,
    예천군곤충연구소3,
    대구봉무공원1,
    대구봉무공원2,
    대구봉무공원3,
    울산대공원1,
    울산대공원2,
    울산대공원3,
    낙동강하구에코센터1,
    낙동강하구에코센터2,
    낙동강하구에코센터3,
    남해나비생태원1,
    남해나비생태원2,
    남해나비생태원3,
    제주1,
    제주2,
    제주3,
    생물종다양성연구소1,
    생물종다양성연구소2,
    생물종다양성연구소3,
    충남공주1,
    충남공주2,
    충남공주3,
    전북익산웅포면1,
    전북익산웅포면2,
    전북익산웅포면3,
    인천나비공원1,
    인천나비공원2,
    인천나비공원3,
    서울숲공원1,
    서울숲공원2,
    서울숲공원3,
    노원구불암산나비정원1,
    노원구불암산나비정원2,
    노원구불암산나비정원3,
    전북군산,
    전북익산왕궁1,
    전북익산왕궁2,
    전북익산왕궁3,
    전남순천1,
    전남순천2,
    전남순천3,
    전북김제백구면1,
    전북김제백구면2,
    전북김제백구면3,
    충남부여양화면1, 
    충남부여양화면2,
    충남부여양화면3,
    경남밀양가지농가
    경북경주딸기농가
    전남고흥오이농가
    충남금산딸기농가
    충남논산딸기농가
    경기화성딸기농가
    1-9 trap_type String Y 포집기 종류 ”1“,”2“,”3“,”4“
      1-10 Scientific String   학명 “Metcalfa pruinosa“,
    “Ricania sublimata“,
    “Limois emelianovi“,
    “Riptortus clavatus“,
    “Spodoptera litura“,
    “Nezara antennata“,
    “Halyomorpha halys“,
    “Melanchra persicariae“,
    “Bradysia impatiens“
    2 Image_Annotation Object      
      2-1 Image File MAGNITUDE String Y 이미지 파일 크기(사진 파일 크기) “0”~“99999999”
    2-2 Image File Name String Y 이미지 파일명  
    2-3 Annotations Array Y    
      2-3-1 Annotation ID String N 어노테이션 아이디 “0”~“10”
    2-3-2 Annotation Type String N 어노테이션 타입 “polygon“
    2-3-3 X Coordinate number N 폴리곤 X 좌표  
    2-3-4 Y Coordinate number N 폴리곤 Y 좌표  
    2-3-5 Object Name String N 객체명 “미국선녀벌레“,
    “갈색날개매미충“,
    “담배거세미나방“,
    “흰점도둑나방“,
    “썩덩나무노린재“,
    “작은뿌리파리“,
    “톱다리개미허리노린재“
    3 Environmental_data Object   환경정보  
      3-1 trap_Temperature String Y 해충트랩온도 -50.00~100.00℃
    3-2 trap_Humidity String Y 해충트랩습도 0~100%
      3-3 Weather information temperature String Y 기상청 온도 정보 16.7℃
      3-4 Weather information humidity String Y 기상청 습도 정보 60%
      3-5 Weather information wind direction String Y 기상청 풍향 정보 남동풍
      3-6 Weather information wind speed String Y 기상청 풍속 정보 5.3ms
      3-7 Weather information rain condition String Y 기상청 강우 정보 OFF

     

    3. 실제 예시

    구분 데이터 속성
    Meta_data {“Meta”:
    {
    "Image_FileName":"FO1_CA01_INSECT01_20210805_01.JPG"
    "Image_get_date":"2022.08.05. 13:00:00"
    "Env_get_date":"2022.08.05. 13:00:00"
    "Image_get_Location":"군산"
    "Copyright":"서우엠에스"
    "Camera_Name":"1"
    "Insect_Name":"벼멸구"
    "get_state":"군산"
    "trap_type":"3"
    "Scientific_Name":"Nilaparvata lugens"
    }
    }
    Image_Annotations {“Image_Annotation”:
    {
    "Image File MAGNITUDE":"748979",
    "Image File Name":"FO1_CA01_INSECT01_20210805_01.JPG",
    "Annotation ID":"1",
    "Annotation Type":"polygon",
    "X Coordinate":[149,139,127,121],
    "Y Coordinate":[120,124,127,130],
    "Object Name":"벼멸구",
    "Annotation ID":"2",
    "Annotation Type":"box",
    "Bounding Box X Coordinate":"149",
    "Bounding Box Y Coordinate":"130",
    "width":"100",
    "height":"100",
    "Object Name":"벼멸구"
    }
    }
    Environmental_data
     
    {“Environmental_data”:
    {
    "trap_Temperature:"30℃", "trap_Humidity":"50%",
    }
    }
  • 데이터셋 구축 담당자

    수행기관(주관) : 서우엠에스(주)
    수행기관(주관)
    책임자명 전화번호 대표이메일 담당업무
    심상완 063-211-4522 swceo@suhwooms.com 사업총괄 및 관리
    수행기관(참여)
    수행기관(참여)
    기관명 담당업무
    ㈜아와소프트 AI모델 설계 및 구축
    (사)글로벌 여성 ICT네트워크 데이터 가공
    (사)전주벤처기업육성촉진지구발전협의회 홍보 및 해커톤
    순천대학교 데이터 품질관리
    (사)한국곤충연구기관협의 데이터 수집 및 선별
    데이터 관련 문의처
    데이터 관련 문의처
    담당자명 전화번호 이메일
    심상완 063-211-4522 swceo@suhwooms.com
보건의료 데이터 개방 안내

보건의료 데이터는 온라인 및 오프라인 안심존을 통해 개방됩니다.

안심존이란 안심존 이용메뉴얼 안심존 이용신청
  • 인터넷과 물리적으로 분리된 온라인·오프라인 공간으로 의료 데이터를 포함하여 보안 조치가 요구되는 데이터를 다운로드 없이 접근하고 분석 가능
    * 온라인 안심존 : 보안이 보장된 온라인 네트워크를 통해 집, 연구실, 사무실 등 어디서나 접속하여 데이터에 접근하고 분석
    * 오프라인 안심존 : 추가적인 보안이 필요한 데이터를 대상으로 지정된 물리적 공간에서만 접속하여 데이터에 접근하고 분석

    1. AI 허브 접속
      신청자
    2. 안심존
      사용신청
      신청자신청서류 제출*
    3. 심사구축기관
    4. 승인구축기관
    5. 데이터 분석 활용신청자
    6. 분석모델반출신청자
  • 1. 기관생명윤리위원회(IRB) 심의 결과 통지서 [IRB 알아보기] [공용IRB 심의신청 가이드라인]
    2. 기관생명윤리위원회(IRB) 승인된 연구계획서
    3. 신청자 소속 증빙 서류 (재직증명서, 재학증명서, 근로계약서 등 택1)
    4. 안심존 이용 신청서 [다운로드]
    5. 보안서약서 [다운로드]
    ※ 상기 신청서 및 첨부 서류를 완비한 후 신청을 진행하셔야 정상적으로 절차가 이루어집니다.

  • 신청 및 이용관련 문의는 safezone1@aihub.kr 또는 02-525-7708, 7709로 문의

데이터셋 다운로드 승인이 완료 된 후 API 다운로드 서비스를 이용하실 수 있습니다.

API 다운로드 파일은 분할 압축되어 다운로드 됩니다. 분할 압축 해제를 위해서는 분할 압축 파일들의 병합이 필요하며 리눅스 명령어 사용이 필요합니다.

리눅스 OS 계열에서 다운로드 받으시길 권장하며 윈도우에서 파일 다운로드 시 wsl(리눅스용 윈도우 하위 시스템) 설치가 필요합니다.

※ 파일 병합 리눅스 명령어

find "폴더경로" -name "파일명.zip.part*" -print0 | sort -zt'.' -k2V | xargs -0 cat > "파일명.zip"

- 해당 명령어 실행 시, 실행 경로 위치에 병합 압축 파일이 생성됩니다.

- 병합된 파일 용량이 0일 경우, 제대로 병합이 되지 않은 상태이니 "폴더경로"가 제대로 입력되었는지 확인 부탁드립니다.

※ 데이터셋 소개 페이지에서 다운로드 버튼 클릭하여 승인이 필요합니다.