콘텐츠로 건너뛰기 메뉴로 건너뛰기 푸터로 건너뛰기
데이터를 불러오고 있습니다
데이터를 저장하고 있습니다
#곤충 # 등애등에 # 갈색거저리 # 흰점박이꽃무지 # 누에 # AI # 곤충 사육장 # 지능형 곤충 사육장

지능형 곤충 사육 데이터

지능형 곤충사육 데이터
  • 분야농축수산
  • 유형 이미지
구축년도 : 2021 갱신년월 : 2022-07 조회수 : 4,698 다운로드 : 115 용량 :
샘플 데이터 ?

샘플데이터는 데이터의 이해를 돕기 위해 별도로 가공하여 제공하는 정보로써 원본 데이터와 차이가 있을 수 있으며,
데이터에 따라서 민감한 정보는 일부 마스킹(*) 처리가 되어 있을 수 있습니다.

※ 내국인만 데이터 신청이 가능합니다.

  • 데이터 변경이력

    데이터 변경이력
    버전 일자 변경내용 비고
    1.0 2022-07-28 데이터 최초 개방

    데이터 히스토리

    데이터 히스토리
    일자 변경내용 비고
    2023-08-25 AI 모델 및 AI 모델 설명서 수정
    2022-10-20 신규 샘플데이터 개방
    2022-09-27 AI 모델 업데이트
    2022-07-28 콘텐츠 최초 등록

    소개

    1. 실제 상업용 곤충사육시설에 적용 가능한 학습용 데이터 및 AI 모델 구축
    2. 곤충사육시설 최적의 환경을 위한 핵심 관리요소 확보
    3. AI 기술 개발에 필수적인 공공데이터를 제공하고, 민간에서 AI 기술 발전에 따라 자생적으로 데이터를 확장, 개방하는 선순환 생태계 조성

    구축목적

    1. 영상 데이터 세트 딥러닝을 통해 구추된 AI를 활용한 곤충 객체 탐지
    2. 곤충 사육 환경 데이터 세트 딥러닝을 통한 사육 환경 분석 
    3. 곤충 사육데이터를 활용한 곤충 생육의 데이터 화
  • 데이터 통계

    1. 데이터 구축 규모

    데이터 통계
    종류 획득규모
    곤충 RGB 영상 동애등에 500장 곤충 길이, 생장모델 분석
    애벌레 12,000장
    번데기 3,000장
    성충 7,000장
    감염곤충 7,500장
    흰점박이  500장
    꽃무지 애벌레 14,000장
      번데기 1,000장
      성충 7,000장
      감염곤충 7,500장
    갈색거저리 500장
    애벌레 12,000장
    번데기 3,000장
    성충 7,000장
    감염곤충 7,500장
    누에 500장
    애벌레 15,000장
    번데기 4,000장
    성충 3,000장
    감염곤충 7,500장
    곤충 열화상 영상 동애등에 애벌레 5,000장 곤충 길이, 생장모델 분석
    번데기 2,000장
    성충 6,000장
    감염곤충 2,500장
    흰점박이 애벌레 7,000장
    꽃무지 번데기 0장
      성충 6,000장
      감염곤충 2,500장
    갈색거저리 애벌레 5,000장
    번데기 2,000장
    성충 6,000장
    감염곤충 2,500장
    누에 애벌레 8,000장
    번데기 3,000장
    성충 2,000장
    감염곤충 2,500장
    관리
    데이터
    곤충길이 데이터 2,500개 이상 동애등에, 흰점박이 꽃무지, 갈색거저리, 누에 집적 측정을 통한 관리 데이터 구축
    곤충평균무게데이터 2,500개 이상
    곤충탈피데이터 1,000개 이상
    사료공급량 데이터 1,000개 이상
    사료 종류 데이터 1,000개 이상
    수분 제공 데이터 1,000개 이상
    감염 상태 정보 데이터 1,000개 이상
    센서
    데이터
    사육장 실내 온도 182,000개 동애등에, 흰점박이 꽃무지, 갈색거저리, 누에 설치된 센서 측정을 통한 센서 데이터 구축
    사육장 실내 습도
    사육장 실내 Co2
    사육장 실내 표면 수분량
    사육장 실내 조도
    사육장 실내 암모니아
    사육장 실내 산소
    사육장 외부 풍속
    사육장 외부 온도
    사육장 외부 습도
    사육장 외부 풍향
    사육장 외부 강우 여부
    곤충 사육박스 온도
    곤충 사육박스 습도
    곤충 사육박스 Co2
    곤충 사육박스 조도

     

     

    2. 데이터셋 별 객체 수량 통계

    지능형 곤충 사육 데이터-데이터셋 별 객체 수량 통계_1_RGB/열화상 데이터 분포지능형 곤충 사육 데이터-데이터셋 별 객체 수량 통계_2_곤충별 데이터 분포

    지능형 곤충 사육 데이터-데이터셋 별 객체 수량 통계_3_RGB 이미지 데이터 분포

    지능형 곤충 사육 데이터-데이터셋 별 객체 수량 통계_4_열화상 이미지 데이터 분포

  • 저작도구 설명서 및 저작도구 다운로드

    저작도구 설명서 다운로드 저작도구 다운로드
  • AI 모델 상세 설명서 다운로드

    AI 모델 상세 설명서 다운로드 AI 모델 다운로드

    1. 곤충 영상 분석 모델  

    • 구축내용
      • 본과제를 통해 구축된 폴리곤 데이터셋 각각을 학습하여 곤충 객체 인식 능력을 가지는 네트워크를 구축, 이를 코드 형태로 공개 예정.
      • 사용자는 해당 코드를 내려받아 제안된 데이터셋을 학습ㅎ사고, 실제 이미지 및 동영상을 네트워크의 입력 값으로 제공하여 영상 내 곤충객체의 위치와 종류 및 크기를 검출해 볼 수 있음.
      • 또한, 공개된 저장소에서는 제안된 데이터셋을 학습한 모델 파라미터를 제공함
    • 신경망 모델
      • 곤충 영상에서 곤충을 인식을 위한 신경망 모델은, 현재 객체인식 알고리즘으로 널리 사용되고, 우수한 성능을 내기로 인정받는 Mask-RCNN을 채택함.
      • 데이터 학습 및 테스트에 사용한 모델 구조는 그림 1로 주어진다. 그림 1에서 (a)부터 (d)까지를 포함하는 모델 구조가 Faster R-CNN에 해당하고, Mask R-CNN 모델은 Faster R-CNN 구조에, 객체의 마스크를 예측하는 모듈, 즉 (e)에 해당하는 모듈을 추가로 부착한 구조임
      • CNN 및 Mask R-CNN은 입력받은 영상에서 특징(Feature)을 추출함. 그 다음 Region Proposal Network (RPN)을 통해 객체가 존재할 가능성이 있는 영역 (RoI)을 예측하고, RoI에 해당하는 Feature Map 영역을 추가 모듈에 입력으로 줌으로써 객체의 최종 바운딩박스 위치와 클래스 분류를 출력으로 얻음 그림 1. Faster R-CNN 및 Mask R-CNN 네트워크 구조의 도식
        지능형 곤충 사육 데이터-곤충 영상 분석 모델_1_Mask R-CNN 네트워크 구조의 도식화
        [그림1. Mask R-CNN 네트워크 구조의 도식화]
      • 해당 과정은 그림 1의 (b), (c), (d)에서 이루어짐. Mask R-CNN의 경우 (e) 구조에서처럼 (d)와 평행한 가지 모듈을 Faster R-CNN에 부착하여 객체의 마스크를 예측함
      • 네트워크에서 이미지의 특징(Feature)을 추출하는 네트워크로써 Resnet50- FPN 네트워크를 사용함
    • 알고리즘 학습 방법
      • 본 과제에서 제안된 모델을 학습하기 위해서는 NIA 지능형 곤충 사육 데이터셋(폴리곤 데이터셋)과 공개된 모델 코드의 다운로드 및 설치 과정이 필요함
      • 코드 설치과정은 conda 가상환경 위에서 진행하는 것을 권장함. 
      • 모델 코드 설치 환경 및 설치 방법은 다음의 그림 2와 그림 3으로 주어짐
        알고리즘 학습 방법
        지능형 곤충 사육 데이터-곤충 영상 분석 모델_2_설치 요구사항 및 환경 구성 지능형 곤충 사육 데이터-곤충 영상 분석 모델_3_곤충 객체이식 데이터세 학습을 위한 모델 코드 설치 과정
        그림2. 설치 요구사항 및 환경 구성. 그림3. 곤충 객체이식 데이터세 학습을 위한 모델 코드 설치 과정
      • 그림 3. 의 과정을 차례로 수행하면, 객체 인식 모델을 학습할 수 있는 Mask R-CNN의 설치가 완료된다.
      • 폴리곤 데이터셋을 학습한 모델의 정성적인 곤충객체 인식 결과는 아래의 그림 6로 주어짐.그림 6은 폴리곤 데이터셋에 대한 결과를 도식화함. 좌측은 네트워크의 출력 결과를 도시하며, 우측은 이에 대한 어노테이션을 도식화함
        알고리즘 학습 방법
        지능형 곤충 사육 데이터-곤충 영상 분석 모델_4_폴리곤 데이터셋을 학습한 Mask R-CNN 결과(1) 지능형 곤충 사육 데이터-곤충 영상 분석 모델_5_폴리곤 데이터셋을 학습한 Mask R-CNN 결과(2)
        지능형 곤충 사육 데이터-곤충 영상 분석 모델_6_폴리곤 데이터셋을 학습한 Mask R-CNN 결과(3) 지능형 곤충 사육 데이터-곤충 영상 분석 모델_7_폴리곤 데이터셋을 학습한 Mask R-CNN 결과(4)
        지능형 곤충 사육 데이터-곤충 영상 분석 모델_8_폴리곤 데이터셋을 학습한 Mask R-CNN 결과(5) 지능형 곤충 사육 데이터-곤충 영상 분석 모델_9_폴리곤 데이터셋을 학습한 Mask R-CNN 결과(6)
        지능형 곤충 사육 데이터-곤충 영상 분석 모델_10_폴리곤 데이터셋을 학습한 Mask R-CNN 결과(7) 지능형 곤충 사육 데이터-곤충 영상 분석 모델_11_폴리곤 데이터셋을 학습한 Mask R-CNN 결과(8)
        그림3. 폴리곤 데이터셋을 학습한 Mask R-CNN 결과
      • 그림3.을 통해서 곤충 종류별 객체의 위치와 클래스 및 마스크 영역을 잘 예측해내고 있음을 알 수 있다

    2. 곤충 생육 환경 분석 모델

    • 구축내용 
      • 본과제를 통해 구축된 곤충 생육환경 센서, 관리 데이터셋 각각을 학습하여 곤충 생육환경분석 능력을 가지는 네트워크를 구축, 이를 코드 형태로 NIA AIHub에 공개 예정.
      • 사용자는 해당 코드를 내려받아 제안된 데이터셋을 학습하고 실제 곤충의 생육환경 센서와 관리데이터를 네트워크의 입력 값으로 제공하여 데이터내 곤충 환경정보와 관리데이터를 확인 할 수 있음.
      • 또한, 공개된 AIHub 저장소에서는 제안된 데이터셋을 학습한 모델 파라미터를 제공함
    • 곤충 생장 예측 학습모델
      • 곤충생육단계, 사육환경정보(온도, 습도, 조도, CO2, 암모니아)와 구동기 이력정보와 단백질함유량, 천적상태정보를 이용하여 생산량 상관관계를 분석하고, 곤충 생산량을 예측하는 알고리즘 개발하는 것이 목적. 이미지 분류 및 사물인식을 위한 인공지능 모델과는 달리 곤충 생산량에 영향을 미치는 입력 파라미터를 고려해 새로운 모델 구축
      • 독립변수 : 센서를 통해 수집하는 사육환경정보 데이터들이며 다음과 같은 값들을 수집한다. 변수명은 JSON 파일의 항목을 사용함. 이 값들은 모델 학습의 데이터 항목으로 사용
        곤충 생장 예측 학습모델
        변수명 설명 비고
        Breeding Room Indoor Temperature 사육장 온도  
        Breeding Room Indoor Humidity 사육장 습도  
        Breeding Room Indoor Co2 사육장 Co2 농도  
        Breeding Room Indoor Surface Moisture Quantity 표면 습도  
        Breeding Room Indoor Illumination Intensity 사육장 조도  
        Breeding Room Indoor Ammonia 사육장 암모니아 농도  
        Breeding Room External Air Velocity 외부 풍속  
        Breeding Room External Temperature 외부 온도  
        Breeding Room External Humidity 외부 습도  
        Breeding Room External Wind Direction 풍향  
        Breeding Room External / Alternative    
        Insect Breeding Box Temperature 사육박스 온도  
        Insect Breeding Box Humidity 사육박스 습도  
        Insect Breeding Box Co2 사육박스 Co2 농도  
        Insect Breeding Box Mat Temperature 사육박스 매트 습도  
      • 종속변수 : 관리데이터이며 곤충의 생장 상태를 직접 관찰해서 수집한 데이터이다. 다음과 같은 값들을 수집한다. 이 값들에서 길이, 평균 무게를 라벨링 데이터로 사용한다.  
        종속변수
        변수명 설명 비고
        Insect Length 길이  
        Insect Average Weight 평균 무게  
        Insect Molting Information 곤충 변태 정보  
        Feed Supply Amount 사료량  
        Feed Nutrition Ingredient 사료 영양성분  
        Hydration Information 수분 정보  
    • ▪알고리즘 학습 방법
      • 알고리즘 학습은 데이터 적재, 적재 데이터 분리(학습, 테스트, 검증용), 모델 학습 순서로 진행
      • 학습용 json 데이터 현황
        • 총 91505개의 json 파일을 대상으로 곤충 생장예측모델 학습용 적재 시도 
          지능형 곤충 사육 데이터-곤충 생육 환경 분석 모델_1_적재 대상 json 파일 개수
          [적재 대상 json 파일 개수]
      • 학습용 데이터 적재
        • 91505개의 개별 json 파일을 학습시점마다 적재하면 많은 시간이 소요되기 때문에 Sqlite DB에 적제시도. SQlite DB는 학습에 사용할 Pandas 프레임워크에서 바로 사용가능하기 때문에 적재 시간 단축이 가능
        • 총 91505개의 json 파일을 대상으로 곤충 생장예측모델 학습용 적재 시도, 총 77384개의 데이터 적재 성공. 적재 성공 실패 구분은 학습에 필수적인 센서데이터 및 데이터 취득 시점, 관리데이터의 존재 여부로 판단함.
          지능형 곤충 사육 데이터-곤충 생육 환경 분석 모델_2_적재 성공 개수
          [적재 성공 개수]
      • 학습용 데이터 분리
        • 학습은 곤충 4종의 상태(알, 애벌레,번데기,성충) 별로 진행하기 때문에 데이터를 16개로 나누어 준비한다. 그리고 이 데이터셋을 다시 학습에 사용하기 위해 학습용:테스트용:검증용으로 나누며 분리 비율은 8:1:1이다. 데이터 분리 도구는 sklearn의 StratifiedShuffleSplit 객체를 이용한다.
          지능형 곤충 사육 데이터-곤충 생육 환경 분석 모델_3_데이터셋 분리 구현
          [데이터셋 분리 구현]
        • 위 구현 내용으로 분리한 데이터셋은 다음과 같다.
          지능형 곤충 사육 데이터-곤충 생육 환경 분석 모델_4_학습용 데이터 분리
          [학습용 데이터 분리]
      • 데이터 학습 개요
        • 학습은 4종 곤충의 4개 상태에 대해 학습을 진행한다. 2개의 라벨링 데이터(길이, 무게) 및 학습 모델 2개를 적용하면 64개의 모델을 만들 수 있다.
          지능형 곤충 사육 데이터-곤충 생육 환경 분석 모델_5_모델 학습 개수[모델 학습 개수]
      • 하이퍼 파라미터 설정
        랜덤포레스트 모델에 사용할 하이퍼 파라미터는 다음과 같이 설정한다. 
        • max_depth : 12
        • min_sample_split :2
        • max_leaf_nodes : None
        • min_sample_leaf :1
        • n_estimators:10
        • max_samples: 0.5
        • max_features : None       
      • SVM 모델에 사용할 하이퍼 파라미터는 다음과 같이 설정한다. 
        • Ɛ(epsilon) 파라미터 :1.5 근방에서 조정
        • 커널 : linear
      • 학습
        • 64개 모델의 학습을 위해 배시 스크립트 및 Windows용 배치 파일을 이용한다. 스크립트 파일은 곤충별로 4개를 준비했으며 동시 실행이 가능하기 때문에 4개 곤충에 대해 학습을 병렬로 진행할 수 있다. 
          지능형 곤충 사육 데이터-곤충 생육 환경 분석 모델_6_누에 학습용 스크립트 실행
          [누에 학습용 스크립트 실행]
        • 학습에 사용한 패키지 및 버전은 다음과 같다.
          패키지 및 버전
          패키지 버전 비고
          파이썬 3.8 개발 언어
          Scikit Learn 0.24.2 학습 프레임워크
          Pandas 1.3.1 데이터 처리
          Matplotlib 3.4.2 그래프 출력
    • 학습 결과 및 관련 통계
      • 학습 결과
        • 64개 모델의 학습 결과는 곤충_상태_라벨_모델.pkl 파일 형식으로 만들어진다. 
          학습 결과
          항목
          곤충 누에, 흰점박이꽃무지,갈색거저리,동애등에 누에_알_길이_randomforest.pkl
          상태 알,애벌레,번데기,성충 누에_애벌레_무게_linearsvm.pkl
          라벨 길이,무게  
          모델 randomforest, linearsvm  
      • 학습 통계
        • 구축데이터 유효성을 검토하여 20개 모델의 학습 진행 후 마지막으로 테스트셋 데이터를 이용해 모델의 MAE, MAPE 값을 측정한다. 테스트셋을 이용한 MAPE 측정값은 다음과 같다.
          지능형 곤충 사육 데이터-곤충 생육 환경 분석 모델_7_유효성 검증 시연결과
          [유효성 검증 시연결과]
        • 학습 결과 로그에는 모델 빌드 일시, 학습 곤충, 상태, 모델 타입(길이,무게) 학습데이터 수, 테스트데이터 수, 검증데이터 수, random forest MAE값, MAPE 값 등이 포함되어 있다. 랜덤 포레스트 모델이 선형 SVM 모델에 비해 좋은 결과를 보였으며, 생육환경분석모델은 랜덤포레스트모델을 선정했다.
  • 데이터 성능 점수

    측정값 (%)
    기준값 (%)

    데이터 성능 지표

    데이터 성능 지표
    번호 측정항목 AI TASK 학습모델 지표명 기준값 점수 측정값 점수
    1 폴리곤 객체 인식 Object Detection Mask-RCNN mAP 80 % 99.45 %
    2 곤충 생육 단계별 성장 수치 예측(길이) Estimation Random Forest MAPE 10 % 0.79 %
    3 곤충 생육 단계별 성장 수치 예측(무게) Estimation Random Forest MAPE 10 % 0 %

    ※ 데이터 성능 지표가 여러 개일 경우 각 항목을 클릭하면 해당 지표의 값이 그래프에 표기됩니다.

    ※ AI모델 평가 지표에 따라 측정값의 범위, 판단 기준이 달라질 수 있습니다. (ex. 오류율의 경우, 낮을수록 좋은 성능을 내는 것으로 평가됩니다)

  • 설명서 및 활용가이드 다운로드

    데이터 설명서 다운로드 구축활용가이드 다운로드

    1. 데이터 포맷

    1. 데이터 포맷
    구분 종류 데이터명 데이터유형 데이터포맷 비고
    이미지 곤충 RGB 영상 동애등에 RGB영상 JPG 이미지, 센서, 관리 데이터는 수집된 시간기준으로 시계열 동기화하여 한 세트를 이룬다.
    흰점박이꽃무지
    갈색거저리
    누에
    감염곤충
    곤충 열화상 영상 동애등에 열화상영상
    흰점박이꽃무지
    갈색거저리
    누에
    감염곤충
    센서
    데이터
    온도 데이터 온도 데이터 시계열 데이터 TABLE 형태
    (DB저장)
    습도 데이터 습도 데이터
    Co2데이터 Co2데이터
    표면 수분량 측정 데이터 표면 수분량 측정 데이터
    조도데이터 조도데이터
    NH3데이터 NH3데이터
    O2데이터 O2데이터
    풍속 데이터 풍속 데이터
    풍향 데이터 풍향 데이터
    온도 데이터 온도 데이터
    습도 데이터 습도 데이터
    강우 데이터 강우 데이터
    온도 데이터 온도 데이터
    습도 데이터 습도 데이터
    CO2 데이터 CO2 데이터
    조도 조도
    관리
    데이터
    곤충길이 데이터(수동측정) 정형 데이터
    (일자/케이지/
    곤충 종명/김이)
    TABLE 형태(DB저장)
    곤충평균무게데이터(수동측정)
    곤충탈피데이터
    사료공급량 데이터
    사료 종류 데이터
    수분제공 데이터
    감염 상태 정보 데이터
    • RGB/열화상 이미지데이터는 사육상자에 설치된 카메라에서 추출되는 영상 데이터를 프레임별 정제하여 이미지로 변경한 데이터를 말한다.
    • 센서 데이터는 사육상자에 설치된 각종 센서에서 수집 되는 정보를 말한다.
    • 관리 데이터는 크라우드워커가 직접 측정하여 수집 되는 정보를 말한다.
    • RGB/열화상 이미지데이터 및 센서 데이터, 관리 데이터는 수집된 시간으로 동기화되어 하나의 세트를 구성한다.

    2. 데이터 속성 명세서

    2. 데이터 속성 명세서
    구분 ID 요소명(영/한) 예시 필수여부
    메타정보 1 Image File Name 이미지파일명 FO1_CA01_INSECT01_20210805_01.JPG 필수
    2 mage File Identification 이미지파일아이디 220394 필수
    3 Image Photography Date and Time 이미지촬영일시 2021.08.05. 13:00:00 필수
    4 Envrn. Info. MEASUREMENT Date and Time 환경정보 측정일시 2021.08.05. 13:00:00 필수
    5 Image File Format 이미지파일포맷 JPG 필수
    6 Image File MAGNITUDE 이미지파일크기 3000KB 필수
    7 Equipment Information 장비정보 RGB CAM 필수
    8 Camera Info. 카메라정보 Canon ESO R 선택
    9 Image Obtain Place Type 이미지획득장소유형 Huge_farm 필수
    10 Photography Area Name 촬영 지역명 청주 필수
    11 Image Photography Location Information  이미지 촬영 위치 정보 2번 사육박스 필수
    12
    Image Copyright Information 이미지저작권정보 FOODYWORM 필수
    13 Image Width MAGNITUDE 이미지가로크기 1920 필수
    14 Image Height MAGNITUDE 이미지세로크기 1080 필수
    15 Resolution 해상도 FHD 필수
    16 Bit 비트 24 필수
    17 Image Color Group Code 이미지색상군코드 # 8B0000 선택
    18 Length AND Breadth Rate 종횡비율 4:03 필수
    19 Image Pixel 이미지화소 1K 필수
    20 Image Color Depth 이미지색상심도 sRGB 필수
    21 ISO Speed ISO 감도 3200 필수
    22 White Balance 화이트 밸런스 5500K 필수
    23 Shutter Speed 셔터 속도 f2.8 1/80 필수
    24 F-STOP 조리개값 f2.8 필수
    25 Flashlight Use ALTERNATIVE 플래시사용여부 - 필수
    26 Filter Use ALTERNATIVE 필터사용여부 - 필수
    27 Focal Length 초점거리 50mm 필수
    28 Feed Supply Date and Time 사료공급일시 - 필수
    29 Feed Supply Amount 사료 공급량 - 필수
    30 Feed Ingredient 사료 성분 - 필수
    31 CCTV Name CCTV명 cam_01 필수
    32 Insect Name 곤충명 누에 필수
    33 Insect Farm Name 곤충 농장명 푸디웜 필수
    34 Insect Breeding Room Box Number 곤충 사육실 사육박스 번호 4 필수
    35 Insect Breeding Box Size 곤충 사육박스 사이즈 Huge_cage 필수
    36 Scientific Name 학명   선택
    37 Image File Type 이미지파일종류(유형)   선택
    38 Store Course 저장경로   선택
    39 Growth Step Name 생육단계명   선택
    40 Growth Step Code 생육단계코드   선택
    41 MEASUREMENT Sensor INSTALLATION EXISTENCE AND NONEXISTENCE 측정센서설치유무   선택
    42 Photographer 촬영자   선택
    43 THEMA 주제(테마)   선택
    44 PHOTOGRAPHY YEAR 촬영년도   선택
    어노테이션 정보 1 Image File MAGNITUDE 이미지파일크기 748979 필수
    2 Image File Name 이미지파일명 굼벵이1.png 필수
    3 Annotation ID 어노테이션아이디 1 필수
    4 Annotation Type 어노테이션타입 polygon 필수
    5 Bounding Box X Coordinate 바운딩박스 X좌표 [149,139,127,121] 필수
    6 Bounding Box Y Coordinate 바운딩박스 Y좌표 [120,124,127,130] 필수
    7 Object Name 객체명 worm 필수
    8 Object Class Code 객체클래스코드   선택
    관리 정보 1 Insect Length 곤충 길이 5mm 필수
    2 Insect Average Weight  곤충 평균 무게 5mg 필수
    3 Insect Molting Information 곤충탈피정보 10 필수
    4 Feed Supply Amount 사료 공급량 2mg 필수
    5 Feed Type 사료 종류 밀기율 필수
    6 Hydration Information 수분제공정보 yes 필수
    7 Insect infection status 감염상태 감염 필수
    센서 정보 1 Breeding Room Indoor Temperature 사육장 실내 온도 22℃ 필수
    2 Breeding Room Indoor Humidity 사육장 실내 습도 50% 필수
    3 Breeding Room Indoor Co2 사육장 실내 Co2 10 필수
    4 Breeding Room Indoor Surface Moisture Quantity 사육장 실내 표면 수분량 30 필수
    5 Breeding Room Indoor Illumination Intensity 사육장 실내 조도 300lx 필수
    6 Breeding Room Indoor Ammonia 사육장 실내 암모니아 50 필수
    7 Breeding Room Indoor Oxygen 사육장 실내 산소 50 필수
    8 Breeding Room External Air Velocity 사육장 외부 풍속 15m/s^2 필수
    9 Breeding Room External Temperature 사육장 외부 온도 22℃ 필수
    10 Breeding Room External Humidity 사육장 외부 습도 50% 필수
    11 Breeding Room External Wind Direction 사육장 외부 풍향 N,W,E,S 중 하나 필수
    12 Breeding Room External Rain Alternative 사육장 외부 강우 여부 유/무 필수
    13 Insect Breeding Box Temperature 곤충 사육박스 온도 22℃ 필수
    14 Insect Breeding Box Humidity 곤충 사육박스 습도 50% 필수
    15 Insect Breeding Box Co2 곤충 사육박스 Co2 30 필수
    16 Insect Breeding Box Illumination Intensity 곤충 사육박스 조도 300lx 필수

     

    3. 어노테이션 정보

    3. 어노테이션 정보
    Image_Annotation_data sensor_data management_data

     "ANNOTATION": {
        "Image File MAGNITUDE": 748979,
        "Iamge File Name": "굼벵이1.png",
        “Annotation Regions“:
        [
         {
          "Annotation ID": 1,
          "Annotation Type": "polygon",
          "Polygon X Coordinate": [ 149, 139, 127, 121, 149 ],
          "Polygon Y Coordinate": [ 120, 124, 127, 130, 120 ],
          "Object Name": "worm",
          "Object Class Code": ""
         }
        [
     "SENSOR": {
        "Breeding Room Indoor Temperature": "22",
        "Breeding Room Indoor Humidity": "50",
        "Breeding Room Indoor Co2": 10,
        "Breeding Room Indoor Surface Moisture Quantity": 30,
        "Breeding Room Indoor Illumination Intensity": "300",
        "Breeding Room Indoor Ammonia": 50,
        "Breeding Room Indoor Oxygen": 50,
        "Breeding Room External Air Velocity": "15",
        "Breeding Room External Temperature": "22",
        "Breeding Room External Humidity": "50",
        "Breeding Room External Wind Direction": "N",
        "Breeding Room External Rain Alternative": "유",
        "Insect Breeding Box Temperature": "22",
        "Insect Breeding Box Humidity": "50",
        "Insect Breeding Box Co2": 30,
        "Insect Breeding Box Mat Temperature": "22"
      },
     "MANAGEMENT": {
        "Insect Length": "5mm",
        "Insect Average Weight": "5",
        "Insect Molting Information": 10,
        "Feed Supply Amount": "2",
        "Feed Type": "밀기율",
        "Hydration Information": 10,
        "Insect infection status": "감염"
      }

     

    4. 실제 어노테이션 구조

    지능형 곤충 사육 데이터-실제 어노테이션 구조_1
    지능형 곤충 사육 데이터-실제 어노테이션 구조_2

  • 데이터셋 구축 담당자

    수행기관(주관) : ㈜푸디웜
    수행기관(주관)
    책임자명 전화번호 대표이메일 담당업무
    이유석 043-716-0282 senselys@foodyworm.com · 데이터 구축 총괄 실무책임자
    수행기관(참여)
    수행기관(참여)
    기관명 담당업무
    ㈜아와소프트 · 데이터 정제, 검수 및 학습 모델 구축
    ㈜서우엠에스 · 수집 및 검수
    글로벌여성네트워크 · 데이터 가공
    전북테크노파크 · 사업홍보 및 해커톤대회 운영
    케이엘큐브 · 학습모델 구축
    강원도농산물원종장 · 데이터 수집
보건의료 데이터 개방 안내

보건의료 데이터는 온라인 및 오프라인 안심존을 통해 개방됩니다.

안심존이란 안심존 이용메뉴얼 안심존 이용신청
  • 인터넷과 물리적으로 분리된 온라인·오프라인 공간으로 의료 데이터를 포함하여 보안 조치가 요구되는 데이터를 다운로드 없이 접근하고 분석 가능
    * 온라인 안심존 : 보안이 보장된 온라인 네트워크를 통해 집, 연구실, 사무실 등 어디서나 접속하여 데이터에 접근하고 분석
    * 오프라인 안심존 : 추가적인 보안이 필요한 데이터를 대상으로 지정된 물리적 공간에서만 접속하여 데이터에 접근하고 분석

    1. AI 허브 접속
      신청자
    2. 안심존
      사용신청
      신청자신청서류 제출*
    3. 심사구축기관
    4. 승인구축기관
    5. 데이터 분석 활용신청자
    6. 분석모델반출신청자
  • 1. 기관생명윤리위원회(IRB) 심의 결과 통지서 [IRB 알아보기] [공용IRB 심의신청 가이드라인]
    2. 기관생명윤리위원회(IRB) 승인된 연구계획서
    3. 신청자 소속 증빙 서류 (재직증명서, 재학증명서, 근로계약서 등 택1)
    4. 안심존 이용 신청서 [다운로드]
    5. 보안서약서 [다운로드]
    ※ 상기 신청서 및 첨부 서류를 완비한 후 신청을 진행하셔야 정상적으로 절차가 이루어집니다.

  • 신청 및 이용관련 문의는 safezone1@aihub.kr 또는 02-525-7708, 7709로 문의

데이터셋 다운로드 승인이 완료 된 후 API 다운로드 서비스를 이용하실 수 있습니다.

API 다운로드 파일은 분할 압축되어 다운로드 됩니다. 분할 압축 해제를 위해서는 분할 압축 파일들의 병합이 필요하며 리눅스 명령어 사용이 필요합니다.

리눅스 OS 계열에서 다운로드 받으시길 권장하며 윈도우에서 파일 다운로드 시 wsl(리눅스용 윈도우 하위 시스템) 설치가 필요합니다.

※ 파일 병합 리눅스 명령어

find "폴더경로" -name "파일명.zip.part*" -print0 | sort -zt'.' -k2V | xargs -0 cat > "파일명.zip"

- 해당 명령어 실행 시, 실행 경로 위치에 병합 압축 파일이 생성됩니다.

- 병합된 파일 용량이 0일 경우, 제대로 병합이 되지 않은 상태이니 "폴더경로"가 제대로 입력되었는지 확인 부탁드립니다.

※ 데이터셋 소개 페이지에서 다운로드 버튼 클릭하여 승인이 필요합니다.