-
데이터 변경이력
데이터 변경이력 버전 일자 변경내용 비고 1.0 2022-07-13 데이터 최초 개방 데이터 히스토리
데이터 히스토리 일자 변경내용 비고 2024-06-25 산출물 추가 공개 저작도구 2022-10-21 신규 샘플데이터 개방 2022-07-13 콘텐츠 최초 등록 소개
정밀농업에 필요한 노지작물 생육 데이터를 확보하는 것을 목적으로, 작물 10종에 대해 지상에서 촬영하는 2D RGB 이미지 데이터, 다분광 드론 촬영 데이터, 적외선 촬영 온도값, 토양 및 환경 센서 데이터를 통합적으로 융합한 학습데이터셋
구축목적
주요 작물10종을 대상으로 2D RGB 데이터(환경 데이터/적외선/다분광 데이터 연계된 메타데이터 포함)를 구축하여 정밀농업에 활용될 수 있는 AI 학습데이터 구축
-
메타데이터 구조표 데이터 영역 농축수산 데이터 유형 이미지 데이터 형식 jpg, json 데이터 출처 자체 수집 라벨링 유형 세그멘테이션(이미지/동영상) 라벨링 형식 json 데이터 활용 서비스 인공지능 기반 노지작물 탐지 및 분류 모델 데이터 구축년도/
데이터 구축량2021년/학습용 데이터 (목표량) 672,000개 / (구축량) 715,178개, 토양 및 환경센서 데이터 (목표량) 144,000set / (구축량) 158,200set, 적외선 데이터 (목표량) 128,000개 / (구축량) 133,911개, 다분광 데이터 (목표량) 32,000개 / (구축량) 83,448개 -
1. 학습용 데이터-2D RGB 이미지 데이터-구축 규모
1. 학습용 데이터-2D RGB 이미지 데이터-구축 규모 품종 생육단계 객체 촬영 범위 합 비율 전체 부분 벼(조생종) 3 4,050 16,841 20,891 2.92% 벼(중만생종) 1 3,721 10,267 13,988 1.96% 2 1,653 3,583 5,236 0.73% 3 7,915 39,415 47,330 6.62% 콩(풍산) 1 8,013 56,869 64,882 9.07% 2 750 5,911 6,661 0.93% 3 1,605 18,964 20,569 2.88% 콩(대풍2호) 1 3,762 41,473 45,235 6.32% 2 2,078 9,064 11,142 1.56% 3 4,317 25,413 29,730 4.16% 옥수수(일미찰) 1 2,139 26,414 28,553 3.99% 2 1,318 6,401 7,719 1.08% 3 3,483 14,618 18,101 2.53% 옥수수(광평옥) 1 7,087 73,549 80,636 11.27% 2 1,220 6,268 7,488 1.05% 3 4,413 17,490 21,903 3.06% 감자 1 1,154 35,035 36,189 5.06% 2 5,757 13,990 19,747 2.76% 3 2,175 11,681 13,856 1.94% 고구마 1 1,557 45,387 46,944 6.56% 2 1,180 16,361 17,541 2.45% 3 1,660 3,242 4,902 0.69% 참깨 1 34,338 733 35,071 4.90% 2 2,406 2,001 4,407 0.62% 3 2,459 1,883 4,342 0.61% 들깨 1 9,411 29,375 38,786 5.42% 2 2,610 50,287 52,897 7.40% 3 3,134 7,298 10,432 1.46% 총합계 125,365 589,813 715,178 100% ※총 구축 목표인 672,000개의 106%인 715,178개 학습데이터 구축
2. 학습용 데이터-2D RGB 이미지 데이터-구축 규모
3. 학습용 데이터 이외 추가 데이터 구축 규모
3. 학습용 데이터 이외 추가 데이터 구축 규모 추가 데이터 종류 구축 목표 실제 구축 규모 토양 및 환경센서데이터 144,000set 158,200set 적외선 데이터 128,000개 133,911개 다분광 데이터 32,000개 83,448개 -
-
AI 모델 상세 설명서 다운로드
AI 모델 상세 설명서 다운로드 AI 모델 다운로드향후 활용 분야 및 활용 서비스 내역
- 노지작물 탐지 및 분류 모델을 활용하여 수확량 예측 또는 작물에 따른 재배방법 적용 등 농업 및 다양한 분야에 활용 가능한 정보 제공
<노지작물 탐지 및 분류모델 활용 분야>- 노지작물 생육 분류 예측 모델을 활용하여 작물에 따른 생육 단계별 성숙도 정보를 제공하고, 이에 따른 작물의 현 상태를 파악하여 농작물 병해충에 조기 대응할 수 있는 정보 제공
<노지작물 생육 분류 예측 모델 활용 분야> -
데이터 성능 점수
측정값 (%)기준값 (%)데이터 성능 지표
데이터 성능 지표 번호 측정항목 AI TASK 학습모델 지표명 기준값 점수 측정값 점수 1 폴리곤 객체 인식 (부분 이미지) Object Detection MASK R-CNN(resnet101) mAP@IoU 0.5 85 % 93.06 % 2 폴리곤 객체 인식 (전체 이미지, 생육단계) Object Detection MASK R-CNN(resnet101) mAP@IoU 0.5 85 % 86.93 %
※ 데이터 성능 지표가 여러 개일 경우 각 항목을 클릭하면 해당 지표의 값이 그래프에 표기됩니다.
※ AI모델 평가 지표에 따라 측정값의 범위, 판단 기준이 달라질 수 있습니다. (ex. 오류율의 경우, 낮을수록 좋은 성능을 내는 것으로 평가됩니다)
-
설명서 및 활용가이드 다운로드
데이터 설명서 다운로드 구축활용가이드 다운로드1. 객체 클래스 정의
- 객체의 품종명
품종명 품종명 품종코드 품종명 품종코드 벼(조생종) AA 옥수수(광평옥) CB 벼(중만생종) AB 감자 DA 콩(풍산) BA 고구마 EA 콩(대풍2호) BB 참깨 FA 옥수수(일미찰) CA 들깨 GA - 객체의 품종별 생육단계
작물 품종 생육단계 1 2 3 벼
(조생종, 중만생종)- 열매가 맺기 전까지 단계 다음 중 하나에 해당하는 경우
– 열매가 맺힌 후 고개를 90도 이상 숙이기 전까지
– 열매가 맺힌 후 열매 또는 잎이 변색되기 전까지다음 중 하나에 해당하는 경우
- 열매가 익어가며 고개를 90도 이상 숙인 후 수확까지
- 열매 또는 잎이 변색되기 시작한 후 수확까지콩
(풍산, 대풍2호)- 발아 후 곁가지가 생성되기 전까지 단계 - 곁가지가 생성되어 잎 또는 열매가 황변되기 전까지 단계 - 잎 또는 열매가 황변되기 시작한 후 수확까지 옥수수
(일미찰, 광평옥)- 꽃봉오리(꽃대)나 열매가 생기기 전까지 단계 꽃봉오리(꽃대)가 생성된 후, 열매*가 맺히기 전까지 단계
* 열매는 옥수수 수염이 보이는 경우 맺힌 걸로 판단열매*가 맺힌 후 수확까지
* 수확기에 이르러 옥수수잎 및 열매가 말라가면서 수염이 빠진 경우를 포함감자 전체 객체가 멀칭(또는 봉분) 내부에 존재할 때까지 단계
* 객체가 비닐 포장(또는 봉분) 끝 라인을 벗어나지 않는 경우 멀칭(또는 봉분) 내부에 존재하는 것으로 판단
* 외부 요인으로 인해 일부가 갈변되더라도 전체가 멀칭(또는 봉분) 내부에 존재하는 경우 1단계로 분류- 전체 객체가 멀칭(또는 봉분)을 벗어난 시점부터 잎의 갈변이 시작되기 전까지 - 잎의 갈변이 시작된 시점부터 수확까지 고구마 - 객체의 뿌리에서 나오는 줄기가 육안으로 확인 가능할 때까지 단계 전체 객체가 멀칭 내부*에 존재할 때까지 단계
* 감자의 멀칭 내부 판단 기준 준용- 전체 객체가 멀칭을 벗어나 무성한 단계 참깨 꽃이 피기 전까지 단계
* 흰색 꽃잎이 보이는 경우 꽃이 핀 것으로 판단 F15다음 중 하나에 해당하는 경우
- 꽃이 피어있고 열매가 맺히기 전까지 단계
- 꽃이 피어있고 열매가 맺혀있는 단계- 꽃이 지고 열매가 맺혀있는 단계 들깨 - 발아 후 꽃봉오리가 생성되기 전까지 - 꽃봉오리가 생성된 이후 꽃봉오리 또는 잎의 변색이 시작되기 전까지 - 꽃봉오리 또는 잎이 변색되는 시점부터 수확까지 2. 라벨링데이터 구성
구분 항목명 설명 타입 필수여부 범위 1. info-기본 정보 1–1 description 데이터셋 이름 string Y crop_data 1–2 url 데이터셋 제작자 url string Y https://www.jeonbuk.go.kr/ 1–3 version 제작버전 string Y v.1.0 1–4 year 제작년도 number Y 2021 1–5 type 데이터셋 타입 string Y jpg 1–6 img_path 이미지데이터 폴더 경로 string Y /품종명/img 1–7 label_path 라벨링데이터 폴더 경로 string Y /품종명/json 2. collection - 수집 정보 2–1 obj_num 객체 번호(위치) string Y 001~999 2–2 tod_attribute 적외선 촬영 장비 속성 string FLIR C3X 2–3 tod_temper 객체 표면 온도 number -20 ~ 300 2–4 spec_way 다분광 촬영 방식 string drone 2–5 spec_attribute 다분광 촬영 장비 속성 string Micasense RedEdge MX Dual 2–6 spec_ndvi 정규 식생 지수 number 0~9 2–7 soil_ec 토양 전기전도도(EC) number Y 0~10 2–8 soil_temper 토양 온도 number Y 0~60 2–9 soil_humidity 토양 습도 number Y 0~100 2–10 soil_potential 토양 수분장력 number Y 0 ~ -1000000 2–11 temperature 온도 number Y -40 ~ 124 2–12 humidity 습도 number Y 0~100 2–13 sunshine 일사량 number Y 0~2000 2–14 sunrise_time 일출시간 string Y 04:00~09:59 2–15 sunset_time 일몰시간 string Y 16:00~22:59 2–16 img_attribute 촬영 장비 속성 string Y SM-G965N 등 2–17 img_time 촬영일시 string Y YYYY-MM-DD 2–18 img_part 작물 촬영 부위 string Y [W, X, Y] 2–19 img_dist 촬영 거리(cm) number 1~1000 2–20 img_angle 촬영 각도 number 0~360 3. licenses – 저작권 정보 3–1 licenses_id 라이센스 고유 번호 number 1 3–2 licenses_name 라이센스 이름 string crop01 4. images – 이미지 데이터 정보 4–1 img_file_name 원천데이터 이름(파일명) string Y 예)20210803_RGB_AA_1_X_01_07.jpg 4–2 img_height 세로 number Y 1080~4800 4–3 img_width 가로 number Y 1080~4800 5. annotations – 어노테이션 정보 5–1 segmentation segmentation 좌표 string Y 예)[2.14474345,114.3444656] 5–2 area 어노테이션 면적 number Y 0~ 23040000 5–3 bbox bounding box 정보 string Y 예)[0.0, 0.0, 440.0, 273.0] 5–4 crops_kind 작물 품종명 string Y [A, B, C, D, E, F, G] 5–5 crops_detail 작물 세부 품종명 string Y [AA, AB, BA, BB, CA, CB, DA, EA, FA, GA] 5–6 crops_step 객체 생육단계 string Y 01~03 3 라벨링데이터 실제예시
-
데이터셋 구축 담당자
수행기관(주관) : 전라북도
수행기관(주관) 책임자명 전화번호 대표이메일 담당업무 강초희 063-280-3956 kch0219@korea.kr 업무 총괄 수행기관(참여)
수행기관(참여) 기관명 담당업무 전라북도농업기술원 데이터 검증 국립농업과학원 데이터 수집, 검증 완주군 데이터 검증 캠틱종합기술원 크라우드소싱 인력 관리 ㈜업데이터 데이터 가공, 모델 개발 ㈜디에스엔전주 데이터 전처리 ㈜이레아이에스 데이터 수집 (유)호정솔루션 데이터 수집 ㈜엔에이치네트웍스 수집데이터 검사
-
인터넷과 물리적으로 분리된 온라인·오프라인 공간으로 의료 데이터를 포함하여 보안 조치가 요구되는 데이터를 다운로드 없이 접근하고 분석 가능
* 온라인 안심존 : 보안이 보장된 온라인 네트워크를 통해 집, 연구실, 사무실 등 어디서나 접속하여 데이터에 접근하고 분석
* 오프라인 안심존 : 추가적인 보안이 필요한 데이터를 대상으로 지정된 물리적 공간에서만 접속하여 데이터에 접근하고 분석 -
- AI 허브 접속
신청자 - 안심존
사용신청신청자신청서류 제출* - 심사구축기관
- 승인구축기관
- 데이터 분석 활용신청자
- 분석모델반출신청자
- AI 허브 접속
-
1. 기관생명윤리위원회(IRB) 심의 결과 통지서 [IRB 알아보기] [공용IRB 심의신청 가이드라인]
2. 기관생명윤리위원회(IRB) 승인된 연구계획서
3. 신청자 소속 증빙 서류 (재직증명서, 재학증명서, 근로계약서 등 택1)
4. 안심존 이용 신청서 [다운로드]
5. 보안서약서 [다운로드]
※ 상기 신청서 및 첨부 서류를 완비한 후 신청을 진행하셔야 정상적으로 절차가 이루어집니다. -
신청 및 이용관련 문의는 safezone1@aihub.kr 또는 02-525-7708, 7709로 문의
데이터셋 다운로드 승인이 완료 된 후 API 다운로드 서비스를 이용하실 수 있습니다.
API 다운로드 파일은 분할 압축되어 다운로드 됩니다. 분할 압축 해제를 위해서는 분할 압축 파일들의 병합이 필요하며 리눅스 명령어 사용이 필요합니다.
리눅스 OS 계열에서 다운로드 받으시길 권장하며 윈도우에서 파일 다운로드 시 wsl(리눅스용 윈도우 하위 시스템) 설치가 필요합니다.
※ 파일 병합 리눅스 명령어
find "폴더경로" -name "파일명.zip.part*" -print0 | sort -zt'.' -k2V | xargs -0 cat > "파일명.zip"
- 해당 명령어 실행 시, 실행 경로 위치에 병합 압축 파일이 생성됩니다.
- 병합된 파일 용량이 0일 경우, 제대로 병합이 되지 않은 상태이니 "폴더경로"가 제대로 입력되었는지 확인 부탁드립니다.
※ 데이터셋 소개 페이지에서 다운로드 버튼 클릭하여 승인이 필요합니다.