-
데이터 변경이력
데이터 변경이력 버전 일자 변경내용 비고 1.0 2022-07-13 데이터 최초 개방 데이터 히스토리
데이터 히스토리 일자 변경내용 비고 2024-06-25 산출물 추가 공개 저작도구 2022-10-21 신규 샘플데이터 개방 2022-09-16 데이터셋 담당자 정보 변경 2022-07-13 콘텐츠 최초 등록 소개
농업 노동력 부족 문제로 잡초를 인식·탐지하여 제거하는 농기계 개발을 위해, 잡초 14종에 대해 지상에서 촬영하는 2D RGB 이미지 데이터, 적외선 촬영 온도값, 토양 및 환경 센서 데이터를 통합적으로 융합한 학습데이터셋
구축목적
잡초를 인식 탐지하기 위한 학습 데이터로써 향후 관련 농기계에 적용할 수 있는 데이터 구축
-
메타데이터 구조표 데이터 영역 농축수산 데이터 유형 이미지 데이터 형식 jpg, json 데이터 출처 자체 수집 라벨링 유형 세그멘테이션(이미지/동영상) 라벨링 형식 JSON 데이터 활용 서비스 인공지능 기반 잡초 탐지 및 분류 모델 개발 데이터 구축년도/
데이터 구축량2021년/학습용 데이터 (목표량) 358,000개 / (구축량) 388,879개, 토양 및 환경센서 데이터 (목표량) 120,000set / (구축량) 170,205set, 적외선 데이터 (목표량) 89,000개 / (구축량) 107,579개 -
학습용 데이터 – 2D RGB 이미지 데이터
학습용 데이터 – 2D RGB 이미지 데이터 품종 구축 수량 비율 품종 구축 수량 비율 강피(논피) 34,177 9% 흰명아주 27,622 7% 물달개비 28,819 7% 한련초 22,399 6% 올방개 34,803 9% 좀명아주 21,659 6% 올챙이고랭이 38,905 10% 닭의장풀 27,732 7% 바랭이 27,860 7% 개비름 31,437 8% 쇠비름 28,008 7% 개여뀌 24,126 6% 깨풀 23,149 6% 미국가막사리 18,183 5% 총 구축 목표 358,000개 실제 구축 규모 388,879개
학습용 데이터 품종별 분포
학습용 데이터 이외 추가 데이터 구축 규모학습용 데이터 이외 추가 데이터 구축 규모 추가 데이터 종류 구축 목표 실제 구축 규모 토양 및 환경센서데이터 120,000set 170,205set 적외선 데이터 89,000개 107,579개 -
-
AI 모델 상세 설명서 다운로드
AI 모델 상세 설명서 다운로드 AI 모델 다운로드향후 활용 분야 및 활용 서비스 내역
- 구축되는 학습데이터를 활용 Mask R-CNN 기반 컬러 이미지에서 잡초 라벨링 데이터를 학습하여 잡초를 탐지하고 Segmentation을 통해서 잡초 분포 영역 및 잡초 크기를 예측할 수 있는 모델 개발
- 잡초제거 로봇에 적용 가능한 잡초 탐지 및 분류 모델을 개발하여, 라즈베리 파이에 탑재하여 바로 활용 가능
-
데이터 성능 점수
측정값 (%)기준값 (%)데이터 성능 지표
데이터 성능 지표 번호 측정항목 AI TASK 학습모델 지표명 기준값 점수 측정값 점수 1 폴리곤 객체 인식 Object Detection MASK R-CNN(resnet101) mAP@IoU 0.5 85 % 95 % 2 바운딩박스 객체 인식 (농작지, RGB) Object Detection darknet YOLO v4 mAP@IoU 0.5 80 % 95.49 % 3 바운딩박스 객체 인식 (농작지, NIR) Object Detection darknet YOLO v4 mAP@IoU 0.5 80 % 95.72 % 4 폴리곤 객체 인식 (농작지, RGB) Object Detection segformer mIoU 80 % 88 % 5 폴리곤 객체 인식 (농작지, NIR) Object Detection segformer mIoU 80 % 87.38 %
※ 데이터 성능 지표가 여러 개일 경우 각 항목을 클릭하면 해당 지표의 값이 그래프에 표기됩니다.
※ AI모델 평가 지표에 따라 측정값의 범위, 판단 기준이 달라질 수 있습니다. (ex. 오류율의 경우, 낮을수록 좋은 성능을 내는 것으로 평가됩니다)
-
설명서 및 활용가이드 다운로드
데이터 설명서 다운로드 구축활용가이드 다운로드객체 클래스 정의
- 객체의 품종명
객체 클래스 정의 품종명 품종코드 품종명 품종코드 강피(논피) A 흰명아주 H 물달개비 B 한련초 I 올방개 C 좀명아주 J 올챙이고랭이 D 닭의장풀 K 바랭이 E 개비름 L 쇠비름 F 개여뀌 M 깨풀 G 미국가막사리 N
라벨링데이터 구성
라벨링데이터 구성 구분 항목명 설명 타입 필수여부 범위 1. info-기본 정보 1–1 description 데이터셋 이름 string Y weed_detection 1–2 url 데이터셋 제작자 url string Y https://www.jeonbuk.go.kr/ 1–3 version 제작버전 string Y v.1.0 1–4 year 제작년도 number Y 2021 1–5 type 데이터셋 타입 string Y jpg 1–6 img_path 이미지데이터 폴더 경로 string Y /품종명/img 1–7 label_path 라벨링데이터 폴더 경로 string Y /품종명/json 2. collection - 수집 정보 2–1 obj_num 객체 번호(위치) string Y 001~999 2–2 tod_attribute 적외선 촬영 장비 속성 string FLIR C3X 2–3 tod_temper 객체 표면 온도 number -20 ~ 300 2–4 soil_ec 토양 전기전도도(EC) number Y 0~10 2–5 soil_temper 토양 온도 number Y 0~60 2–6 soil_humidity 토양 습도 number Y 0~100 2–7 soil_potential 토양 수분장력 number Y 0 ~ -1000000 2–8 temperature 온도 number Y -40 ~ 124 2–9 humidity 습도 number Y 0~100 2–10 sunshine 일사량 number Y 0~2000 2–11 sunrise_time 일출시간 string Y 04:00~09:59 2–12 sunset_time 일몰시간 string Y 16:00~22:59 2–13 img_attribute 촬영 장비 속성 string Y SM-G965N 등 2–14 img_time 촬영일시 string Y YYYY-MM-DD 2–15 img_part 잡초 촬영 범위 string Y [whole, part] 2–16 img_dist 촬영 거리(cm) number 1~1000 2–17 img_angle 촬영 각도 number 0~360 3. licenses – 저작권 정보 3–1 licenses_id 라이센스 고유 번호 number 1 3–2 licenses_name 라이센스 이름 string weed01 4. images – 이미지 데이터 정보 4–1 img_file_name 원천데이터 이름(파일명) string Y 예:20210803_RGB_A_0_001 _05.jpg 4–2 img_height 세로 number Y 1080~4800 img_width 가로 number Y 1080~4800 5. annotations – 어노테이션 정보 5–1 segmentation segmentation 좌표 string Y 예: [2.14474345,114.3444656] 5–2 area 어노테이션 면적 number Y 0~ 23040000 5–3 bbox bounding box 정보 string Y 예: [0.0, 0.0, 440.0, 273.0] 5–4 weeds_kind 잡초명 string Y [A, B, C, D, E, F, G, H, I, J, K, L, M, N]
라벨링 데이터 실제 예시 - 객체의 품종명
-
데이터셋 구축 담당자
수행기관(주관) : 전라북도
수행기관(주관) 책임자명 전화번호 대표이메일 담당업무 강초희 063-280-3956 kch0219@korea.kr · 업무 총괄 수행기관(참여)
수행기관(참여) 기관명 담당업무 전라북도농업기술원 · 데이터 검증 국립농업과학원 · 데이터 수집, 검증 완주군 · 잡초 데이터 수집 지원 및 자문 캠틱종합기술원 · 크라우드소싱 인력관리 ㈜업데이터 · 데이터 가공. 모델 개발 ㈜디에스엔전주 · 데이터 전처리 ㈜이레아이에스 · 데이터 수집 ㈜엔에이치네트웍스 · 수집데이터 검사
-
인터넷과 물리적으로 분리된 온라인·오프라인 공간으로 의료 데이터를 포함하여 보안 조치가 요구되는 데이터를 다운로드 없이 접근하고 분석 가능
* 온라인 안심존 : 보안이 보장된 온라인 네트워크를 통해 집, 연구실, 사무실 등 어디서나 접속하여 데이터에 접근하고 분석
* 오프라인 안심존 : 추가적인 보안이 필요한 데이터를 대상으로 지정된 물리적 공간에서만 접속하여 데이터에 접근하고 분석 -
- AI 허브 접속
신청자 - 안심존
사용신청신청자신청서류 제출* - 심사구축기관
- 승인구축기관
- 데이터 분석 활용신청자
- 분석모델반출신청자
- AI 허브 접속
-
1. 기관생명윤리위원회(IRB) 심의 결과 통지서 [IRB 알아보기] [공용IRB 심의신청 가이드라인]
2. 기관생명윤리위원회(IRB) 승인된 연구계획서
3. 신청자 소속 증빙 서류 (재직증명서, 재학증명서, 근로계약서 등 택1)
4. 안심존 이용 신청서 [다운로드]
5. 보안서약서 [다운로드]
※ 상기 신청서 및 첨부 서류를 완비한 후 신청을 진행하셔야 정상적으로 절차가 이루어집니다. -
신청 및 이용관련 문의는 safezone1@aihub.kr 또는 02-525-7708, 7709로 문의
데이터셋 다운로드 승인이 완료 된 후 API 다운로드 서비스를 이용하실 수 있습니다.
API 다운로드 파일은 분할 압축되어 다운로드 됩니다. 분할 압축 해제를 위해서는 분할 압축 파일들의 병합이 필요하며 리눅스 명령어 사용이 필요합니다.
리눅스 OS 계열에서 다운로드 받으시길 권장하며 윈도우에서 파일 다운로드 시 wsl(리눅스용 윈도우 하위 시스템) 설치가 필요합니다.
※ 파일 병합 리눅스 명령어
find "폴더경로" -name "파일명.zip.part*" -print0 | sort -zt'.' -k2V | xargs -0 cat > "파일명.zip"
- 해당 명령어 실행 시, 실행 경로 위치에 병합 압축 파일이 생성됩니다.
- 병합된 파일 용량이 0일 경우, 제대로 병합이 되지 않은 상태이니 "폴더경로"가 제대로 입력되었는지 확인 부탁드립니다.
※ 데이터셋 소개 페이지에서 다운로드 버튼 클릭하여 승인이 필요합니다.