※ 25년 신규 개방되는 데이터로, 데이터 활용성 검토, 이용자 관점의 개선의견 수렴 등을 통해 수정/보완될 수 있으며 최종데이터, 샘플데이터, 산출물 등은 변경될 수 있습니다.
-
데이터 변경이력
데이터 변경이력 버전 일자 변경내용 비고 1.0 2025-04-16 데이터 개방 Beta Version 데이터 히스토리
데이터 히스토리 일자 변경내용 비고 2025-04-16 산출물 전체 공개 소개
기능성작물의 이미지를 사이드뷰, 탑뷰 2가지 각도에서 촬영하여 환경, 생육데이터를 수집하여 비례 정밀 복합환경 자율 제어를 지원하기 위한 인공지능 학습용 데이터를 구축함.
구축목적
작물 이미지 클래스 분류 및 이미지 캡션 생성을 위한 식물 이미지, 첨단농장 환경 데이터, 작물 생장 및 분류 데이터, 이미지 캡션 설명문 데이터 구축
-
메타데이터 구조표 데이터 영역 농축수산 데이터 유형 이미지 데이터 형식 이미지 데이터 : JPG[해상도 1920*1080] 환경, 생육 모니터링 데이터 : JSON 데이터 출처 농업 / 컨소시엄 자체 데이터 구축 라벨링 유형 바운딩박스(이미지) 라벨링 형식 가공데이터(환경, 생육, 성분 모니터링 데이터 포함) : JSON 데이터 활용 서비스 이미지 데이터를 이용한 주요 기능성작물의 생육 주차 판별 및 해당 작물 명 식별 데이터 구축년도/
데이터 구축량2024년/공개용데이터 245,000건, 라벨링 데이터 245,000건, 환경, 생육 모니터링 데이터 245,000건, 성분분석데이터 90건 -
데이터 구축 규모 및 데이터 분포 정보
데이터 구축 규모 및 데이터 분포 정보 1차 경로 2차 경로 3차 경로 파일 포맷 최종검증 제출 수량 01. 밀순 01. 생장 01. 사이드뷰 .jpg / .json 17,068 02. 탑뷰 .jpg / .json 6,932 02. 수확 01. 사이드뷰 .jpg / .json 8,181 02. 탑뷰 .jpg / .json 9,819 02. 새싹인삼
(개량종)01. 생장 01. 사이드뷰 .jpg / .json 11,971 02. 탑뷰 .jpg / .json 4,029 02. 수확 01. 사이드뷰 .jpg / .json 3,381 02. 탑뷰 .jpg / .json 2,619 03. 새싹인삼
(연풍)01. 생장 01. 사이드뷰 .jpg / .json 5,394 02. 탑뷰 .jpg / .json 4,606 02. 수확 01. 사이드뷰 .jpg / .json 1,436 02. 탑뷰 .jpg / .json 564 04. 양상추 01. 생장 01. 사이드뷰 .jpg / .json 17,501 02. 탑뷰 .jpg / .json 10,499 02. 수확 01. 사이드뷰 .jpg / .json 2,922 02. 탑뷰 .jpg / .json 3,078 05. 녹차 01. 생장 01. 사이드뷰 .jpg / .json 14,732 02. 탑뷰 .jpg / .json 7,268 02. 수확 01. 사이드뷰 .jpg / .json 7,798 02. 탑뷰 .jpg / .json 6,202 06. 두메부추 01. 생장 01. 사이드뷰 .jpg / .json 24,207 02. 탑뷰 .jpg / .json 3,793 02. 수확 01. 사이드뷰 .jpg / .json 3,849 02. 탑뷰 .jpg / .json 8,151 07. 팥순 01. 생장 01. 사이드뷰 .jpg / .json 14,916 02. 탑뷰 .jpg / .json 9,084 02. 수확 01. 사이드뷰 .jpg / .json 8,152 02. 탑뷰 .jpg / .json 9,848 08. 구절초
(넓은잎)01. 생장 01. 사이드뷰 .jpg / .json 3,134 02. 탑뷰 .jpg / .json 2,466 02. 수확 01. 사이드뷰 .jpg / .json 1,316 02. 탑뷰 .jpg / .json 84 09. 구절초
(좁은잎)01. 생장 01. 사이드뷰 .jpg / .json 5,522 02. 탑뷰 .jpg / .json 1,478 02. 수확 01. 사이드뷰 .jpg / .json 2,970 02. 탑뷰 .jpg / .json 30 총 수량 245,000 -
-
AI 모델 상세 설명서 다운로드
AI 모델 상세 설명서 다운로드 AI 모델 다운로드ㅇ 인공지능 알고리즘의 도메인은 분류(classification) 모델으로 정하고 분류 성능을 최적화할 수 있는 모델을 선정, 모델 학습 후 F1 Score로 정량적 평가결과 산출
[그림] Classification 모델을 이용한 영상 분류 예시ㅇ F1 Score
- F1 Score는 모델의 정밀도와 재현율을 합친 방식으로 모델의 정밀도와 재현율의 조화평균으로 계산
ㅇ 실증 목표치(TTA 인증기관 검증)
- 목표치 (F1 score) 90% 이상 -
설명서 및 활용가이드 다운로드
데이터 설명서 다운로드 구축활용가이드 다운로드어노테이션 포맷
어노테이션 포맷 구분 항목명 타입 필수 설명 범위 비고 1 images 이미지 1-1 class String Y 작물명 1-2 quality_status String Y 작물 상태 생장/수확 1-3 photo_date String Y 촬영 시간 정보 년월일시간 1-4 photo_direction String Y 촬영각도 0(사이드뷰), 1(탑뷰) 1-5 photographer_code String Y 촬영자코드 1-6 scenario String Y 재배시나리오 1-7 imagePath String Y 파일명 1-8 imageHeight String Y 이미지 높이 1-9 imageWidth String Y 이미지 폭 2 labels 라벨링 정보 복수개 생성 2-1 label_id String Y 라벨링 id 2-2 label_divide String Y 분류 잎/줄기/화방/열매 2-3 label_points Array Y 라벨링 좌표값 [[X1,Y1],
[X2,Y2],
[X3, Y3]...]3 Environment 환경 데이터 3-1 Env_Date String Y 획득 시간 3-2 temp Number Y 온도 ℃ 3-3 humidity Number Y 습도 % 3-4 CO2 Number Y CO2 ppm 3-5 Lux Number Y 조도 μ㏖/㎡/s 3-6 nutrient_temperature Number Y 양액 온도 ℃ 3-7 EC Number Y EC dS/m 3-8 pH Number Y pH pH 3-9 ventilator Numbe N 환풍기 3-10 floating_fan Numbe N 유동 팬 3-11 water_motor Numbe N 관수 모터 3-12 water_valve Numbe N 관수 밸브 3-13 heater Numbe N 난방기 3-14 air_conditioner Numbe N 냉방기 4 Growth 생장 데이터 4-1 Grow_Date String Y 획득 시간 4-2 stem_length Number Y 경장 cm 4-3 stalk_diameter Number Y 경직경 cm 4-4 leaf_width Number Y 엽폭 cm 4-5 leaf_number Number Y 엽수 개 4-6 flower_pot Number Y 화방수 개 4-7 flower_posion Number N 화방 위치 4-8 fruit_quantity Number Y 열매 수량 개 4-9 fruit Number Y 열매 유/뮤 0(무), 1(유) 4-10 root_length Number N 뿌리 길이 4-11 growth_cycle Number N 생장 주기 5 Analysis 분석 데이터 5-1 Raw_Weight Number N 원물중량 g 5-2 Dry_Weight Number N 건조중량 g 5-3 Dry_Rate Number N 건조수율 % 5-4 Moisture Con. Number N 수분 함량 % 5-5 Brix Number N 당도 Brix° 5-6 Color_L Number N 색도 L(명도) 5-7 Color_a Number N 색도 a(적색도) 5-8 Color_b Number N 색도 b(황색도) 5-9 Texture Number N 조직감 g 5-10 Ingredient_NM String N 성분명 5-11 Ingredient_Con. Number N 성분 함량 ㎍/g 5-12 Ingredient2_NM Number N 성분명2 5-13 Ingredient2_Con. Number N 성분 함량2 ㎍/g 5-14 Ingredient3_NM Number N 성분명3 5-15 Ingredient3_Con. Number N 성분 함량3 ㎍/g 6 caption 캡셔닝 6-1 detail String Y 캡셔닝 6-2 image_caption String Y 캡셔닝 어노테이션 예시
-
데이터셋 구축 담당자
수행기관(주관) : 농업회사법인 렛츠팜㈜
수행기관(주관) 책임자명 전화번호 대표이메일 담당업무 김동일 063-253-3338 samelife@letsfarm.co.kr 기업부설연구소 빅데이터 담당 수행기관(참여)
수행기관(참여) 기관명 담당업무 ㈜뉴컨 데이터 정제, 가공 전북바이오융합산업진흥원 기능성작물 성분데이터 분석 한국농수산대학교 산학협력단 데이터 정제, 가공 데이터 관련 문의처
데이터 관련 문의처 담당자명 전화번호 이메일 김동일 063-211-3338 samelife@letsfarm.co.kr 이민지 063-211-3338 mjl@letsfarm.co.kr AI모델 관련 문의처
AI모델 관련 문의처 담당자명 전화번호 이메일 김동일 063-211-3338 samelife@letsfarm.co.kr 이민지 063-211-3338 mjl@letsfarm.co.kr 저작도구 관련 문의처
저작도구 관련 문의처 담당자명 전화번호 이메일 이민주 070-4044-4275 danteguy@newconnect.co.kr 박준형 070-4044-4275 juneco@newconnect.co.kr
-
인터넷과 물리적으로 분리된 온라인·오프라인 공간으로 의료 데이터를 포함하여 보안 조치가 요구되는 데이터를 다운로드 없이 접근하고 분석 가능
* 온라인 안심존 : 보안이 보장된 온라인 네트워크를 통해 집, 연구실, 사무실 등 어디서나 접속하여 데이터에 접근하고 분석
* 오프라인 안심존 : 추가적인 보안이 필요한 데이터를 대상으로 지정된 물리적 공간에서만 접속하여 데이터에 접근하고 분석 -
- AI 허브 접속
신청자 - 안심존
사용신청신청자신청서류 제출* - 심사구축기관
- 승인구축기관
- 데이터 분석 활용신청자
- 분석모델반출신청자
- AI 허브 접속
-
1. 기관생명윤리위원회(IRB) 심의 결과 통지서 [IRB 알아보기] [공용IRB 심의신청 가이드라인]
2. 기관생명윤리위원회(IRB) 승인된 연구계획서
3. 신청자 소속 증빙 서류 (재직증명서, 재학증명서, 근로계약서 등 택1)
4. 안심존 이용 신청서 [다운로드]
5. 보안서약서 [다운로드]
※ 상기 신청서 및 첨부 서류를 완비한 후 신청을 진행하셔야 정상적으로 절차가 이루어집니다. -
신청 및 이용관련 문의는 safezone1@aihub.kr 또는 02-525-7708, 7709로 문의
데이터셋 다운로드 승인이 완료 된 후 API 다운로드 서비스를 이용하실 수 있습니다.
API 다운로드 파일은 분할 압축되어 다운로드 됩니다. 분할 압축 해제를 위해서는 분할 압축 파일들의 병합이 필요하며 리눅스 명령어 사용이 필요합니다.
리눅스 OS 계열에서 다운로드 받으시길 권장하며 윈도우에서 파일 다운로드 시 wsl(리눅스용 윈도우 하위 시스템) 설치가 필요합니다.
※ 파일 병합 리눅스 명령어
find "폴더경로" -name "파일명.zip.part*" -print0 | sort -zt'.' -k2V | xargs -0 cat > "파일명.zip"
- 해당 명령어 실행 시, 실행 경로 위치에 병합 압축 파일이 생성됩니다.
- 병합된 파일 용량이 0일 경우, 제대로 병합이 되지 않은 상태이니 "폴더경로"가 제대로 입력되었는지 확인 부탁드립니다.
※ 데이터셋 소개 페이지에서 다운로드 버튼 클릭하여 승인이 필요합니다.
오프라인 데이터 이용 안내
본 데이터는 K-ICT 빅데이터센터에서도 이용하실 수 있습니다.
다양한 데이터(미개방 데이터 포함)를 분석할 수 있는 오프라인 분석공간을 제공하고 있습니다.
데이터 안심구역 이용절차 및 신청은 K-ICT빅데이터센터 홈페이지를 참고하시기 바랍니다.
국방데이터 개방 안내
본 데이터는 국방데이터로 군사 보안에 따라 AI허브에서 데이터를 제공하지 않으며,
군 담당자를 통한 별도의 사용 신청이 필요합니다.