NEW 지능형 스마트 미꾸리 종자생산 시스템 및 양식 데이터
- 분야농축수산
- 유형 텍스트 , 이미지
-
데이터 변경이력
데이터 변경이력 버전 일자 변경내용 비고 1.1 2024-10-30 데이터 최종 개방 1.0 2024-06-28 데이터 개방 Beta Version 데이터 히스토리
데이터 히스토리 일자 변경내용 비고 2024-06-28 산출물 공개 Beta Version 소개
- 미꾸리 성육 전과정(종자생산, 중간양성, 어미성숙)에 대한 이미지 데이터, 사육관리 및 수질환경 데이터를 수집하여 학습 데이터를 구축하는 사업
구축목적
- 미꾸리 종자생산 및 양식 환경관리를 분석할 수 있는 통합 데이터 구축
-
메타데이터 구조표 데이터 영역 농축수산 데이터 유형 텍스트 , 이미지 데이터 형식 jpg 데이터 출처 자체 수집 라벨링 유형 폴리곤(이미지), 바운딩 박스(이미지), 시계열 데이터(csv) 라벨링 형식 json, csv 데이터 활용 서비스 AI 양식 미꾸리 객체분석 서비스, AI 미꾸리 성장분석 서비스, AI 양식 먹이생물 객채분석 서비스 데이터 구축년도/
데이터 구축량2023년/원천데이터 : 334,195 장, 라벨링데이터 : json 334,195 건(파일), csv 6,930 건(파일) -
- 데이터 구성
데이터 구성 1차 경로 2차 경로 3차 경로 파일 포맷 최종 제출 수량 목표량 달성률 1_종자생산 01_자어 001_1단계 jpg, json 22,608 장/건 120,000 장/건 108% 002_2단계 jpg, json 47,160 장/건 02_치어 - jpg, json 59,832 장/건 2_중간양성 01_일반양식 001_중간양성 jpg, json 24,096 장/건 100,000 장/건 108% 002_추가양성 jpg, json 19,104 장/건 02_생태양식 001_중간양성 jpg, json 40,368 장/건 002_추가양성 jpg, json 24,432 장/건 3_어미성숙 01_성숙단계 - jpg, json 26,256 장/건 40,000 장/건 115% 02_성숙완료 - jpg, json 19,824 장/건 4_먹이생물 01_세각류 001_혼합 jpg, json 50,515 장/건 50,000 장/건 101% 5_미꾸리 시계열 데이터 01_종자생산 - csv 1,800 건 1,667 건 108% (129,600 줄) (120,000 줄) 02_중간양성 - csv 2,250 건 2,084 건 108% (108,000 줄) (100,000 줄) 03_어미성숙 - csv 2,880 건 2,500 건 115% (46,080 줄) (40,000 줄) 총 수량 jpg, json 334,195 장/건 310,000 장/건 108% csv 6,930 건 6,251 건 111% (283,680 줄) (270,000 줄) -
-
AI 모델 상세 설명서 다운로드
AI 모델 상세 설명서 다운로드 AI 모델 다운로드- 활용 모델
활용 모델 Instance Segmentation Task 학습모델 ㆍ Mask R-CNN 알고리즘 ㆍ Instance Segmentation Task에 사용되는 학습 모델
ㆍ Segmentation Task에는 픽셀단위로 물체를 분류해야하기 때문에 Mask Branch를 사용하여 작은 FCN(Fully Convolutional Network)를 거쳐 각 ROI에 대해 Binary Mask를 획득
ㆍ 개별 Segmentation 결과를 통해 마스크의 가로축의 길이를 계산하여 모델 학습에 활용
ㆍ ArchitectureTime Series Forecasting
Task학습모델 ㆍ LSTM 알고리즘 ㆍ 알고리즘 :
ㆍ LSTM(Long Short-Term Memory)은 RNN(Recurrent Neural Network)의 한 종류로 순차적인 데이터를 다루기 위한 알고리즘
ㆍ LSTM은 은닉층의 메모리 셀에 입력 게이트, 망각 게이트, 출력 게이트를 추가하여 불필요한 기억을 지우고, 기억해야할 것들을 정합하여 LSTM은 기존의 RNN보다 은닉층의 계산이 조금 더 복잡해지고 셀 상태 (cell state)라는 개념이 추가
ㆍ LSTM은 RNN의 단점인 긴 시퀀스에서 정보가 사라지는 문제를 해결 가능
ㆍ Architecture- 활용 서비스 (예시)
1. AI 양식 미꾸리 객체분석 서비스
- AI 양식 미꾸리 성장(체장)분석 서비스 (종자생산-중간양성)
- AI 양식 미꾸리 성장(GSI)분석 서비스 (어미성숙)2. AI 양식 먹이생물 객체분석 서비스
- AI 양식 먹이생물 비율 분석 서비스 (스포이드로 추출한 샘플 기준으로 다프니아 : 모이나 비율 계산) -
설명서 및 활용가이드 다운로드
데이터 설명서 다운로드 구축활용가이드 다운로드- 미꾸리 데이터 구성
미꾸리 데이터 구성 Key Description Type Child Type info 기본정보 JsonObject description 데이터셋 명칭 string contributor 저작도구 string url 저작도구 URL string version 데이터셋 버전 string date_created 데이터셋 생성년도 number filename 원천데이터 이름 string id 파일 ID string cage_id 케이지 ID string migguri_id 미꾸리 ID string date 촬영일자 string format 포맷 string imagesize 정지영상 파일 크기(MB) number width 정지영상 가로길이 number height 정지영상 세로길이 number device 촬영 기기 정보 string water_quality_sensor 수질 관리 센서 string light_sensor 조도 센서 string growth_stage 성장단계 number farm_environment 양식장 장소 number migguri_type 미꾸리 단계 number location 수집장소 number tank_id 수조 고유번호 string tank_capacity 수조 용량(L) number tank_density 수조 밀도(미) number maturation_period 성장기간 (일) number label_quantity 라벨 개수 number breeding_env 사육환경 데이터 JsonObject format 포맷 string water_temp 수온(℃) number water_do 용존산소량(DO) number water_ph 산성도(pH) number water_orp 산화환원전위(ORP) number tank_lux 조도(lux) number water_nh3 암모니아(NH3) number water_no2- 아질산(NO2-) number feed_type 급이 종류 string feed_frequency 급이횟수 number feed_cap 급이 용량 number photoperiod 광주기 number body_length 개체 체장 number migguri_posture 개체 자세 number maturation 어미성숙 데이터 JsonObject body_weight 개체 체중 number gonads_weight 생식선 중량(g) number gsi 성숙지수 (GSI) number image 원천 데이터 경로 string bbox2d 라벨링 데이터 JsonArray [ 라벨링 데이터 배열 JsonArray JsonObject { 라벨링데이터 JsonObject id 개체 ID number name 클래스 이름 string bbox 개체 bbox 좌표 JsonArray [ 개체 bbox 좌표 배열 JsonArray JsonObject ] } ] segmentation 라벨링 데이터 JsonArray [ 라벨링 데이터 배열 JsonArray JsonObject { 라벨링데이터 JsonObject name 클래스 이름 string polygon 개체 폴리곤 JsonArray [ 개체 폴리곤 좌표 배열 JsonArray JsonObject ] } ] - 먹이생물 데이터 구성
먹이생물 데이터 구성 Key Description Type Child Type info 기본정보 JsonObject description 데이터셋 명칭 string contributor 저작도구 string url 저작도구 URL string version 데이터셋 버전 string date_created 데이터셋 생성년도 number filename 원천데이터 이름 string id 파일 ID string date 촬영일자 string format 포맷 string imagesize 정지영상 파일 크기(MB) number width 정지영상 가로길이 number height 정지영상 세로길이 number growth_stage 성장단계 number device 촬영 기기 정보 string microscope_magnification 현미경 배율 number tank_id 수조 고유번호 string tank_capacity 수조 용량(L) number tank_density 수조 밀도(미) number creature_period 배양기간 number label_quantity 라벨 개수 number image 원천 데이터 경로 string bbox2d 라벨링 데이터 JsonArray [ 라벨링 데이터 배열 JsonArray JsonObject { 라벨링데이터 JsonObject id 개체 ID number name 클래스 이름 string bbox 개체 bbox 좌표 JsonArray [ 개체 bbox 좌표 배열 JsonArray JsonObject ] } ] segmentation 라벨링 데이터 JsonArray [ 라벨링 데이터 배열 JsonArray JsonObject { 라벨링데이터 JsonObject name 클래스 이름 string polygon 개체 폴리곤 JsonArray [ 개체 폴리곤 좌표 배열 JsonArray JsonObject ] } ] - 미꾸리 어노테이션 포맷
미꾸리 어노테이션 포맷 구분 속성명 타입 필수여부 설명 범위 비고 1 info object Y 기본정보 1-1 info.description string Y 데이터셋 명칭 1-2 info.contributor string Y 저작도구 1-3 info.url string Y 저작도구 URL https://... 1-4 info.version string Y 데이터셋 버전 1-5 info.date_created number Y 데이터셋 생성년도 1-6 info.filename string Y 원천데이터 이름 1-7 info.id string Y 파일 ID 1~999,999 1-8 info.cage_id string Y 케이지 ID C001~C999 1-9 info.migguri_id string Y 미꾸리 ID M000001~M999999 1-10 info.date string Y 촬영일자 1-11 info.format string Y 포맷 1-12 info.imagesize number Y 정지영상 파일 크기(MB) 1-13 info.width number Y 정지영상 가로길이 1920 (고정) 1-14 info.height number Y 정지영상 세로길이 1080 (고정) 1-15 info.device string Y 촬영 기기 정보 1-16 info.water_quality_sensor string Y 수질 관리 센서 1-17 info.light_sensor string Y 조도 센서 1-18 info.growth_stage number Y 성장단계 0~2 0: 종자생산
1: 중간양성
2: 어미성숙1-19 info.farm_environment number Y 양식장 장소 0~1 0: 일반양식장
1: 생태양식장1-20 info.migguri_type number Y 미꾸리 단계 0~5 0: 성숙단계
1: 성숙완료
2: 자어
3: 치어
4: 중간양성
5: 추가양성1-21 info.location number Y 수집장소 1-22 info.tank_id string Y 수조 고유번호 1-23 info.tank_capacity number Y 수조 용량(L) 1-24 info.tank_density number Y 수조 밀도(미) 1-25 info.maturation_period number Y 성장기간 (일) 1-26 info.label_quantity number Y 라벨 개수 2 breeding_env object Y 사육환경 데이터 2-1 breeding_env.format string Y 포맷 2-2 breeding_env.water_temp number Y 수온(℃) 5~28.49 2-3 breeding_env.water_do number Y 용존산소량(DO) 1.5~6.49 2-4 breeding_env.water_ph number Y 산성도(pH) 2~7.19 2-5 breeding_env.water_orp number Y 산화환원전위(ORP) 100~400.99 2-6 breeding_env.tank_lux number Y 조도(lux) 200~91999.99 2-7 breeding_env.water_nh3 number 암모니아(NH3) 0~0.2499 2-8 breeding_env.water_no2- number 아질산(NO2-) 0~0.2099 2-9 breeding_env.feed_type string Y 급이 종류 C: 먹이생물
(creature)
F: 일반사료
(feed)2-10 breeding_env.feed_frequency number Y 급이 횟수 0~3 0: 1회/일
1: 2회/일
2: 3회/일
3: 4회/일2-11 breeding_env.feed_cap number Y 급이 용량 2-12 breeding_env.photoperiod number Y 광주기 0~1 0: 12L/12D
1: 14L/10D2-13 breeding_env.body_length number Y 개체 체장 0.4~17.5 2-14 info.migguri_posture number Y 개체 자세 0~2 0: I형
1: S형
2: C형3 maturation Object 어미성숙 데이터 3-1 maturation.body_weight number 어미성숙 Y 개체 체중(g) 2~22.5 3-2 maturation.gonads_weight number 어미성숙 Y 생식선 중량(g) 0~4.5 3-3 maturation.gsi number 어미성숙 Y 성숙지수 (GSI) 0~21.5 4 image string Y 원천 데이터 경로 5 bbox2d array Y 라벨링 데이터 6 segmentation array Y 라벨링 데이터 6-1 segmentation[].name string Y 클래스 이름 6-2 segmentation[].polygon array Y 개체 폴리곤 6-3 segmentation[].polygon[][0] number Y 개체 폴리곤 x 좌표 6-4 segmentation[].polygon[][1] number Y 개체 폴리곤 y 좌표 - 먹이생물 어노테이션 포맷
먹이생물 어노테이션 포맷 구분 속성명 타입 필수여부 설명 범위 비고 1 creature_info object Y 먹이생물 정보 1-1 creature_info.description string Y 데이터셋 명칭 1-2 creature_info.contributor string Y 저작도구 1-3 creature_info.url string Y 저작도구 URL https://... 1-4 creature_info.version string Y 데이터셋 버전 1-5 creature_info.date_created number Y 데이터셋 생성년도 1-6 creature_info.filename string Y 원천데이터 이름 1-7 creature_info.id string Y ID 1~99,999 1-8 creature_info.date string Y 촬영일시 1-9 creature_info.format string Y 포맷 1-10 creature_info.imagesize number Y 정지영상 파일 크기(MB) 1-11 creature_info.width number Y 정지영상 가로길이 1-12 creature_info.height number Y 정지영상 세로길이 1-13 creature_info.growth_stage number Y 성장단계 3 (고정) 3 : 먹이생물 1-14 creature_info.device string Y 촬영 기기 정보 1-15 creature_info.microscope_magnification number Y 현미경 배율 1-16 creature_info.tank_id string Y 수조 고유번호 1-17 creature_info.tank_capacity number Y 수조 용량(L) 1-18 creature_info.tank_density number Y 수조 밀도(미) 1-19 creature_info.creature_period number Y 배양기간 1-20 creature_info.label_quantity number Y 라벨 개수 3~ 2 image string Y 원천 데이터 경로 3 bbox2d array Y 라벨링 데이터 3-1 bbox2d[].id number Y 개체 ID 3-2 bbox2d[].name string Y 클래스 이름 creature_daphnia: 다프니아,
creature_moina: 모이나3-3 bbox2d[].bbox[] array Y 개체 bbox 좌표 4 segmentation array Y 라벨링 데이터 - 미꾸리 라벨링데이터 실제 예시
- 먹이생물 라벨링데이터 실제 예시
-
데이터셋 구축 담당자
수행기관(주관) : ㈜지엔아이씨티
수행기관(주관) 책임자명 전화번호 대표이메일 담당업무 김종남 062-974-9012 jnkim@gnict.co.kr 총괄책임자 수행기관(참여)
수행기관(참여) 기관명 담당업무 ㈜다윈테크 데이터 가공 (미꾸리) 대경제이엠㈜ 데이터 가공 (미꾸리) 부경대학교 산학협력단 데이터 수집 및 정제 / 데이터 가공 (먹이생물) ㈜솔포투 데이터 수집 및 정제 (미꾸리) ㈜한국생물보전연구소 데이터 수집 및 정제 (미꾸리) 데이터 관련 문의처
데이터 관련 문의처 담당자명 전화번호 이메일 김종남 062-974-9012 jnkim@gnict.co.kr 최충기 062-974-9012 cgchoi@gnict.co.kr AI모델 관련 문의처
AI모델 관련 문의처 담당자명 전화번호 이메일 김종남 062-974-9012 jnkim@gnict.co.kr 유슬기 062-974-9012 seulki@gnict.co.kr 저작도구 관련 문의처
저작도구 관련 문의처 담당자명 전화번호 이메일 김종남 062-974-9012 jnkim@gnict.co.kr 송소라 062-974-9012 sora@gnict.co.kr
-
인터넷과 물리적으로 분리된 온라인·오프라인 공간으로 의료 데이터를 포함하여 보안 조치가 요구되는 데이터를 다운로드 없이 접근하고 분석 가능
* 온라인 안심존 : 보안이 보장된 온라인 네트워크를 통해 집, 연구실, 사무실 등 어디서나 접속하여 데이터에 접근하고 분석
* 오프라인 안심존 : 추가적인 보안이 필요한 데이터를 대상으로 지정된 물리적 공간에서만 접속하여 데이터에 접근하고 분석 -
- AI 허브 접속
신청자 - 안심존
사용신청신청자신청서류 제출* - 심사구축기관
- 승인구축기관
- 데이터 분석 활용신청자
- 분석모델반출신청자
- AI 허브 접속
-
1. 기관생명윤리위원회(IRB) 심의 결과 통지서 [IRB 알아보기] [공용IRB 심의신청 가이드라인]
2. 기관생명윤리위원회(IRB) 승인된 연구계획서
3. 신청자 소속 증빙 서류 (재직증명서, 재학증명서, 근로계약서 등 택1)
4. 안심존 이용 신청서 [다운로드]
5. 보안서약서 [다운로드]
※ 상기 신청서 및 첨부 서류를 완비한 후 신청을 진행하셔야 정상적으로 절차가 이루어집니다. -
신청 및 이용관련 문의는 safezone1@aihub.kr 또는 02-525-7708, 7709로 문의
데이터셋 다운로드 승인이 완료 된 후 API 다운로드 서비스를 이용하실 수 있습니다.
API 다운로드 파일은 분할 압축되어 다운로드 됩니다. 분할 압축 해제를 위해서는 분할 압축 파일들의 병합이 필요하며 리눅스 명령어 사용이 필요합니다.
리눅스 OS 계열에서 다운로드 받으시길 권장하며 윈도우에서 파일 다운로드 시 wsl(리눅스용 윈도우 하위 시스템) 설치가 필요합니다.
※ 파일 병합 리눅스 명령어
find "폴더경로" -name "파일명.zip.part*" -print0 | sort -zt'.' -k2V | xargs -0 cat > "파일명.zip"
- 해당 명령어 실행 시, 실행 경로 위치에 병합 압축 파일이 생성됩니다.
- 병합된 파일 용량이 0일 경우, 제대로 병합이 되지 않은 상태이니 "폴더경로"가 제대로 입력되었는지 확인 부탁드립니다.
※ 데이터셋 소개 페이지에서 다운로드 버튼 클릭하여 승인이 필요합니다.
오프라인 데이터 이용 안내
본 데이터는 K-ICT 빅데이터센터에서도 이용하실 수 있습니다.
다양한 데이터(미개방 데이터 포함)를 분석할 수 있는 오프라인 분석공간을 제공하고 있습니다.
데이터 안심구역 이용절차 및 신청은 K-ICT빅데이터센터 홈페이지를 참고하시기 바랍니다.