-
데이터 변경이력
데이터 변경이력 버전 일자 변경내용 비고 1.1 2023-12-13 데이터 최종 개방 1.0 2023-05-04 데이터 개방 (Beta Version) 데이터 히스토리
데이터 히스토리 일자 변경내용 비고 2024-01-05 Sample 파일 공개 2023-12-20 산출물 전체 공개 소개
종자배양장(넙치,돌돔)의 먹이생물(알테미아,로티퍼)과 어류종자(넙치,돌돔)의 유생,치어 이미지 데이터를 현미경,DSLR 카메라를 활용하여 수집하고, 가공 검수 단계를 거쳐 데이터 구축함
구축목적
디지털 종자 양식 생산을 위한 종자배양장 인공지능 학습용 데이터 구축과 학습모델 개발을 통해 현재 종자생산장의 전문인력 부족, 노령화, 생산성 감소 등의 문제를 개선하고 디지털 종자 양식을 실현하고자 함
-
메타데이터 구조표 데이터 영역 농축수산 데이터 유형 이미지 데이터 형식 jpg 데이터 출처 종자배양장 라벨링 유형 바운딩박스(이미지), 폴리곤(이미지) 라벨링 형식 JSON 데이터 활용 서비스 종자 길이 측정 서비스 데이터 구축년도/
데이터 구축량2022년/이미지 데이터: 152,461장 (넙치종자 58,533장, 돌돔종자 45,606장, 먹이생물 48,322장) -
1) 데이터 통계
(1) 데이터 구축 규모
- 군집이미지 데이터 총 152,461장(객체별 623,215건), 센서데이터 835,105건, 관리데이터 5,560건(1) 데이터 구축 규모 구분 데이터 형태 데이터 규모 합계 넙치종자 군집이미지 유생 변태1단계 6,889장 24,478장 (유생,치어) 변태2단계 11,797장 변태3단계 57,92장 치어 23,844장 23,844장 돌돔종자 군집이미지 유생 20,930장 20,930장 (유생,치어) 치어 24,676장 24,676장 먹이생물 군집이미지 로티퍼 26,746장 26,746장 알테미아 31,787장 31,787장 수질환경 센서 데이터 텍스트 센서데이터 835,105건 835,105건 사육관리 데이터 텍스트 관리데이터 5,560건 5,560건
(2) 데이터 구축 분포
- 대상별 분포: 먹이생물(로티퍼, 알테미아), 넙치종자(유생,치어), 돌돔종자(유생,치어) 이미지 장수(2) 데이터 구축 분포- 대상별 분포 구분 수량(장) 합계 비율 넙치종자 유생 24,478 장 16.06% (유생,치어) 치어 23,844 장 15.64% 돌돔종자 유생 20,930 장 13.73% (유생,치어) 치어 24,676 장 16.19% 먹이생물 로티퍼 26,746 장 17.54% 알테미아 31,787 장 20.84% 합계 152,461 장 100% - 촬영 장비별 분포: 디지털카메라, 현미경 촬영 이미지 장수
(2) 데이터 구축 분포- 촬영 장비별 분포 구분 수량(장) 비율 디지털 카메라 66,194 장 43.42% 현미경 86,267 장 56.58% 합계 152,461 장 100% -
-
AI 모델 상세 설명서 다운로드
AI 모델 상세 설명서 다운로드 AI 모델 다운로드1. 활용 모델
1) 모델학습
지능형 스마트종자배양장(넙치,돌돔) 데이터 셋은 크게 객체 인식 모델(로티퍼, 알테미아, 돌돔유생)과 길이측정 모델(돌돔치어, 넙치치어) 학습에 활용할 수 있다. 객체인식모델의 경우 YOLOv5기반으로 개체를 인식 후 개체의 수를 계산하여 Object Detection 모델을 학습시킬 수 있다. 길이측정모델은 Mask R-CNN을 이용하여 개별 세그먼테이션 결과 마스크 가로축의 길이를 계산하여 Instance segmentation 모델 학습에 활용될 수 있다. 최소 검증과 시험을 모두 1만장 이상으로 통일하여 준비하는 것을 제안한다.
2) 서비스 활용 시나리오
구축한 모델은 실제 종자생산장 어가에서 발생하는 여러 문제들을 해결하는데 활용할 수 있음
- 먹이생물을 배양하는 종자배양장에서 알테미아 개체수와 로티퍼 수, 로피퍼 포란율을 파악하여 어류 종자에 정확한 양의 먹이를 공급하여 정밀한 사육관리에 기여할 수 있음
- 어류의 길이를 정확히 측정하여 출하, 판매 시기를 예측하는데 활용할 수 있음 -
데이터 성능 점수
측정값 (%)기준값 (%)데이터 성능 지표
데이터 성능 지표 번호 측정항목 AI TASK 학습모델 지표명 기준값 점수 측정값 점수 1 넙치 유생 변태 단계별 객체 인식 Object Detection YOLO v5 Accuracy 80 % 99.77 % 2 객체 인식(바운딩박스) Object Detection YOLO v5 mAP@IoU 0.5 50 % 99.1 % 3 객체 인식(폴리곤) Object Detection YOLO v5 mAP@IoU 0.5 50 % 99.89 %
※ 데이터 성능 지표가 여러 개일 경우 각 항목을 클릭하면 해당 지표의 값이 그래프에 표기됩니다.
※ AI모델 평가 지표에 따라 측정값의 범위, 판단 기준이 달라질 수 있습니다. (ex. 오류율의 경우, 낮을수록 좋은 성능을 내는 것으로 평가됩니다)
-
설명서 및 활용가이드 다운로드
데이터 설명서 다운로드 구축활용가이드 다운로드데이터 포맷
이미지 데이터 포맷 예시
이미지 데이터 포맷 예시 파일명 SA21_T07_LV_004350.jpg 파일명 세부 구성 정보 프로젝트 명 SA: 스마트종자 종자명 01 : 로티퍼 02 : 알테미아 11 : 넙치유생 12 : 넙치치어 21 : 돌돔유생 22 : 돌돔치어 수조번호 예시) T07 종자구분 FD: 먹이생물 LV:종자유생 FR:종자치어 일련번호 6자리 확장자 jpg:원천데이터, 이미지 포맷 이미지 정보 파일 형식 JPG 너비 1536 픽셀 높이 1024 픽셀 이미지 예시 [돌돔 유생]
JSON 형식
{
"Info": {
"id": "SA21_T07_LV_004350",
"filename": "SA21_T07_LV_004350.jpg",
"file_folder": "01.데이터/4.Sample/원천데이터/12.돌돔유생,01.데이터/4.Sample/라벨링데이터/12.돌돔유생",
"resolution": "[1536, 1024]",
"region_name": "T07",
"date": "2022:06:02 00:00:00",
"file format": "JPEG",
"copyright": "MYUNGSUN",
"pixel": "1572864",
"camera device": "digital microscope"
},
"Annotations": [
{
"annotation_id": 1,
"annotation_type": "rect",
"class_code": "beakperch_larva",
"class_name": "돌돔유생",
"rect.points": "[811,89,603,182]",
"polygon.points": null,
"morphic_step": null,
"spawn": null,
"memo": null
},
{
"annotation_id": 2,
"annotation_type": "rect",
"class_code": "beakperch_larva",
"class_name": "돌돔유생",
"rect.points": "[899,279,327,469]",
"polygon.points": null,
"morphic_step": null,
"spawn": null,
"memo": null
},
{
"annotation_id": 3,
"annotation_type": "rect",
"class_code": "beakperch_larva",
"class_name": "돌돔유생",
"rect.points": "[131,638,593,176]",
"polygon.points": null,
"morphic_step": null,
"spawn": null,
"memo": null
},
{
"annotation_id": 4,
"annotation_type": "rect",
"class_code": "beakperch_larva",
"class_name": "돌돔유생",
"rect.points": "[140,781,546,103]",
"polygon.points": null,
"morphic_step": null,
"spawn": null,
"memo": null
}
],
"Environment": {
"Sensor.id": "SA20_T07_SN_202206.CSV,SA20_T07_FD_202206.CSV,SA20_T07_WT_202206.CSV",
"Sensor.date": "2022-06-03 12:03",
"Sensor.do": 11.7,
"Sensor.ph": 7.94,
"Sensor.temp": 26.1,
"Sensor.illumi": 894.7,
"Sensor.etc": null,
"bacteria_count": 111582.0,
"vibrio_count": 0.0,
"feed_count": "F0,R5,A0",
"seawater_mixed": "Y",
"sensor_salinity": 32.7,
"seawater_treatment": "UV"
}
}데이터 구성
데이터 구성 Key Description Type Child Type info 기본정보 JsonObject id 파일아이디 String filename 파일명 String file_folder 저장폴더 String resolution 해상도 String region_name 종자 배양장 코드 String date 시간정보 yyyy:MM:dd hh:mm:ss String file format 파일포맷 String copyright 저작권정보 String pixel 화소 String camera device 촬영장비 종류 String Annotations 라벨링 정보 JsonAray JsonObject [ JsonObject annotation_id 어노테이션 아이디 String annotation_type 어노테이션 유형(ex:rect) String class_code 객체 클래스 코드(ex:rotifer) String class_name 객체 클래스명(ex:로티퍼) String rect.points 바운딩박스 좌표 String polygon.points 폴리곤 좌표 String morphic_step 변태 단계 String spawn 포란여부 String memo 메모 String ] Environment 수질센서&관리정보 JsonObject Sensor.id 파일명(센서,먹이,수질) String Sensor.date 시간정보 yyyy-MM-dd hh:mm String Sensor.do DO String Sensor.ph PH String Sensor.temp 수온 String Sensor.illumi 조도 String Sensor.etc 기타수질 String bacteria_count 총세균수 String vibrio_count 비브리오 String feed_count 사료공급(사료,로티퍼,알테미아) String seawater_mixed 해수입수(ex:Y/N) String sensor_salinity 염도 String seawater_treatment 수처리(ex:UV) String 어노테이션 포멧
어노테이션 포멧 No 항목 길이 타입 필수여부 비고 한글명 영문명 1 기본 정보 Info JsonObject Y { JsonObject 1-1 파일아이디 id String Y 1-2 파일명 filename String Y 1-3 저장폴더 file_folder String Y 1-4 해상도 resolution String Y 1-5 위치정보 region_name String Y 1-6 시간정보 date String Y yyyy:MM:dd hh:mm:ss 1-7 파일포맷 file format String Y 1-8 저작권정보 copyright String Y 예) MYUNGSUN 1-9 화소 pixel String Y 1-10 촬영장비 종류 camera device String Y 예) digital microscope } 2 라벨링정보 Annotations Array Y [ Array { JsonObject 2-1 어노테이션 아이디 annotation_id number Y 2-2 어노테이션 타입 annotation_type String Y 예) rect 2-3 객체 클래스 코드 class_code String Y 예) rotifer 2-4 객체 클래스명 class_name String Y 예) 로티퍼 2-5 바운딩박스 rect.points array Y [x,y,width,height] 2-6 폴리곤 polygon.points array Y [x1,x2,...][y1,y2,...] 2-7 변태 단계 morphic_step String N 2-8 포란여부 spawn boolean N 2-9 메모 memo String N } ] 3 수질센서 & 관리 정보 Environment JsonObject Y { JsonObject 3-1 파일명 Sensor.id String N 예)SA10_T01_SN_202208.CSV, SA10_T01_FD_202208.CSV, SA10_T01_WT_202208.CSV, EV(센서데이터),FD(먹이데이터),WT(수질데이터) 3-2 시간정보 Sensor.date String N yyyy-MM-dd hh:mm 3-3 DO Sensor.do String N 3-4 PH Sensor.ph Float N 3-5 수온 Sensor.temp Float N 3-6 조도 Sensor.illumi Float N 3-7 기타수질 Sensor.etc Float N 3-8 총세균수 bacteria_count Float N 3-9 비브리오 vibrio_count Float N 3-10 사료공급 feed_count String N 예) F70,R0,A0
사료(단위:g),로티퍼(단위:억),알테미아(단위:만)3-11 해수입수 seawater_mixed String N 예) Y 3-12 염도 sensor_salinity Float N 3-13 수처리 seawater_treatment String N 예) UV } 실제 예시
{
"Info": {
"id": "SA21_T05_LV_000768",
"filename": "SA21_T05_LV_000768.jpg",
"file_folder": "01.데이터/4.Sample/원천데이터/12.돌돔유생,01.데이터/4.Sample/라벨링데이터/12.돌돔유생",
"resolution": "[1536, 1024]",
"region_name": "T05",
"date": "2022:06:03 00:00:00",
"file format": "JPEG",
"copyright": "MYUNGSUN",
"pixel": "1572864",
"camera device": "digital microscope"
},
"Annotations": [
{
"annotation_id": 1,
"annotation_type": "rect",
"class_code": "beakperch_larva",
"class_name": "돌돔유생",
"rect.points": "[373,107,88,166]",
"polygon.points": null,
"morphic_step": null,
"spawn": null,
"memo": null
},
{
"annotation_id": 2,
"annotation_type": "rect",
"class_code": "beakperch_larva",
"class_name": "돌돔유생",
"rect.points": "[371,330,253,299]",
"polygon.points": null,
"morphic_step": null,
"spawn": null,
"memo": null
},
{
"annotation_id": 3,
"annotation_type": "rect",
"class_code": "beakperch_larva",
"class_name": "돌돔유생",
"rect.points": "[118,597,162,90]",
"polygon.points": null,
"morphic_step": null,
"spawn": null,
"memo": null
},
{
"annotation_id": 4,
"annotation_type": "rect",
"class_code": "beakperch_larva",
"class_name": "돌돔유생",
"rect.points": "[1436,301,99,286]",
"polygon.points": null,
"morphic_step": null,
"spawn": null,
"memo": null
}
],
"Environment": {
"Sensor.id": "SA20_T05_SN_202206.CSV,SA20_T05_FD_202206.CSV,SA20_T05_WT_202206.CSV",
"Sensor.date": "2022-06-20 19:00",
"Sensor.do": 10.0,
"Sensor.ph": 7.69,
"Sensor.temp": 25.5,
"Sensor.illumi": 558.1,
"Sensor.etc": null,
"bacteria_count": 2992.0,
"vibrio_count": 0.0,
"feed_count": "F0,R1.5,A0",
"seawater_mixed": "Y",
"sensor_salinity": 32.8,
"seawater_treatment": "UV"
}
} -
데이터셋 구축 담당자
수행기관(주관) : 명선해양산업
수행기관(주관) 책임자명 전화번호 대표이메일 담당업무 허준성 02-774-7741 jshur@myungsun.co.kr 사업총괄, 데이터 수집, 데이터 정제, 홍보 수행기관(참여)
수행기관(참여) 기관명 담당업무 한국수산종자산업협회 데이터 구축 설계 한국수산자원공단 데이터 활용 계획 수립 플렉싱크 데이터 수집(제주), 데이터 가공 지디에스컨설팅그룹 데이터 가공 와이비에스에듀사회적협동조합 데이터 가공 아이싸이랩 AI모델 개발 데이터웨이 데이터 검수, 품질관리 데이터 관련 문의처
데이터 관련 문의처 담당자명 전화번호 이메일 허준성 02-774-7741 jshur@myungsun.co.kr
-
인터넷과 물리적으로 분리된 온라인·오프라인 공간으로 의료 데이터를 포함하여 보안 조치가 요구되는 데이터를 다운로드 없이 접근하고 분석 가능
* 온라인 안심존 : 보안이 보장된 온라인 네트워크를 통해 집, 연구실, 사무실 등 어디서나 접속하여 데이터에 접근하고 분석
* 오프라인 안심존 : 추가적인 보안이 필요한 데이터를 대상으로 지정된 물리적 공간에서만 접속하여 데이터에 접근하고 분석 -
- AI 허브 접속
신청자 - 안심존
사용신청신청자신청서류 제출* - 심사구축기관
- 승인구축기관
- 데이터 분석 활용신청자
- 분석모델반출신청자
- AI 허브 접속
-
1. 기관생명윤리위원회(IRB) 심의 결과 통지서 [IRB 알아보기] [공용IRB 심의신청 가이드라인]
2. 기관생명윤리위원회(IRB) 승인된 연구계획서
3. 신청자 소속 증빙 서류 (재직증명서, 재학증명서, 근로계약서 등 택1)
4. 안심존 이용 신청서 [다운로드]
5. 보안서약서 [다운로드]
※ 상기 신청서 및 첨부 서류를 완비한 후 신청을 진행하셔야 정상적으로 절차가 이루어집니다. -
신청 및 이용관련 문의는 safezone1@aihub.kr 또는 02-525-7708, 7709로 문의
데이터셋 다운로드 승인이 완료 된 후 API 다운로드 서비스를 이용하실 수 있습니다.
API 다운로드 파일은 분할 압축되어 다운로드 됩니다. 분할 압축 해제를 위해서는 분할 압축 파일들의 병합이 필요하며 리눅스 명령어 사용이 필요합니다.
리눅스 OS 계열에서 다운로드 받으시길 권장하며 윈도우에서 파일 다운로드 시 wsl(리눅스용 윈도우 하위 시스템) 설치가 필요합니다.
※ 파일 병합 리눅스 명령어
find "폴더경로" -name "파일명.zip.part*" -print0 | sort -zt'.' -k2V | xargs -0 cat > "파일명.zip"
- 해당 명령어 실행 시, 실행 경로 위치에 병합 압축 파일이 생성됩니다.
- 병합된 파일 용량이 0일 경우, 제대로 병합이 되지 않은 상태이니 "폴더경로"가 제대로 입력되었는지 확인 부탁드립니다.
※ 데이터셋 소개 페이지에서 다운로드 버튼 클릭하여 승인이 필요합니다.
오프라인 데이터 이용 안내
본 데이터는 K-ICT 빅데이터센터에서도 이용하실 수 있습니다.
다양한 데이터(미개방 데이터 포함)를 분석할 수 있는 오프라인 분석공간을 제공하고 있습니다.
데이터 안심구역 이용절차 및 신청은 K-ICT빅데이터센터 홈페이지를 참고하시기 바랍니다.