-
데이터 변경이력
데이터 변경이력 버전 일자 변경내용 비고 1.1 2024-10-30 데이터 최종 개방 1.0 2024-06-28 데이터 개방 Beta Version 데이터 히스토리
데이터 히스토리 일자 변경내용 비고 2024-06-28 산출물 공개 Beta Version 소개
- 지리정보시스템(GIS)를 이용하여 관리 필요성이 높은 ‘비점오염원관리지역’을 대상으로 농업, 축산지역의 관리를 위한 기초자료 확보 필요 - 비점오염원으로부터 수계영향지역에 대한 공간정보 현황조사, 고랭지밭 면적, 경사도, 작물 및 임대현황 등 토이지용현황조사, 드론을 이용한 사진을 촬영하여 데이터 시계열 분석 필요
구축목적
- 농업계 6.6만장, 축산계 이미지 4.4만장, 비점환경속성 데이터 2천 세트 포함 수집/가공 - 객체 탐지 등 최신 알고리즘 Yolo8와 함께 최근 해외 비점오염원 객체 탐지 논문 등에서 성능을 인정 받는 R-CNN, FCN을 종합 평가하여 최신의 성능과 추론 속도가 보장되는 모델 적용 및 실증
-
메타데이터 구조표 데이터 영역 재난안전환경 데이터 유형 이미지 데이터 형식 Tiff, json 데이터 출처 4대강유역(한강, 낙동간, 금강, 영산강) 및 새만금 일대, 비점오염원 관심지역 라벨링 유형 polygon 라벨링 형식 json 데이터 활용 서비스 비점오염원에 대한 통합 모니터링 서비스를 위해서는 다양한 API를 적용하는 것보다 하나의 API를 적용하는 것이 유리하므로 정확도 90% 이상의 CNN 계열의 딥러닝 학습을 통해 효과를 제공할 수 있으며, 본 사업에는 민간의 사용성을 고려하여 통합 모델을 적용함 데이터 구축년도/
데이터 구축량2023년/원천데이터 100,000장, 라벨링 데이터 100,000장 -
- 데이터 구축규모
5개 유역(한강, 낙동강, 금강, 영산강, 새만금)별 비점오염원 이미지 10만장 이상 하천 수면 및 주변 농축산계 비점오염원 항목별 라벨링 된 이미지 데이터 12만건 이상- 데이터 분포
전국 4대강 및 새만금 지역을 대상으로 농축산계 비점오염원 유형별로 드론 이미지를 해상도에 따라 구분하여 10만장 이상 수집
- 대상지역 : 4대강 유역(한강, 낙동강, 금강, 영산강), 새만금 일대
- 비점오염원 유형 : 농업계(야적퇴비, 비닐하우스 등), 축산계(축사, 잔재물 등), 하천 수면 및 수변, 환경데이터, 기타 등 11종 이상
- 공간해상도 : 2.5~3.0cm- 데이터 구성
데이터 구성 항목 조건 구분 이미지 수
(단위:건)비율 지역 한강 15,000 15% 낙동강 20,000 20% 금강 20,000 20% 영산강 25,000 20% 새만금 25,000 25% 합계 100,000 100%
- 원천데이터원천데이터 파일포맷 데이터 규모 해상도 원시데이터(영상)내
이미지 추출 수이미지 기준 동작 기준 Tiff 107,045장 - 512 X 512 (pixel) 107,045장
- 라벨링데이터라벨링데이터 파일포맷 데이터 규모 라벨링 유형 라벨링 대상 이미지 기준 동작 기준 JSON 107,045개 - 비점오염원 객체,
메타데이터이미지 내 비점오염원
라벨링 객체 -
-
AI 모델 상세 설명서 다운로드
AI 모델 상세 설명서 다운로드 AI 모델 다운로드- 모델 아키텍처
U-Net : U-Net은 저차원 뿐만 아니라 고차원 정보도 이용하여 이미지의 특징을 추출함과 동시에 정확한 위치 파악도 가능하게 함. 이를 위해서 인코딩 단계의 각 레이어에서 얻은 특징을 디코딩 단계의 각 레이어에 합치는(concatenation) 방법을 사용하고, 인코더 레이어와 디코더 레이어 간의 연결을 스킵 연결(skip connection)이라고 함.- 핵심기능
실시간 또는 분석이 필요한 이미지 속 학습된 클래스들을 식별하고 영역을 구분하여, 시각화된 결과를 보여줌- 활용방식
이미지 또는 영상 속 식별이 필요한 객체를 식별하여 Segmentation(분할) 작업을 수행함으로써 데이터셋 제작에서부터 관제, 관리, 예방 등 사업 분야에 적합한 목적에 따라 다양한 활용이 가능.- 서비스 활용분야
· 하천의 오염을 발생시키는 농축산계 비점오염원 탐지 및 모니터링
① 농축산계 비점오염원을 객체별로 구분하여 식별함(Segmentation)
② 식별한 오염원을 관제 및 관리
· 측량용 드론 촬영 이미지 속에 필요한 객체 정보들을 식별 및 후가공 작업 지원
① 측량 이미지에 식별이 필요한 객체 세그멘테이션
② 캐드와 같은 이미지 후가공 작업 지원 -
설명서 및 활용가이드 다운로드
데이터 설명서 다운로드 구축활용가이드 다운로드- 데이터구성
데이터구성 Key Description Type Child Type ID 파일 고유키 Number FILE_NAME 파일명(L01_005_2023051010_00001) String SEQUENCE 이미지 순번 Number HEIGHT 이미지 높이(512) Number WIDTH 이미지 너비(512) Number FILE_SIZE 파일크기 String WEATHER 기상정보(ex. 맑음,흐림) String LOCATION 촬영구역(ex. 한강, 낙동강, 금강, 영산강, 새만금) String DT_CD 데이터명 String REFSYS_NM 기준계명(ex. GRS80) String EST_LONGITUDE 동경(ex. 126.0001) String NOR_LATITUDE 북위(ex. 34.0012) String FLG_ALTITUDE 촬영고도(ex. 100) String FLG_DE 촬영일시(yyyy.mm.dd hh:mm) String FLH_MAN 촬영자 String FLG_MODEL 촬영기기(ex. DJI) String RESOLUTION 촬영화질 String INST_CD 인스턴스(ex. 01) String CTPRVN_NM 지역코드(ex. 52) String LABELCOUNT 라벨링 Object 개수 Number DRAWING 라벨링구분(ex. Polygon) String Annotation 문단 JsonAray JsonAray [ 문단 JsonObject JsonObject { 문단 JsonObject JsonObject SEGMENTATION 라벨 좌표 Array CATEGORY_1 대분류(ex. 농업계) String CATEGORY_2 중분류(ex. 축사) String CATEGORY_3 소분류(ex. 돼지축사) String } ]
- 어노테이션 포맷어노테이션 포맷 No. 항목명 타입 필수 구분 항목 설명 예시 1 ID Number Y 파일 고유키 filepk 2 FILE_NAME String Y 파일명 01_005_2023051010_00001 3 SEQUENCE Number Y 이미지 순번 1 4 HEIGHT Number Y 이미지 높이 1920 5 WIDTH Number Y 이미지 너비 1080 6 FILE_SIZE String Y 파일크기 1265476 7 WEATHER String Y 기상정보 맑음, 우천, 강설 8 LOCATION String Y 촬영구역 한강, 낙동강, 금강, 영산강, 새만금 9 DT_CD String Y 데이터명 비점오염원 10 REFSYS_NM String Y 기준계명 GRS80, WGS84 11 EST_LONGITUDE String Y 동경 126.00001 12 NOR_LATITUDE String Y 북위 34.0012 13 FLG_ALTITUDE String Y 촬영고도 100 14 FLG_DE String Y 촬영일시 2023.10.01. 13:36 15 FLH_MAN String Y 촬영자 홍길동 16 FLG_MODEL String Y 촬영기기 DJI 17 RESOLUTION String Y 촬영화질 512 18 INST_CD String Y 인스턴스 0 19 CTPRVN_NM String Y 지역코드 1 20 LABELCOUNT Number Y 라벨링 Object 개수 복수 라벨링 지정 시 라벨링 갯수 21 DRAWING String Y 라벨링구분 Polygon 22 SEGMENTATION Array N 라벨 좌표 포인트X,Y좌표배열
(라벨링구분및형태에따라좌표갯수상이)
[X1,Y1,X2,Y2,X3,Y3...]23 CATEGORY_1 String Y 대분류 농업계, 축산계, 하천수면 및 수변 24 CATEGORY_2 String Y 중분류 비닐하우스, 축사 등 25 CATEGORY_3 String Y 소분류 우축사, 돈축사, 계축사
- 데이터 포맷데이터 포맷 구분 상세내용 포맷 비점오염원 이미지 데이터 RGB를 포함한 영상정보 이미지 데이터 *.TIFF
- 실제 예시 -
데이터셋 구축 담당자
수행기관(주관) : (재)한국건설생활환경시험연구원
수행기관(주관) 책임자명 전화번호 대표이메일 담당업무 김상래 010-2650-0953 ksrae@kcl.re.kr 총괄책임자 수행기관(참여)
수행기관(참여) 기관명 담당업무 한국자원경제연구소㈜ 데이터 검수 ㈜지오스토리 데이터 획득 ㈜소다시스템 데이터획득 ㈜씨이기술 데이터 가공 랩큐㈜ AI 모델링 데이터 관련 문의처
데이터 관련 문의처 담당자명 전화번호 이메일 김경록 031-360-9181 klkim@sodasys.com 전동권 031-360-9181 dkjeon@sodasys.com AI모델 관련 문의처
AI모델 관련 문의처 담당자명 전화번호 이메일 홍영식 02-6953-7093 richardyhong@labq.kr 박정우 02-6953-7093 riendship.park@labq.kr 저작도구 관련 문의처
저작도구 관련 문의처 담당자명 전화번호 이메일 김지호 02-6670-4600 jhk@cetech.kr 최희동 02-6670-4600 heedong7719@cetech.kr
-
인터넷과 물리적으로 분리된 온라인·오프라인 공간으로 의료 데이터를 포함하여 보안 조치가 요구되는 데이터를 다운로드 없이 접근하고 분석 가능
* 온라인 안심존 : 보안이 보장된 온라인 네트워크를 통해 집, 연구실, 사무실 등 어디서나 접속하여 데이터에 접근하고 분석
* 오프라인 안심존 : 추가적인 보안이 필요한 데이터를 대상으로 지정된 물리적 공간에서만 접속하여 데이터에 접근하고 분석 -
- AI 허브 접속
신청자 - 안심존
사용신청신청자신청서류 제출* - 심사구축기관
- 승인구축기관
- 데이터 분석 활용신청자
- 분석모델반출신청자
- AI 허브 접속
-
1. 기관생명윤리위원회(IRB) 심의 결과 통지서 [IRB 알아보기] [공용IRB 심의신청 가이드라인]
2. 기관생명윤리위원회(IRB) 승인된 연구계획서
3. 신청자 소속 증빙 서류 (재직증명서, 재학증명서, 근로계약서 등 택1)
4. 안심존 이용 신청서 [다운로드]
5. 보안서약서 [다운로드]
※ 상기 신청서 및 첨부 서류를 완비한 후 신청을 진행하셔야 정상적으로 절차가 이루어집니다. -
신청 및 이용관련 문의는 safezone1@aihub.kr 또는 02-525-7708, 7709로 문의
데이터셋 다운로드 승인이 완료 된 후 API 다운로드 서비스를 이용하실 수 있습니다.
API 다운로드 파일은 분할 압축되어 다운로드 됩니다. 분할 압축 해제를 위해서는 분할 압축 파일들의 병합이 필요하며 리눅스 명령어 사용이 필요합니다.
리눅스 OS 계열에서 다운로드 받으시길 권장하며 윈도우에서 파일 다운로드 시 wsl(리눅스용 윈도우 하위 시스템) 설치가 필요합니다.
※ 파일 병합 리눅스 명령어
find "폴더경로" -name "파일명.zip.part*" -print0 | sort -zt'.' -k2V | xargs -0 cat > "파일명.zip"
- 해당 명령어 실행 시, 실행 경로 위치에 병합 압축 파일이 생성됩니다.
- 병합된 파일 용량이 0일 경우, 제대로 병합이 되지 않은 상태이니 "폴더경로"가 제대로 입력되었는지 확인 부탁드립니다.
※ 데이터셋 소개 페이지에서 다운로드 버튼 클릭하여 승인이 필요합니다.