-
데이터 변경이력
데이터 변경이력 버전 일자 변경내용 비고 1.0 2021-06-18 데이터 최초 개방 데이터 히스토리
데이터 히스토리 일자 변경내용 비고 2022-10-14 신규 샘플데이터 개방 소개
수도권 지역 환경 변화 탐지 AI 기술 개발을 위한 토지 이용(건물, 주차장, 도로, 가로수, 논, 밭, 산림, 나지) 항공 및 위성 이미지 데이터
구축목적
항공사진과 위성영상으로부터 토지피복을 분석할 수 있는 AI학습데이터셋 구축
-
메타데이터 구조표 데이터 영역 재난안전환경 데이터 유형 이미지 데이터 형식 데이터 출처 라벨링 유형 라벨링 형식 데이터 활용 서비스 데이터 구축년도/
데이터 구축량2020년/5.3만 -
구축 내용 및 제공 데이터량
- 항공 사진 55,372장(Fine Annotation 20,200장, Coarse Annotation 35,172장)
- 위성 영상 300장(Fine Annotation 100장, Coarse Annotation 200장)
구축 내용 및 제공 데이터량표 구분 데이터 구축 내용 구축 수량(장) 데이터 설명 학습데이터 크기
(데이터 포맷)항공사진
(0.51m)Fine Annotation · 항공사진(51cm)기반의 피복지도 8종 512x512(Tiff, Json) 16,900 Fine Annotation · 항공사진512px크기 annotation 병합(추가) 1024x1024(Tiff, Json) 3,300 Coarse Annotation · 항공사진(51cm)기반의 피복지도 8종 512x512(Tiff, Json) 35,172 위성영상
(10m)Fine Annotation · Sentinel-2위성영상(10m) 기반의 피복지도 5종 512x512(Tiff, Json) 100 Coarse Annotation · Sentinel-2위성영상(10m) 기반의 피복지도 5종 512x512(Tiff, Json) 200 -
-
AI 모델 상세 설명서 다운로드
AI 모델 다운로드 -
데이터 성능 점수
측정값 (%)기준값 (%)데이터 성능 지표
데이터 성능 지표 번호 측정항목 AI TASK 학습모델 지표명 기준값 점수 측정값 점수 1 토지피복 데이터 Semantic Segmentation 정확도(항공이미지) Segmentation Deeplab v3 Accuracy(Pixel 단위) 85 % 91.14 % 2 토지피복 데이터 Semantic Segmentation 정확도(위성이미지) Segmentation Unet Accuracy(Pixel 단위) 85 % 96.06 %
※ 데이터 성능 지표가 여러 개일 경우 각 항목을 클릭하면 해당 지표의 값이 그래프에 표기됩니다.
※ AI모델 평가 지표에 따라 측정값의 범위, 판단 기준이 달라질 수 있습니다. (ex. 오류율의 경우, 낮을수록 좋은 성능을 내는 것으로 평가됩니다)
-
설명서 및 활용가이드 다운로드
데이터 설명서 다운로드 구축활용가이드 다운로드데이터 변경이력
토지 피복지도 항공위성 이미지-데이터 변경이력 버전 일자 변경내용 비고 1.0 2021.06.18 데이터 최초 개방 구축 목적
- 항공사진과 위성영상으로부터 토지피복을 분석할 수 있는 AI학습데이터셋 구축
활용 분야
- 국토환경의 변화, 토지피복 현황을 용이하게하여 토지피복지도 등 국가 주제도 현행화 기간 단축효과와 지도관련 기초데이터에 활용할 수 있는 기술 개발
소개
- 수도권의 항공사진과 위성영상으로부터 토지피복 상태를 파악할 수 있는 알고리즘 개발을 위한 AI데이터셋으로, 저작권과 보안처리된 데이터를 사용하여 배포와 재사용에 문제가 없는 데이터
구축 내용 및 제공 데이터량
- 항공 사진 55,372장(Fine Annotation 20,200장, Coarse Annotation 35,172장)
- 위성 영상 300장(Fine Annotation 100장, Coarse Annotation 200장)
구축 내용 및 제공 데이터량표 구분 데이터 구축 내용 구축 수량(장) 데이터 설명 학습데이터 크기
(데이터 포맷)항공사진
(0.51m)Fine Annotation · 항공사진(51cm)기반의 피복지도 8종 512x512(Tiff, Json) 16,900 Fine Annotation · 항공사진512px크기 annotation 병합(추가) 1024x1024(Tiff, Json) 3,300 Coarse Annotation · 항공사진(51cm)기반의 피복지도 8종 512x512(Tiff, Json) 35,172 위성영상
(10m)Fine Annotation · Sentinel-2위성영상(10m) 기반의 피복지도 5종 512x512(Tiff, Json) 100 Coarse Annotation · Sentinel-2위성영상(10m) 기반의 피복지도 5종 512x512(Tiff, Json) 200 대표도면
<항공사진 원천데이터>
<항공사진 라벨링데이터>
<위성사진 원천데이터>
<위성사진 라벨링데이터>
필요성
- 오픈소스 기반의 딥러닝 라이브러리인 텐서플로우 공개 후 하드웨어 인프라와 알고리즘이 급속히 발전함
- 인공지능의 정확도는 늘어나고 있으나,토지피복 분류 관련 학습데이터로 사용할 수 있는 데이터가 부족함
- 토지피복지도와 같은 국가에서 제작하고 있는 주제도는 항공사진을 육안으로 판독하고 구획하는 방식으로 주제도를 갱신하고 있음
- 본 사업을 통해 주제도 변화지역 탐지에 활용하여, 업무 효율성 향상을 기대할 수 있음
데이터 구조
- 데이터 구성
- 피복지도 데이터 구조피복지도 데이터 구조 표 컬럼명 데이터타입(길이) 컬럼명 설명 ANN_CD NUMERIC(3) 어노테이션 코드 ANN_NM VARCHAR2(20) 어노테이션 명칭
- 피복지도 데이터 어노테이션 코드피복지도 데이터 어노테이션 코드 표 컬럼명 코드값 컬럼명 설명 ANN_CD 10 건물 20 주차장 30 도로 40 가로수 50 논 60 밭 70 산림 80 나지 100 비대상지
- 피복지도 데이터 메타데이터 항목피복지도 데이터 메타데이터 항목 표 No 항목 타입 필수여부 예시 영문명 한글명 1 Image 원시 이미지 정보 1-1 image_id 원시 이미지 식별자 String Y LC_AP_00000000_001 1-2 img_width 원시 이미지 너비 Number Y 512 1-3 img_height 원시 이미지 높이 Number Y 512 1-4 img_type 원시 이미지 종류 String Y aerophoto 1-5 img_coordinate 원시 이미지 좌표계 String Y EPSG:5186 1-6 coordinates 원시 이미지 좌상단 좌표 String Y 000, 000 1-7 img_resolution 원시 이미지 해상도 Number Y 0.25 1-8 img_provied 원시 이미지 제공기관 String Y 국토지리정보원 1-9 img_time 원시 이미지 촬영시기 String Y 2019 1-10 img_winter 참조 이미지 겨울 유무 String Y 0, 1 2 annotations 어노테이션 정보 2-1 ann_id 어노테이션 식별자 String Y LC_AP_00000000_001_FGT 2-2 ann_type 어노테이션 타입 String Y polygon 2-3 ann_file_type 어노테이션 파일 유형 String Y tif 3 provided 제공기관 정보 3-1 provied_nm 제공기관명 String Y 한국지능정보사회진흥원
- 어노테이션 포맷
- 피복지도 AI 데이터 포맷은 gray 스케일의 Tiff 파일
-
데이터셋 구축 담당자
수행기관(주관) : 네이버시스템
수행기관(주관) 책임자명 전화번호 대표이메일 담당업무 한근혁 070-8821-1178 hyouk93@neighbor21.co.kr · 데이터 구축 총괄 수행기관(참여)
수행기관(참여) 기관명 담당업무 한국항공촬영 · 자체 촬영한 항공사진 제공 무림지엔아이 · AI 학습용 데이터 구축 이테라 · AI 학습용 데이터 구축 마인드포지 · AI 알고리즘 개발 ENDK · 품질관리 한국환경연구원 · 품질관리 서울시립대 산학협력단 · 품질관리 올포랜드 · 품질관리 데이터 관련 문의처
데이터 관련 문의처 담당자명 전화번호 이메일 한근혁(네이버시스템) 070-8821-1178 hyouk93@neighbor21.co.kr
-
인터넷과 물리적으로 분리된 온라인·오프라인 공간으로 의료 데이터를 포함하여 보안 조치가 요구되는 데이터를 다운로드 없이 접근하고 분석 가능
* 온라인 안심존 : 보안이 보장된 온라인 네트워크를 통해 집, 연구실, 사무실 등 어디서나 접속하여 데이터에 접근하고 분석
* 오프라인 안심존 : 추가적인 보안이 필요한 데이터를 대상으로 지정된 물리적 공간에서만 접속하여 데이터에 접근하고 분석 -
- AI 허브 접속
신청자 - 안심존
사용신청신청자신청서류 제출* - 심사구축기관
- 승인구축기관
- 데이터 분석 활용신청자
- 분석모델반출신청자
- AI 허브 접속
-
1. 기관생명윤리위원회(IRB) 심의 결과 통지서 [IRB 알아보기] [공용IRB 심의신청 가이드라인]
2. 기관생명윤리위원회(IRB) 승인된 연구계획서
3. 신청자 소속 증빙 서류 (재직증명서, 재학증명서, 근로계약서 등 택1)
4. 안심존 이용 신청서 [다운로드]
5. 보안서약서 [다운로드]
※ 상기 신청서 및 첨부 서류를 완비한 후 신청을 진행하셔야 정상적으로 절차가 이루어집니다. -
신청 및 이용관련 문의는 safezone1@aihub.kr 또는 02-525-7708, 7709로 문의
데이터셋 다운로드 승인이 완료 된 후 API 다운로드 서비스를 이용하실 수 있습니다.
API 다운로드 파일은 분할 압축되어 다운로드 됩니다. 분할 압축 해제를 위해서는 분할 압축 파일들의 병합이 필요하며 리눅스 명령어 사용이 필요합니다.
리눅스 OS 계열에서 다운로드 받으시길 권장하며 윈도우에서 파일 다운로드 시 wsl(리눅스용 윈도우 하위 시스템) 설치가 필요합니다.
※ 파일 병합 리눅스 명령어
find "폴더경로" -name "파일명.zip.part*" -print0 | sort -zt'.' -k2V | xargs -0 cat > "파일명.zip"
- 해당 명령어 실행 시, 실행 경로 위치에 병합 압축 파일이 생성됩니다.
- 병합된 파일 용량이 0일 경우, 제대로 병합이 되지 않은 상태이니 "폴더경로"가 제대로 입력되었는지 확인 부탁드립니다.
※ 데이터셋 소개 페이지에서 다운로드 버튼 클릭하여 승인이 필요합니다.
오프라인 데이터 이용 안내
본 데이터는 K-ICT 빅데이터센터에서도 이용하실 수 있습니다.
다양한 데이터(미개방 데이터 포함)를 분석할 수 있는 오프라인 분석공간을 제공하고 있습니다.
데이터 안심구역 이용절차 및 신청은 K-ICT빅데이터센터 홈페이지를 참고하시기 바랍니다.