-
데이터 변경이력
데이터 변경이력 버전 일자 변경내용 비고 1.1 2024-10-30 데이터 최종 개방 1.0 2024-06-28 데이터 개방 Beta Version 데이터 히스토리
데이터 히스토리 일자 변경내용 비고 2024-06-28 산출물 공개 Beta Version 소개
- 탄소흡수원 시계열 탐지를 통해 기후변화 대응을 위한 효율적 토지이용 계획수립의 기초자료로 활용하기 위한 데이터
구축목적
- 국내 권역별 산림 10cm 및 25cm 항공·드론 이미지 및 근적외선(NIR) 이미지 총 6만 장 이상의 학습데이터를 통한 AI 수종판별 및 탄소량 산출
-
메타데이터 구조표 데이터 영역 재난안전환경 데이터 유형 이미지 데이터 형식 TIF 데이터 출처 국토지리정보원, 한국항공촬영 라벨링 유형 세그멘테이션(이미지) 라벨링 형식 .tif, .json 데이터 활용 서비스 식생탄소포집량예측 서비스 데이터 구축년도/
데이터 구축량2023년/67,212장 Data set -
- 데이터 구축 규모
데이터 구축 규모 구분 클래스 분류 라벨링 탄소량 라벨링 항공이미지 NIR 이미지 항공이미지 NIR 이미지 10cm 10cm 25cm 10cm 10cm 25cm 겨울 겨울 경상도 13,400 3,400 13,700 13,500 13,400 3,400 13,700 13,500 전라도 6600 1700 6800 6600 6600 1700 6800 6600 제주도 451 110 501 450 451 110 501 450 소계 20,451 5,210 21,001 20,550 20,451 5,210 21,001 20,550 총계 67,212 67,212 - 데이터 분포
• 지역별 분포데이터 분포 - 지역별 분포 지역 개수 비율(%) 경상도 44,000 65.5 제주도 1,512 2.2 전라도 21,700 32.3 합계 67,212 100 ※ 임상도의 행정경계별 면적비율에 따른 비율로 데이터를 구축함
• 촬영수단별 분포
데이터 분포 - 촬영수단별 분포 해상도 개수합계 비율(%) NIR_10 20,550 30.6 AP_10 20,451 30.4 AP_10_WIN 5,210 7.8 AP_25 21,001 31.2 합계 67,212 100 • 클래스 분포(항공영상)
데이터 분포 - 클래스 분포(항공영상) ANN_NM 면적합계(㎡) 비율(%) 소나무 131,113,882 28.2 낙엽송 11,911,746 2.6 기타침엽수 20,265,142 4.4 기타활엽수 270,740,680 58.2 상록활엽수 6,326,013 1.4 판독불가 16,516,406 3.6 비산림 8,346,990 1.8 합계 465,220,859 100 -
-
AI 모델 상세 설명서 다운로드
AI 모델 상세 설명서 다운로드 AI 모델 다운로드- 활용 모델
○ 식생 탄소 포집량 산정 응용모델 개발
◦ 항공/NIR 이미지와 임분고 이미지를 이용하여 식생 탄소 포집량을 예측하는 인공지능 모델을 활용하여 탄소 포집량 산정하는 응용모델 개발
- 탄소 포집량 결과 레스터 파일로 제공< 탄소 포집량 결과 예시 >
○ 항공사진과 임분고 이미지를 통해 세종시 시범 적용
- 2023년도에 구축한 식생탄소 데이터 기반 인공지능 모델 학습을 수행하여, 세종시 지역의 인공지능 모델 테스트 -
설명서 및 활용가이드 다운로드
데이터 설명서 다운로드 구축활용가이드 다운로드- 호남권, 영남권, 제주권역을 대상으로 항공이미지, NIR(근적외선)이미지의 산림생태계(소나무, 낙엽송, 기타 침엽수, 기타활엽수, 상록활엽수)의 식생구분과 이에따른 탄소 포집량 터이터를 가공함
○ 수종식별 이미지 가공
1) 호남권, 영남권, 제주권역별 임상도를 참조 데이터로 사용하여 수종식별을 수행
2) 수종식별 시 클래스별 컬럼(ANN_CD, ANN_NM, COLOR, F_AREA)에 맞는 속성 기입
3) 수종식별 후 JSON파일을 TIF 파일로 변환○ 탄소량 이미지 가공
1) 임상도 경급데이터를 기반으로 TIF 포맷의 이미지 파일로 전환
2) nDSM과 GEDI 데이터를 통해 획득한 임분고 데이터의 TIF 원천데이터 준비
3) 수종식별 이미지(TIF)와 1),2)의 경급데이터, 임분고 데이터를 QGIS의 raster calculate 툴을 사용하여 이미지 계산을 진행
4) 원천데이터로 수집된 임분고(nDSM), 수종구획(TIF), 임상도에서 추출한 경급 이미지를 raster calculator 툴을 사용하여 이미지 계산을 진행
5) 생성된 탄소량값의 육안확인 및 구조 확인 진행- 클래스 정보
클래스 정보 No 구분 항목명 타입 필수여부 항목설명 예시 1 클래스 정보 ANN_CD number Y 어노테이션 코드 [0, 110,120,130,140,160,190] 2 ANN_NM string Y 어노테이션 명 ["판독불가","소나무","낙엽송","기타침엽수","기타활엽수","상록활엽수,"비산림"] 3 COLOR number Y 색 코드 [165145104, 191150119, 129094041, 198235097, 033102139, 254246164, 255255193] 4 F_AREA number Y 면적(㎡) 2.55805791 5 geometry.type string Y 어노테이션 타입 segmentation 6 geometry.coordinates array Y 어노테이션의 좌표 195639.968, 571754.67 - 메타데이터 정보
메타데이터 정보 No 구분 항목명 타입 필수여부 항목설명 예시 1 메타
데이터 정보img_id String Y 원천 이미지 식별자 AP_25_00000000_001 2 img_width Number Y 원천 이미지 너비 512 3 img_height Number Y 원천 이미지 높이 512 4 img_type String Y 원천 이미지 종류 aerophoto 5 img_coordinate String Y 원천 이미지 좌표계 EPSG:5186 6 coordinates String Y 원천 이미지 좌상단 좌표 000, 000 7 img_resolution Number Y 원천 이미지 해상도 0.25 8 img_provided String Y 원천 이미지 제공기관 국토지리정보원 9 img_time String Y 원천 이미지 촬영시기 2020 10 ann_id String Y 라벨링 식별자 GS_AP_25_GT_00000000_0000 11 ann_type String Y 라벨링 타입 segmentation 12 ann_file_type String Y 라벨링 파일 유형 tif 13 ann_attribute String Y 클래스 분류 속성 정보 [0, 110,120,130,140,160,190,"판독불가","소나무","낙엽송","기타침엽수","기타활엽수","상록활엽수“,"비산림"] 14 ann_chm String 임분고 이미지 정보 GEDI_2022 15 provided_nm String Y 제공기관명 한국지능정보사회진흥원 - 클래스 항목 정보
클래스 항목 정보 컬럼명 데이터타입(길이) 컬럼명 설명 ANN_CD NUMERIC(3) 어노테이션 코드 ANN_NM VARCHAR2(20) 어노테이션 명칭 COLOR NUMERIC(9) 색 코드 - 호남권, 영남권, 제주권역별 임상도를 참조 데이터로 사용하여 수종식별을 수행
- 수종식별 시 클래스별 컬럼(ANN_CD, ANN_NM, COLOR, F_AREA)에 맞는 속성 기입- 클래스 분류 상세 항목 정보
클래스 분류 상세 항목 정보 수종 세부수종 내용 속성값 소나무 소나무, 곰솔 소나무 110 낙엽송 낙엽송 잎갈나무, 일본잎갈 120 기타침엽수 소나무와 낙엽송을 제외한 모든 침엽수 편백, 삼나무, 전나무 등 130 기타활엽수 모든 활엽수 상수리나무, 신갈나무 등 140 상록활엽수 상록활엽수 가시나무, 후박나무 등 160 판독불가 혼효림 침활혼효림 0 그림자 - 죽림 모든 종료의 죽림 미립목지 일시적으로 임목이 제거된 산림으로 수종 구별이 어려운 지역 관목덤불 관목 및 덤불 지역 벌채지 나무가 벌채된 지역으로 수종 구분이 어려운 지역 초지 - 수종 및 지역 구분이 불가한 지역 - 비산림 제지 임도, 암석지, 묘지, 채석장 등 190 주거지 - 경작지 - 수체 호수, 저수지, 강 기타 - - 단계별 데이터 형태 및 포맷
단계별 데이터 형태 및 포맷 구분 획득(수집) 단계 정제 단계 가공(라벨링) 단계 데이터 구분 원시데이터 원천데이터 최종데이터 데이터 형태 항공이미지(25cm)
항공이미지(10cm)
NIR이미지중복율25%
512 x 512클래스분류라벨링클래스분류라벨링
/
탄소량 라벨링참조자료(임상도) 경급이미지 데이터 포멧 항공이미지/위성이미지 : Tiff
SpaceborenLiDAR : CSVtiff json+tiff - 샘플 데이터 예시
샘플 데이터 예시 항공
이미지
(25cm)원천데이터(*.tif) 원천데이터(경급) (*.tif) 라벨링데이터(GT) (*.tif) 메타데이터 & 라벨링데이터 (*.json) 원천데이터(임분고)(*.tif) 라벨링데이터(탄소량)(*.tif) 항공
이미지
(10cm)
(GS_AP_10_35711057_0064)원천데이터(*.tif) 원천데이터(경급) (*.tif) 라벨링데이터(GT) (*.tif) 메타데이터 & 라벨링데이터 (*.json) 원천데이터(임분고)(*.tif) 라벨링데이터(탄소량)(*.tif) 항공
이미지
겨울
(10cm)(GS_AP_10_WIN_35906036_0060)원천데이터(*.tif) 원천데이터(경급) (*.tif) 라벨링데이터(GT) (*.tif) 메타데이터 & 라벨링데이터 (*.json) 원천데이터(임분고)(*.tif) 라벨링데이터(탄소량)(*.tif) NIR
이미지
(10cm)(GS_NIR_10_35711057_0065)원천데이터(*.tif) 원천데이터(경급) (*.tif) 라벨링데이터(GT) (*.tif) 메타데이터 & 라벨링데이터 (*.json) 원천데이터(임분고)(*.tif) 라벨링데이터(탄소량)(*.tif) - 원천데이터(*.tif) : 수집된 5천도엽을 512*512픽셀 단위로 분할한 이미지 파일
- 원천데이터(경급) (*.tif) : 임상도에서 추출한 입목의 경급을 이미지화하여 분할한 참조 파일
- 라벨링데이터(GT) (*.tif) : 이미지 원천 데이터를 기반으로 작업자가 수종식별을 진행하여 폴리곤 단위로 구획한 벡터 파일을 학습용 데이터로 제작하기 위하여 이미지 파일로 변환한 파일
- 원천데이터(임분고)(*.tif) : 원시데이터의 DSM-DEM을 통해 획득한 임분고 데이터를 분할한 이미지 파일
- 라벨링데이터(탄소량)(*.tif) : 수종식별데이터(GT), 경급데이터(DM), 임분고데이터(SH)와 수종별 계수가 적용하여 제작한 탄소량 데이터(픽셀별 탄소량(g C/ha(그램탄소/헥타)) 이미지 파일
- 라벨링데이터(GT) (*.json) : 이미지 원천 데이터를 기반으로 작업자가 수종식별을 진행하여 폴리곤 단위로 구획한 벡터 데이터와 메타데이터를 포함한 JSON파일
- 파일 명명 규칙파일 명명 규칙 권역 구분 이미지종류_해상도 데이터종류 도엽번호(8) 일련번호(4) 경상 : GS
전라 : JL
제주 : JJAP_10 0.1m 항공이미지 (없음) : 이미지
SH : 임분고
CQ : 탄소량
GT : 클래스분류0 0001,0002,.. AP_10_WIN 0.1m 겨울항공이미지 AP_25 0.25m 항공이미지 NIR_10 0.1m NIR 이미지 - 적용 형식 및 예시
적용 형식 및 예시 파일종류 형식 예시 원천데이터 이미지 FileID.tif GS_AP_10_37604057_0006.tif
GS_AP_10_WIN_37604057_1661.tif
GS_AP_25_37604057_0001
GS_NIR_10_37604057_0006.tif원천데이터 임분고 FileID.tif GS_AP_10_SH_37604057_0006.tif
GS_AP_10_WIN_SH_37604057_1661.tif
GS_AP_25_SH_37604057_0001
GS_NIR_10_SH_37604057_0006.tif리벨링데이터 탄소량 FileID.tif ...
GS_AP_25_CQ_37604057_0001.tif
…리벨링데이터 클래스분류 FileID.json ...
GS_AP_25_GT_37604057_0001.json
…- 폴더 구조
폴더 구조 구분 depth 1 depth 2 이미지종류_해상도 데이터 종류 라벨링데이터
경상 : GS
전라 : JL
제주 : JJAP_10 IMAGE SH CQ JSON AP_10_WIN IMAGE SH CQ JSON AP_25 IMAGE SH CQ JSON NIR_10 IMAGE SH CQ JSON -
데이터셋 구축 담당자
수행기관(주관) : ㈜선도소프트
수행기관(주관) 책임자명 전화번호 대표이메일 담당업무 최인호 02-856-1900 ihchoi@sundosoft.co.kr 총괄책임 수행기관(참여)
수행기관(참여) 기관명 담당업무 네이버시스템㈜ 식생탄소 및 탄소흡수원 데이터 정제, 가공, 검수 ㈜마인드포지 AI 알고리즘 개발 ㈜올포랜드 품질관리 및 검수 ㈜우림엔알 식생탄소 데이터 수집, 정제, 가공 ㈜이쓰리 탄소흡수원 데이터 수집, 정제, 가공 ㈜이테라 탄소흡수원 데이터 수집, 정제, 가공 한국항공촬영㈜ 항공사진촬영 데이터 수집 및 정제 한국국토정보공사 홍보 및 전문가 협의체 운영 한국환경연구원 품질관리 및 검수, 학술대회 발표 데이터 관련 문의처
데이터 관련 문의처 담당자명 전화번호 이메일 최동철 031-8027-0345 ouoio@woorimnr.com 전진명 031-8027-0345 jmnara@woorimnr.com AI모델 관련 문의처
AI모델 관련 문의처 담당자명 전화번호 이메일 채규열 070-4082-2082 kychae@mindforge.kr 김석 070-4082-2082 stan.kim@mindforge.kr 저작도구 관련 문의처
저작도구 관련 문의처 담당자명 전화번호 이메일 최동철 031-8027-0345 ouoio@woorimnr.com 전진명 031-8027-0345 jmnara@woorimnr.com
-
인터넷과 물리적으로 분리된 온라인·오프라인 공간으로 의료 데이터를 포함하여 보안 조치가 요구되는 데이터를 다운로드 없이 접근하고 분석 가능
* 온라인 안심존 : 보안이 보장된 온라인 네트워크를 통해 집, 연구실, 사무실 등 어디서나 접속하여 데이터에 접근하고 분석
* 오프라인 안심존 : 추가적인 보안이 필요한 데이터를 대상으로 지정된 물리적 공간에서만 접속하여 데이터에 접근하고 분석 -
- AI 허브 접속
신청자 - 안심존
사용신청신청자신청서류 제출* - 심사구축기관
- 승인구축기관
- 데이터 분석 활용신청자
- 분석모델반출신청자
- AI 허브 접속
-
1. 기관생명윤리위원회(IRB) 심의 결과 통지서 [IRB 알아보기] [공용IRB 심의신청 가이드라인]
2. 기관생명윤리위원회(IRB) 승인된 연구계획서
3. 신청자 소속 증빙 서류 (재직증명서, 재학증명서, 근로계약서 등 택1)
4. 안심존 이용 신청서 [다운로드]
5. 보안서약서 [다운로드]
※ 상기 신청서 및 첨부 서류를 완비한 후 신청을 진행하셔야 정상적으로 절차가 이루어집니다. -
신청 및 이용관련 문의는 safezone1@aihub.kr 또는 02-525-7708, 7709로 문의
데이터셋 다운로드 승인이 완료 된 후 API 다운로드 서비스를 이용하실 수 있습니다.
API 다운로드 파일은 분할 압축되어 다운로드 됩니다. 분할 압축 해제를 위해서는 분할 압축 파일들의 병합이 필요하며 리눅스 명령어 사용이 필요합니다.
리눅스 OS 계열에서 다운로드 받으시길 권장하며 윈도우에서 파일 다운로드 시 wsl(리눅스용 윈도우 하위 시스템) 설치가 필요합니다.
※ 파일 병합 리눅스 명령어
find "폴더경로" -name "파일명.zip.part*" -print0 | sort -zt'.' -k2V | xargs -0 cat > "파일명.zip"
- 해당 명령어 실행 시, 실행 경로 위치에 병합 압축 파일이 생성됩니다.
- 병합된 파일 용량이 0일 경우, 제대로 병합이 되지 않은 상태이니 "폴더경로"가 제대로 입력되었는지 확인 부탁드립니다.
※ 데이터셋 소개 페이지에서 다운로드 버튼 클릭하여 승인이 필요합니다.