NEW 도시 수목 3D 생육 데이터
- 분야재난안전환경
- 유형 3D , 이미지 , 텍스트
-
데이터 변경이력
데이터 변경이력 버전 일자 변경내용 비고 1.1 2023-12-27 데이터 최종 개방 1.0 2023-07-26 데이터 개방(Beta Version) 데이터 히스토리
데이터 히스토리 일자 변경내용 비고 2024-01-12 산출물 전체 공개 소개
인공지능 학습용 데이터 2종 (3D 좌표, RGB 색상정보, intensity, 분류라벨값으로 구성된 수목 잎-가지 분할 라벨 점군데이터; 환경 요소, 엽록소 함량, 수목 바이오매스(부피)의 변화량들으로 구성된 바이오매스와 엽록소 함량 변화량 데이터)과 이를 제작하기 위해 수집 및 가공한 데이터
구축목적
도심지 내의 수목 객체 3D 데이터를 수집 및 모델링할 뿐만 아니라, 현장 검증형 데이터로서 신뢰도 있는 공공인프라를 구축하며 도시 조경수의 탄소흡수량을 추정하기 위해 필요한 인공지능모형들의 학습용 데이터 세트을 구축하는 것을 목표로 하며, 궁극적으로 사회 재난재해 저감과 기후변화 대응형 탄소 중립 데이터로 활용
-
메타데이터 구조표 데이터 영역 재난안전환경 데이터 유형 3D , 이미지 , 텍스트 데이터 형식 csv, jpg, fbx, png 데이터 출처 영상 및 환경 센서, 3D LiDAR, 수고계, 흉고직경자, 엽록소함량 측정기, 등으로 계측 라벨링 유형 세그멘테이션(3D 점군), 내용요약(환경 및 생육 계측 데이터) 라벨링 형식 json, csv 데이터 활용 서비스 ● LULUCF (Land use land use change, and forestry) 개발에 활용 ● 탄소흡수량 산정 서비스 개발에 활용 ● 그린 인프라 및 3D 도시 수목 데이터의 도시열섬 완화 및 효율적인 바람길 시뮬레이션에 활용 ● 도심지 내에서 발생가능한 미세먼지의 총량, 도시 미세먼지 흡수량, 가로수의 종 다양성 예측 등을 위한 서비스 개발에 활용 ● 도심 내 수목의 조성을 위한 고려사항인 심미, 기능적 측면과 조성되는 환경에서 수목의 생육 단계를 예측할 수 있는 디지털 트윈 작업의 기초 시각화 데이터로 활용 데이터 구축년도/
데이터 구축량2022년/수목 3D 점군 3,000건; 생육 조사 데이터 3,000건; 시간별 환경 데이터 44,268건; 생육 및 환경 변화량 2,400건; NDVI 이미지 7,297건; 수목 3D 객체 모형 320건 -
잎-가지 분할 점군 라벨링 3,000건 (학습용) 바이오매스와 엽록소함량 변화량 추정 2,400건 (학습용) 기상/토양 환경(시간) 44,268건 수목 생육 3,000건 식생지수 7,297건 이미지 3D 수목 객체 320건 1. 수집시기별 분포
① 잎/가지 분할 점군 데이터구성비(%) 8월 6.13 9월 24 10월 44 11월 25.87 계 100 2. 조사 권역별 분포
① 잎/가지 분할 점군 데이터구성비(%) 경기 20 강원 20 세종 20 대구 20 제주 20 계 100 ② 도시 수목 3D 객체 모델 데이터
구성비(%) 경기 18.44 강원 19.69 세종 21.56 대구 21.56 제주 18.75 계 100 3. 수종별 분포
① 잎/가지 분할 점군 데이터구성비(%) 가시나무 2.5 계수나무 0.67 느티나무 4.83 단풍나무 1.67 대왕참나무 5.33 마가목 0.83 매화나무 2.17 메타세콰이아 4 모과나무 1.5 배롱나무 3.5 백목련 0.17 백송 0.83 백합나무 1 복자기 1.17 산벚나무 1.67 산수유 4.33 서양측백 0.83 석류나무 0.5 소나무 5 소나무(작) 4.67 스트로브잣나무 2.5 아왜나무 2.83 에메랄드그린 0.83 왕벚나무 10.83 은행나무 8 이팝나무 10.83 자귀나무 0.67 전나무 2.5 중국단풍 0.83 쪽동백 0.83 청단풍 5.67 칠엽수 1.67 팥배나무 1 팽나무 0.67 해송 2.17 후박나무 1 계 100 ② 도시 수목 3D 객체 모델 데이터
구성비(%) 스트로브잣나무 3.13 소나무 7.19 전나무 2.81 백송 1.25 해송 2.81 메타세콰이어 2.81 자귀나무 1.25 대왕참나무 6.88 계수나무 0.94 칠엽수 2.81 느티나무 6.88 이팝나무 11.83 산수유 5 은행나무 10.31 왕벚나무 6.88 마가목 0.63 배롱나무 3.13 청단풍 7.5 백목련 0.31 산벚나무 2.19 백합나무 1.25 팥배나무 0.94 매화나무 1.25 중국단풍 1.25 석류 0.94 팽나무 1.25 아왜나무 2.5 가시나무 2.5 쪽동백 1.56 계 100 -
-
AI 모델 상세 설명서 다운로드
AI 모델 상세 설명서 다운로드 AI 모델 다운로드1. 모델학습
● 아래 표와 같이 두가지 목적의 인공지능 학습을 위해서 후보 AI 알고리즘들 중에 성늠 및 학습속도가 우수한 LIghtGBM을 선발하여 활용함목적 적용 AI 알고리즘 학습용 데이터 구축량 수목 3D 점군 잎-가지 분할 LightGBM(분할) 3,000건 수목 바이오매스(부피) 및 엽록수 함량 변화량 추정 LightGBM(회귀) 2,400건 ● Light GBM은 Gradient Boosting 프레워크로 Tree 기반 학습 알고리즘. LIght GBM은 Tree가 수직적으로 확장되는 반면에 다른 알고리즘은 Tree가 수평적으로 확장. 즉 Light GBM은 leaf-wise인 반면 다른 알고리즘은 level-wise임. 동일한 leaf를 확장할 때, leaf-wise 알고리즘은 level-wise 알고리즘보다 더 많은 loss를 줄일 수 있음.
● 본 사업은 인공지능 학습용 데이터를 구축하는 것이 목적이므로 구축한 데이터 및 예시 AI 인공지능 학습모형을 참고하여 목적에 맞는 인공지능 학습 모형의 최적화가 필요함2. 서비스 활용 시나리오
● LULUCF (Land use land use change, and forestry) 개발에 활용
● 탄소흡수량 산정 서비스 개발에 활용 -
데이터 성능 점수
측정값 (%)기준값 (%)데이터 성능 지표
데이터 성능 지표 번호 측정항목 AI TASK 학습모델 지표명 기준값 점수 측정값 점수 1 잎, 가지 분류 성능 (1) Text Classification LightGBM Accuracy 80 % 83.54 % 2 바이오매스 및 엽록소 함량 변화량 예측 성능(2) Prediction LightGBM R2 0.65 단위없음 0.66 단위없음
※ 데이터 성능 지표가 여러 개일 경우 각 항목을 클릭하면 해당 지표의 값이 그래프에 표기됩니다.
※ AI모델 평가 지표에 따라 측정값의 범위, 판단 기준이 달라질 수 있습니다. (ex. 오류율의 경우, 낮을수록 좋은 성능을 내는 것으로 평가됩니다)
-
설명서 및 활용가이드 다운로드
데이터 설명서 다운로드 구축활용가이드 다운로드[데이터 포맷]
1) 잎/가지 분할 점군 데이터(CSV)
X Y Z R G B INTENSITY TYPE 112.4939 14.43629 2.98841 15 33 11 0.177401 1 112.5103 14.39874 2.9946 12 31 27 0.124437 1 112.51 14.40001 3.00237 12 31 29 0.127382 1 112.5104 14.39869 3.01151 7 26 24 0.082689 1 112.5432 14.36546 3.00612 8 27 8 0.16527 1 112.5421 14.37019 3.01208 14 32 20 0.201465 1 112.5347 14.4017 3.02872 17 33 30 0.189761 1 112.5643 14.30353 2.98303 15 32 16 0.153216 0 112.5495 14.36533 2.99235 7 26 7 0.201495 0 ….. …. …. …. …. …. ….. …. ….. …. …. …. …. …. ….. …. 112.5483 14.37106 3.01469 14 32 16 0.331334 1 그림. 라벨링된 점군 데이터를 CloudCompare로 로딩할 경우 RGB 색상으로 표시한 모습(좌)과 라벨값을 스칼라 색상으로 표시한 모습(우)
2) 바이오매스 및 엽록소 함량 변화량 데이터(csv; 권역 + 구역 + 수종∙규격 + 시간구간 + 변화량의 시간격에 맞춰서 계측된 환경 데이터의 통계 요약값 + 바이오매스 변화량 + 엽록소함량 변화량)권역 구역 수종 규격 이전 측정일 해당 측정일 구간 평균온도 구간 평균습도 구간 평균풍속 구간 평균 CO2 농도 구간 평균 토양함수율 구간 평균 토양 pH 구간 평균 토양 EC 구간 평균 NDVI 엽면적지수 변화량 바이오매스 변화량 엽록소지수 변화량 DT IN 1 2 2022-08-05 2022-08-25 26 73 10 430 65 6.1 0.5 0.5 0.2 300 0.5 DT OUT 2 1 2022-08-05 2022-08-25 23.4 65.7 9 473 71.5 6.1 0.5 0.5 0.2 330 0.5 DT IN 5 3 2022-08-05 2022-08-25 28.6 65.7 10 387 58.5 5.5 0.5 0.5 0.2 330 0.5 DT IN 1 4 2022-08-05 2022-08-25 28.6 73 11 430 71.5 5.5 0.6 0.5 0.2 300 0.5 DT OUT 4 2 2022-08-05 2022-08-25 26 73 9 430 71.5 6.7 0.5 0.5 0.2 300 0.5 DT IN 6 3 2022-08-05 2022-08-25 26 80.3 10 473 58.5 5.5 0.6 0.5 0.2 270 0.4 DT OUT 7 3 2022-08-05 2022-08-25 28.6 80.3 9 387 71.5 5.5 0.5 0.5 0.2 300 0.4 DT IN 1 3 2022-08-05 2022-08-25 26 65.7 11 473 65 5.5 0.6 0.5 0.2 270 0.5 DT IN 11 3 2022-08-05 2022-08-25 23.4 80.3 10 387 58.5 6.1 0.6 0.5 0.2 330 0.5 DT OUT 4 4 2022-08-05 2022-08-25 26 65.7 9 430 58.5 6.1 0.6 0.5 0.2 270 0.5 DT IN 1 1 2022-08-05 2022-08-25 26 65.7 11 430 58.5 6.1 0.5 0.5 0.2 300 0.5 DT IN 5 2 2022-08-05 2022-08-25 23.4 73 11 387 71.5 6.7 0.5 0.6 0.2 330 0.4 DT IN 6 3 2022-08-05 2022-08-25 28.6 73 9 387 58.5 6.1 0.5 0.5 0.2 270 0.4 DT IN 7 4 2022-08-05 2022-08-25 28.6 65.7 11 473 65 5.5 0.6 0.5 0.2 300 0.5 ….. …. …. …. …. …. ….. …. ….. …. …. …. …. …. ….. …. …. ….. …. …. …. …. …. ….. …. ….. …. …. …. …. …. ….. …. …. DT IN 2 3 2022-08-05 2022-08-25 23.4 73 9 387 58.5 5.5 0.5 0.5 0.2 270 0.5 DT IN 5 3 2022-08-05 2022-08-25 23.4 73 10 473 65 5.5 0.5 0.6 0.2 270 0.4 3) 도시 수목 3D 객체 모델 데이터(FBX-PNG)
4) 라벨 데이터(json)
{"조사일":"2022-09-08",
"수종":"이팝나무",
"권역":"대구",
"위치":"INNER",
"수고(m)":8.8,
"흉고직경(cm)":6} -
데이터셋 구축 담당자
수행기관(주관) : 서울대학교 산학협력단
수행기관(주관) 책임자명 전화번호 대표이메일 담당업무 강준석 02-880-4872 junkang@snu.ac.kr 과제 총괄 수행기관(참여)
수행기관(참여) 기관명 담당업무 (주)SK임업 물리공간 제공,수목 생육 및 관리 데이터 수집, 도시림 수종 현장 수집 ㈜카탈로닉스 데이터 수집, 가공 및 검수; AI 학습모형 ㈜프리다츠 3D 모델링, 모델링검수 데이터 관련 문의처
데이터 관련 문의처 담당자명 전화번호 이메일 김재경 02-880-2228 kimnam124@snu.ac.kr
-
인터넷과 물리적으로 분리된 온라인·오프라인 공간으로 의료 데이터를 포함하여 보안 조치가 요구되는 데이터를 다운로드 없이 접근하고 분석 가능
* 온라인 안심존 : 보안이 보장된 온라인 네트워크를 통해 집, 연구실, 사무실 등 어디서나 접속하여 데이터에 접근하고 분석
* 오프라인 안심존 : 추가적인 보안이 필요한 데이터를 대상으로 지정된 물리적 공간에서만 접속하여 데이터에 접근하고 분석 -
- AI 허브 접속
신청자 - 안심존
사용신청신청자신청서류 제출* - 심사구축기관
- 승인구축기관
- 데이터 분석 활용신청자
- 분석모델반출신청자
- AI 허브 접속
-
1. 기관생명윤리위원회(IRB) 심의 결과 통지서 [IRB 알아보기] [공용IRB 심의신청 가이드라인]
2. 기관생명윤리위원회(IRB) 승인된 연구계획서
3. 신청자 소속 증빙 서류 (재직증명서, 재학증명서, 근로계약서 등 택1)
4. 안심존 이용 신청서 [다운로드]
5. 보안서약서 [다운로드]
※ 상기 신청서 및 첨부 서류를 완비한 후 신청을 진행하셔야 정상적으로 절차가 이루어집니다. -
신청 및 이용관련 문의는 safezone1@aihub.kr 또는 02-525-7708, 7709로 문의
데이터셋 다운로드 승인이 완료 된 후 API 다운로드 서비스를 이용하실 수 있습니다.
API 다운로드 파일은 분할 압축되어 다운로드 됩니다. 분할 압축 해제를 위해서는 분할 압축 파일들의 병합이 필요하며 리눅스 명령어 사용이 필요합니다.
리눅스 OS 계열에서 다운로드 받으시길 권장하며 윈도우에서 파일 다운로드 시 wsl(리눅스용 윈도우 하위 시스템) 설치가 필요합니다.
※ 파일 병합 리눅스 명령어
find "폴더경로" -name "파일명.zip.part*" -print0 | sort -zt'.' -k2V | xargs -0 cat > "파일명.zip"
- 해당 명령어 실행 시, 실행 경로 위치에 병합 압축 파일이 생성됩니다.
- 병합된 파일 용량이 0일 경우, 제대로 병합이 되지 않은 상태이니 "폴더경로"가 제대로 입력되었는지 확인 부탁드립니다.
※ 데이터셋 소개 페이지에서 다운로드 버튼 클릭하여 승인이 필요합니다.