-
데이터 변경이력
데이터 변경이력 버전 일자 변경내용 비고 1.1 2023-12-20 데이터 최종 개방 1.0 2023-07-31 데이터 개방(Beta Version) 데이터 히스토리
데이터 히스토리 일자 변경내용 비고 2024-02-16 산출물 전체 공개 소개
o 온라인 관광 서비스 구축, 메타버스 구현, 3차원 가상지 인공지능 모델 연구에 활용 가능한 유명 자연관광지(산·하천·관광명소) 이미지, 3D 관광 데이터를 구축합니다. ※ 한국관광공사에서 선정한 <한국관광100선>의 자연관광지 산·하천 대상: 지리산국립공원
구축목적
o 본 과제는 지리산을 대상으로 차원 공간정보와 탐방로 등에 대한 이미지 및 포인트 클라우드 데이터를 구축하여 디지털 트윈 및 신기술 융복합에 활용가능한 3차원 관광지 학습데이터를 구축하고자 합니다.
-
메타데이터 구조표 데이터 영역 문화관광 데이터 유형 3D , 이미지 데이터 형식 jpg, pcd 데이터 출처 자체구축 라벨링 유형 바운딩박스(이미지) 라벨링 형식 JSON 데이터 활용 서비스 관광이미지탐지서비스, 디지털트윈 및 메타버스 원천데이터로 활용 데이터 구축년도/
데이터 구축량2022년/산하천: 이미지 21만장 -
◌ 데이터통계
- 원천데이터
취득 대상지 원천데이터 포맷 수량 산하천 지리산 전경 정사영상 img, geotiff 1 수치표고모델 img, geotiff 1 탐방로 포인트 클라우드 las 10식 탐방로 RGB 이미지 jpg 357,010 탐방로 전역 파노라마 이미지 jpg 508,344 지리산 내 3D 모델링 obj 30 주요 POI 이미지 jpg 216,554 학습용가공데이터
구분 가공대상 가공 방식 확장자 수량 산하천 주요 POI 이미지 2D Bounding box json 216,554 - 학습용데이터분포<산하천 POI이미지>
자원분류 자원 세분류 수량 비율 문화자원 국보 14,052 6% 보물 46,286 21% 문화재자료 13,894 6% 시도기념물 14,591 7% 시도유형문화재 45,655 21% 사적비 2,761 1% 기타문화재 15,473 7% 경관자원 폭포 9,599 4% 소 16,114 7% 바위 12,554 6% 나무 4,083 2% 천연기념물 2,746 1% 관광자원 시설물 18,746 9% 총수량 216,554 100% -
-
AI 모델 상세 설명서 다운로드
AI 모델 상세 설명서 다운로드 AI 모델 다운로드
Deep Residual Learning for Image Recognition(K. He al. 2015) 에서 유효성이 검증된 Resnet모델을 적용하였습니다.잔차 신경망(殘差 神經網, Residual neural network), 즉 레즈넷(ResNet)은 스킵 연결(skip connection)을 통해 잔차를 학습하도록 만들어진 인공신경망이다. 일반적인 딥러닝 신경망 모델보다 예측 정확도가 높다<출처; 위키>
- Resnet50 + Faster R-CNN(산하천 21만 세트)
<출처: arXiv:1512.03385 [cs.CV]>
-
데이터 성능 점수
측정값 (%)기준값 (%)데이터 성능 지표
데이터 성능 지표 번호 측정항목 AI TASK 학습모델 지표명 기준값 점수 측정값 점수 1 산하천 2D 객체 탐지 성능 Object Detection FasterRCNN mAP 70 % 72.21 % 2 이미지 분류 및 인식: 오브젝트 탐지 성능 Object Detection ResNet + YOLO v3 mAP 70 % 79.7 % 3 3차원 공간 영역의 점군 데이터 인식 및 분류 Image Classification ConvPoint mIoU 68 % 78.85 %
※ 데이터 성능 지표가 여러 개일 경우 각 항목을 클릭하면 해당 지표의 값이 그래프에 표기됩니다.
※ AI모델 평가 지표에 따라 측정값의 범위, 판단 기준이 달라질 수 있습니다. (ex. 오류율의 경우, 낮을수록 좋은 성능을 내는 것으로 평가됩니다)
-
설명서 및 활용가이드 다운로드
데이터 설명서 다운로드 구축활용가이드 다운로드데이터타입
작업 대상 라벨링 방식 작업 방식 결과값 예시 산하천, 관광지 내 주요 POI 이미지 bbox 객체 외곽을 bounding box로 작업 x1, y1, x2, y2의 2개 point “bbox”: [27, 0, 293, 202] ◌ 데이터포맷
원천데이터<산하천 POI 이미지>
가공데이터<산하천 POI 이미지>
{
"infomation": {
"date": "2022-08-10",
"area": "지리산국립공원",
"copyright": "바이브컴퍼니컨소시엄",
"season": "여름",
"time": "11:21:10"
},
"image_info": {
"filename": "POI_021_C01_S_N_LD_R_000001.jpg",
"resolution": "1920*1080",
"angle": "우측면",
"distance": "근거리",
"weather": "야간"
},
"annotation": [ {
"class_id_1": "구례 화엄사 각황전 앞 석등",
"class_id_2": "문화자원",
"type": "bbox",
"bbox": [10, 23, 100, 40],
"truncated": 0,
"occluded": 0
} ],
"class_info": [ {
"gps": [35.1677966, 129.0562922],
"class_url": "www.knps.or.kr"
} ]
}어노테이션포맷<산하천 POI 이미지>
어노테이션 포맷<산하천 POI 이미지> NO 항목 타입 필수여부 한글명 영문명 1 기본 정보 information Object Y 1-1 날짜 date String Y 1-2 지역 area String Y 1-3 저작권 copyright String Y 1-4 계절 season String Y 1-5 시간 time String Y 2 이미지 정보 image_info Object Y 2-1 파일명 filename String Y 2-2 해상도 resolution String Y 2-3 촬영각도 angle String Y 2-4 촬영거리 distance String Y 2-5 조도 weather String Y 3 가공 정보 annotation Object Y 3-1 클래스 분류 class_id_1 Integer Y 3-2 클래스 분류 class_id_2 Integer Y 3-3 가공 방식 Type String Y 3-4 가공 좌표 bbox Array Y 3-5 짤림여부 truncated Integer Y 3-6 짤림여부 occluded 3-7 바운딩 박스 위치 bbox Array Y 4 객체 지식정보 class_info Object Y 4-1 GPS 정보 gps Array Y 4-2 온톨로지 url class_url String -
데이터셋 구축 담당자
수행기관(주관) : ㈜바이브컴퍼니
수행기관(주관) 책임자명 전화번호 대표이메일 담당업무 조필구 02-565-0531 pilku.jo@vaiv.kr 산하천 데이터 수집, 품질 수행기관(참여)
수행기관(참여) 기관명 담당업무 위프코(주) 관광지 데이터 수집, 정제 뉴레이어(주) 산하천 데이터 정제, 가공 ㈜인피닉 관광지, 산하천 비식별화, 관광지 가공, 품질 데이터 관련 문의처
데이터 관련 문의처 담당자명 전화번호 이메일 조필구 02-565-0531 pilku.jo@vaiv.kr
-
인터넷과 물리적으로 분리된 온라인·오프라인 공간으로 의료 데이터를 포함하여 보안 조치가 요구되는 데이터를 다운로드 없이 접근하고 분석 가능
* 온라인 안심존 : 보안이 보장된 온라인 네트워크를 통해 집, 연구실, 사무실 등 어디서나 접속하여 데이터에 접근하고 분석
* 오프라인 안심존 : 추가적인 보안이 필요한 데이터를 대상으로 지정된 물리적 공간에서만 접속하여 데이터에 접근하고 분석 -
- AI 허브 접속
신청자 - 안심존
사용신청신청자신청서류 제출* - 심사구축기관
- 승인구축기관
- 데이터 분석 활용신청자
- 분석모델반출신청자
- AI 허브 접속
-
1. 기관생명윤리위원회(IRB) 심의 결과 통지서 [IRB 알아보기] [공용IRB 심의신청 가이드라인]
2. 기관생명윤리위원회(IRB) 승인된 연구계획서
3. 신청자 소속 증빙 서류 (재직증명서, 재학증명서, 근로계약서 등 택1)
4. 안심존 이용 신청서 [다운로드]
5. 보안서약서 [다운로드]
※ 상기 신청서 및 첨부 서류를 완비한 후 신청을 진행하셔야 정상적으로 절차가 이루어집니다. -
신청 및 이용관련 문의는 safezone1@aihub.kr 또는 02-525-7708, 7709로 문의
데이터셋 다운로드 승인이 완료 된 후 API 다운로드 서비스를 이용하실 수 있습니다.
API 다운로드 파일은 분할 압축되어 다운로드 됩니다. 분할 압축 해제를 위해서는 분할 압축 파일들의 병합이 필요하며 리눅스 명령어 사용이 필요합니다.
리눅스 OS 계열에서 다운로드 받으시길 권장하며 윈도우에서 파일 다운로드 시 wsl(리눅스용 윈도우 하위 시스템) 설치가 필요합니다.
※ 파일 병합 리눅스 명령어
find "폴더경로" -name "파일명.zip.part*" -print0 | sort -zt'.' -k2V | xargs -0 cat > "파일명.zip"
- 해당 명령어 실행 시, 실행 경로 위치에 병합 압축 파일이 생성됩니다.
- 병합된 파일 용량이 0일 경우, 제대로 병합이 되지 않은 상태이니 "폴더경로"가 제대로 입력되었는지 확인 부탁드립니다.
※ 데이터셋 소개 페이지에서 다운로드 버튼 클릭하여 승인이 필요합니다.