-
데이터 변경이력
데이터 변경이력 버전 일자 변경내용 비고 1.0 2024-04-04 데이터 최초 개방 데이터 히스토리
데이터 히스토리 일자 변경내용 비고 2024-04-04 콘텐츠 최초 등록 소개
딥러닝을 통한 지능형 공기질 관리체계 구축
구축목적
외부 공공데이터와 휘발되던 기존 공조설비 운 영데이터 및 적절한 실내공기질 모니터링 데이터를 활용한 데이터 구축
-
메타데이터 구조표 데이터 영역 미분류 데이터 유형 텍스트 데이터 형식 CSV 데이터 출처 서울교통공사 라벨링 유형 내용요약(텍스트) 라벨링 형식 CSV 데이터 활용 서비스 실외 미세먼지 오염농도 증가, 노후화된 공조설비의 단순가동 등 지하역사에서 발생하는 문제해결을 위해 실내공기질 지능형 관리 인프라를 구축 및 실증하고, 지하역사 미세먼지의 AI 관리시스템 제공 데이터 구축년도/
데이터 구축량2020년/233,259,934건 -
[소개]
o 외부 공공데이터와 휘발되던 기존 공조설비 운영 데이터 및 적절한 실내공기질 모니터링 데이터를 활용한 데이터 구축
[데이터셋 통계]
1. 데이터 구축 규모측정연월 센싱 데이터 건수 2019. 03. 32,138,574 2019. 04. 28,905,742 2019. 05. 26,094,846 2019. 06. 29,522,427 2019. 07. 27,880,713 2019. 08. 20,771,287 2019. 09. 25,909,671 2019. 10. 13,346,937 2019. 11. 15,268,785 2019. 12. 13,420,952 합계 233,259,934 2. 센싱 항목
역 식별번호, 센서 식별번호, 센서 모델, 바람 세기, 바람 방향, 온도, 습도, 이산화탄소, 산화탄소, 기압, 진동, 먼지, 위치, 측정시각[데이터셋 구성]
□ 개요
○ 현재 강남역에 구축된 스마트 미세먼지 관리시스템 데이터베이스에 쌓이는 지하 역사 공기 질 데이터는 모두 시계열 데이터
○ 시간의 변화에 따라 관측된 값들을 모은 시계열(time series) 데이터는 일상 생활에서 손쉽게 찾을 수 있음
○ 주가 변동이나 실업률의 변화와 같은 다양한 경제 데이터들 뿐만 아니라 인구 및 라 인구 및 출산율의 변동, 전염병 환자 수의 변화나 시간에 따른 혈압 의 변화도 대표적인 시계열 데이터의 예
○ 시계열 데이터 분석은 자연과학은 물론 사회과학의 모든 분야에서 다양한 현상들을 설명하고 예측하는 주요한 방법으로 자리매김하고 있지만 주가 예측이나 기후 예측의 어려움이 보여주듯이 전통적인 통계적 모델링과 추론 방법이 시계열 데이터에는 잘 적용되지 않음
○ 특정한 시점에서 관측된 값이 주위(바로 직전 또는 직후)의 값들과 밀접한 관계를 가지는 시계열 데이터의 성질 때문임
○ 즉, 시계열 데이터는 독립항등분포(i.i.d., independent and identically distributed)를 따르지 않기 때문에 새로운 모델링과 추론 방법을 필요로 함 -
데이터셋 구축 담당자
수행기관(주관) : NIA
수행기관(주관) 책임자명 전화번호 대표이메일 담당업무 AI융합확산팀 053-230-1428 udt@nia.or.kr 총괄 수행기관(참여)
수행기관(참여) 기관명 담당업무 서울교통공사 검수 ㈜애니텍, ㈜디에이피, ㈜무하기술 데이터 관련 문의처
데이터 관련 문의처 담당자명 전화번호 이메일 NIA AI융합확산팀/서울교통공사 오석민 차장 053-230-1428/02-6311-9627 udt@nia.or.kr
-
인터넷과 물리적으로 분리된 온라인·오프라인 공간으로 의료 데이터를 포함하여 보안 조치가 요구되는 데이터를 다운로드 없이 접근하고 분석 가능
* 온라인 안심존 : 보안이 보장된 온라인 네트워크를 통해 집, 연구실, 사무실 등 어디서나 접속하여 데이터에 접근하고 분석
* 오프라인 안심존 : 추가적인 보안이 필요한 데이터를 대상으로 지정된 물리적 공간에서만 접속하여 데이터에 접근하고 분석 -
- AI 허브 접속
신청자 - 안심존
사용신청신청자신청서류 제출* - 심사구축기관
- 승인구축기관
- 데이터 분석 활용신청자
- 분석모델반출신청자
- AI 허브 접속
-
1. 기관생명윤리위원회(IRB) 심의 결과 통지서 [IRB 알아보기]
2. 기관생명윤리위원회(IRB) 승인된 연구계획서
3. 신청자 소속 증빙 서류 (재직증명서, 재학증명서, 근로계약서 등 택1)
4. 안심존 이용 신청서 [다운로드]
5. 보안서약서 [다운로드]
※ 상기 신청서 및 첨부 서류를 완비한 후 신청을 진행하셔야 정상적으로 절차가 이루어집니다. -
신청 및 이용관련 문의는 safezone1@aihub.kr 또는 02-525-7708, 7709로 문의
데이터셋 다운로드 승인이 완료 된 후 API 다운로드 서비스를 이용하실 수 있습니다.
API 다운로드 파일은 분할 압축되어 다운로드 됩니다. 분할 압축 해제를 위해서는 분할 압축 파일들의 병합이 필요하며 리눅스 명령어 사용이 필요합니다.
리눅스 OS 계열에서 다운로드 받으시길 권장하며 윈도우에서 파일 다운로드 시 wsl(리눅스용 윈도우 하위 시스템) 설치가 필요합니다.
※ 파일 병합 리눅스 명령어
find "폴더경로" -name "파일명.zip.part*" -print0 | sort -zt'.' -k2V | xargs -0 cat > "파일명.zip"
- 해당 명령어 실행 시, 실행 경로 위치에 병합 압축 파일이 생성됩니다.
- 병합된 파일 용량이 0일 경우, 제대로 병합이 되지 않은 상태이니 "폴더경로"가 제대로 입력되었는지 확인 부탁드립니다.
※ 데이터셋 소개 페이지에서 다운로드 버튼 클릭하여 승인이 필요합니다.