-
데이터 변경이력
데이터 변경이력 버전 일자 변경내용 비고 1.1 2021-08-25 데이터 품질 보완 1.0 2021-06-25 데이터 최초 개방 데이터 히스토리
데이터 히스토리 일자 변경내용 비고 2023-04-12 메타데이터/세부데이터/데이터 통계/활용AI모델 및 코드 내용 개정 2022-10-17 신규 샘플데이터 개방 소개
화재 발생 전에 발생되는 연기를 촬영한 영상으로부터 화재 발생 사전 예측 가능한 AI 기술개발을 위한 영상 데이터
- 데이터 영역 : 재난안전환경
- 데이터 유형 : 이미지
- 데이터 형식 : jpg
- 데이터 출처 : 직접취득
- 라벨링 유형 : 바운딩박스, 폴리곤
- 라벨링 형식 : JSON
- 데이터 활용 서비스 : 자동 화재예측 서비스
- 구축년도 : 2020년
- 구축량 : 173만
구축목적
화재 발생 전에 발생되는 연기를 촬영한 동영상으로부터 화재 발생을 사전 예측하여 알림하는 AI 기술 개발을 위한 화재 발생 예측 AI학습용데이터 구축
-
- 구축 내용 및 제공 데이터량
구축 내용 및 제공 데이터량 과제명 데이터 구축량 비고 영상/이미지 목표 수량 화재 발생 데이터 화재씬 이미지 740,000장 BB 600,000개 이상 BB 1,998,784 연기, Polygon 140,000개 이상 Polygon 화재, 진화 start-end 키프레임 기록 유사씬 이미지 660,000장 BB 600,000개 이상 262,349 Polygon 60,000개 이상 무관씬 이미지 300,000장 BB 300,000개 이상
- 화재 발생 예측 데이터(연기동영상) 구축
화재 발생 예측 데이터(연기동영상) 구축 데이터유형 단위 목표수량 비고 이미지 장 1,700,000 Instance 개 1,700,000 Bounding Box 개 1,500,000 Polygon 개 200,000 - 구축 내용 및 제공 데이터량
-
-
AI 모델 상세 설명서 다운로드
AI 모델 다운로드• YOLACT Architecture
< Backbone – ResNet >파란색/노란색은 프로토타입ㅇ에서 낮은/큰 값을 나타내고, 회색 노드는 기능을 나타냄
출처:“YOLACT Real-time Instance Segmentation”, Daniel Bolya, Chong Zhou, Fanyl Xiao, Yong Jae Lee, University of Californaia, Davis.• YOLACT Architecture의 주요과정
1) 먼저 입력 이미지를 feature map으로 변형시켜주는 부분인 Backbone은 ResNet-101을 기반으로 구현한다.
2) 이미지에서 residual neuiral network를 통해 C1,...,C5까지 5개의 feature map을 먼저 구성한다.
3) 그 후, Feature Pyramid Network(FPN)를 통해 P3,...,P7까지 5개의 feature map을 새롭게 생성한다.
• YOLACT의 장점
- 인스턴스 분할(instance segmentation)을 이용하여 성능 향상: 인스턴스 분할을 두 개의 병렬작업으로 나누어 처리함으로써 성능을 향상1) 이미지에 대한 Prototype 마스크 생성 (Protonet branch)2) 인스턴스 별 마스크 개수 예측(Prediction Head branch)
- 병렬 구조로 인해 매우 가벼운 조립 공정으로 ᄈᆞ른 연산 속도(30fps 이상):· YOLACT는 1단계 백본 검춝기(one-stage backbone detector)에 대해 약간의 계산 오버헤드만 추가· 전체 mask branch를 평가하는데 5ms 정도 소요
- 마스크 고품질: 마스크는 repooling 기법으로 인해 품질의 손상 없이 이미지 공간의 전체 범위를 사용하기 떄문에 고해상도 feature map일수록 작은 object에 대해 좋은 성능을 보임
- 일반성: 프로토타입 및 마스크 계수를 거의 모든 최신 물체 감지기에 추가할 수 있다.
- Fast NMS 기법 사용으로 속도 개선: YOLACT에서는 동일 instance를 focus하는 anchor box 중 confidence가 가장 높은 anchor box만 남기고 다른 중복 anchor box는 제거하는 NMS(Non-maximum suppression) 대신 Fast NMS라는 새로운 기법을 제시하는데 이는 NMS보다 성능은 거의 떨어뜨리지 않으면서 더 높은 속도를 보인다. -
데이터 성능 점수
측정값 (%)기준값 (%)데이터 성능 지표
데이터 성능 지표 번호 측정항목 AI TASK 학습모델 지표명 기준값 점수 측정값 점수 1 화재 발생 예측 (바운딩박스) Prediction YOLACT(Backbone: Resnet50) mAP 48 % 50.35 % 2 화재 발생 예측 (폴리곤) Prediction YOLACT(Backbone: Resnet50) mAP 48 % 48.31 % 3 화재 발생 예측 (평균) Prediction YOLACT(Backbone: Resnet50) mAP 48 % 49.33 %
※ 데이터 성능 지표가 여러 개일 경우 각 항목을 클릭하면 해당 지표의 값이 그래프에 표기됩니다.
※ AI모델 평가 지표에 따라 측정값의 범위, 판단 기준이 달라질 수 있습니다. (ex. 오류율의 경우, 낮을수록 좋은 성능을 내는 것으로 평가됩니다)
-
설명서 및 활용가이드 다운로드
데이터 설명서 다운로드 구축활용가이드 다운로드구축 목적
- 화재 발생 전에 발생되는 연기를 촬영한 동영상으로부터 화재 발생을 사전 예측하여 알림하는 AI 기술 개발을 위한 화재 발생 예측 AI학습용데이터 구축
활용 분야
- 자동 화재예측 인공지능 AI 알고리즘 개발연구
소개
- 공개된 양질의 화재 발생 예측 데이터(연기 동영상)를 관련 기업, 대학/연구소 등이 활용하여 AI 알고리즘 수준 향상, 플랫폼 서비스 기술 등 원천 기술 확보
- 화재 발생 예측 데이터(연기동영상) 구축
대표도면
필요성
- 화재 발생 예측 데이터(연기 동영상)
- 산업시설, 일반가정, 자연환경 등 화재위험이 높은 곳에 선제적인 화재감지 솔루션이 필요
- 화재위험지역에서 연기발생을 감지하고 화재신호를 신속히 전파하는 기술이 필요
- 다양한 환경의 연기영상을 활용해 수준 높은 AI응용서비스 개발이 필요
데이터 구조
- 데이터 구조
데이터 구조 No. 항목명 설명 필수여부 1 1-1 date 촬영일자 Y 1-2 path Path정보 Y 1-3 filename 파일이름(*jpg) Y 1-4 copyrighter 저작권소유자 Y 1-5 H_DPI 수평 해상도 값 Y 1-6 location 촬영 장소 Y 1-7 bit 비트 수준 Y 1-8 V_DPI 수직 해상도 값 Y 1-9 resolution 이미지 해상도 Y 2 2-1 대분류 대분류 정보 2-2 중분류 중분류 정보 Y 2-3 flags 겹침 및 잘림 여부 2-4 box Bounding Box 좌표 Y 2-5 class Class 정보 Y - 데이터 셋(JSON 구조)
데이터 셋(JSON)구조 분류 항목 내용 값 범위 입력 방법 { “image”: { 이미지 정보 “filename”: “sample.JPG”, 파일명 파일명 입력 “copyrighter”: ”미디어그룹사람과숲 (컨 )”, 저작권 소유자 고정값 입력 “date”: ”2020.10.15”, 촬영 일시 폴더명 입력 “location” : “01” 촬영 장소 01~16 파일명에서 추출 S3-N 01 01_MS00001.JPG “H DPI”: ”72”, 수평 해상도 이미지 속성에서 추출 수평 해상도 “V DPI”: “72”, 수직 해상도 이미지 속성에서 추출 수직 해상도 “bit”: “24”, 비트 수준 이미지 속성에서 추출 비트 수준 “resolution”: [1920,1280]}, 이미지 해상도 이미지 속성에서 추출 사진 크기 { “annotations”: {[ 어노테이션 정보 “bbox ”: [x,y ,x,y ], 드로잉 타입 / 좌표값 어노테이션 입력 또는 “polygon”: [[x1,y1],[x2,y2], …] 파일명에서 추출 S3 -N 01 01M00001.JPG “data ID” : “S 3 ”, 세부 과제 번호 어노테이션 입력 “middle classification” : “01”, 중분류 01~02 어노테이션 입력 “class” : “01” 클래스 정보 01~10 어노테이션 입력 “flags” : { 추가 정보 “not occluded”, 객체 가림 어노테이션 입력 “not truncated” 객체 잘림 어노테이션 입력 } ] } - 어노테이션 포맷
어노테이션 포맷 항목 가공단위 가공방식 값 Tag name 표현방식 화재씬 객체 Bounding box x,y 의 2개 point Bbox json array 형식 객체외곽을 Box로 가공 예) 크라우드가 정의 [200,100],[500,800] 유사씬 객체 Bounding box x,y 의 2개 point Bbox json array 형식 객체외곽을 Box로 가공 예) 크라우드가 정의 [200,100],[500,800] 무관씬 객체 Bounding box x,y 의 2개 point Bbox json array 형식 객체외곽을 Box로 가공 예) 크라우드가 정의 [200,100],[500,800] 연기발생시간 영상 연기 시작 시간정보를 입력 time 정보 smog start 영상 meta 에 기입 크라우드가 정의 10:05.0 화재발생시간 영상 화재 시작 시간정보를 입력 time 정보 fire start 영상 meta 에 기입 크라우드가 정의 10:05.0
-
데이터셋 구축 담당자
수행기관(주관) : 미디어그룹사람과숲
수행기관(주관) 책임자명 전화번호 대표이메일 담당업무 성낙춘 02-6959-6632 sung_1973@humanf.co.kr · 사업관리 총괄 · 데이터 가공/품질 · 활용 서비스 수행기관(참여)
수행기관(참여) 기관명 담당업무 ㈜스마트테크놀로지 · 사업관리
· 데이터 수집
· 데이터 정제주식회사 인피닉 · 플랫폼 운영 (가공, 크라우드) 데이터 관련 문의처
데이터 관련 문의처 담당자명 전화번호 이메일 성낙춘(미디어그룹사람과숲) 02-6959-6632 sung_1973@humanf.co.kr
-
인터넷과 물리적으로 분리된 온라인·오프라인 공간으로 의료 데이터를 포함하여 보안 조치가 요구되는 데이터를 다운로드 없이 접근하고 분석 가능
* 온라인 안심존 : 보안이 보장된 온라인 네트워크를 통해 집, 연구실, 사무실 등 어디서나 접속하여 데이터에 접근하고 분석
* 오프라인 안심존 : 추가적인 보안이 필요한 데이터를 대상으로 지정된 물리적 공간에서만 접속하여 데이터에 접근하고 분석 -
- AI 허브 접속
신청자 - 안심존
사용신청신청자신청서류 제출* - 심사구축기관
- 승인구축기관
- 데이터 분석 활용신청자
- 분석모델반출신청자
- AI 허브 접속
-
1. 기관생명윤리위원회(IRB) 심의 결과 통지서 [IRB 알아보기] [공용IRB 심의신청 가이드라인]
2. 기관생명윤리위원회(IRB) 승인된 연구계획서
3. 신청자 소속 증빙 서류 (재직증명서, 재학증명서, 근로계약서 등 택1)
4. 안심존 이용 신청서 [다운로드]
5. 보안서약서 [다운로드]
※ 상기 신청서 및 첨부 서류를 완비한 후 신청을 진행하셔야 정상적으로 절차가 이루어집니다. -
신청 및 이용관련 문의는 safezone1@aihub.kr 또는 02-525-7708, 7709로 문의
데이터셋 다운로드 승인이 완료 된 후 API 다운로드 서비스를 이용하실 수 있습니다.
API 다운로드 파일은 분할 압축되어 다운로드 됩니다. 분할 압축 해제를 위해서는 분할 압축 파일들의 병합이 필요하며 리눅스 명령어 사용이 필요합니다.
리눅스 OS 계열에서 다운로드 받으시길 권장하며 윈도우에서 파일 다운로드 시 wsl(리눅스용 윈도우 하위 시스템) 설치가 필요합니다.
※ 파일 병합 리눅스 명령어
find "폴더경로" -name "파일명.zip.part*" -print0 | sort -zt'.' -k2V | xargs -0 cat > "파일명.zip"
- 해당 명령어 실행 시, 실행 경로 위치에 병합 압축 파일이 생성됩니다.
- 병합된 파일 용량이 0일 경우, 제대로 병합이 되지 않은 상태이니 "폴더경로"가 제대로 입력되었는지 확인 부탁드립니다.
※ 데이터셋 소개 페이지에서 다운로드 버튼 클릭하여 승인이 필요합니다.
오프라인 데이터 이용 안내
본 데이터는 K-ICT 빅데이터센터에서도 이용하실 수 있습니다.
다양한 데이터(미개방 데이터 포함)를 분석할 수 있는 오프라인 분석공간을 제공하고 있습니다.
데이터 안심구역 이용절차 및 신청은 K-ICT빅데이터센터 홈페이지를 참고하시기 바랍니다.
국방데이터 개방 안내
본 데이터는 국방데이터로 군사 보안에 따라 AI허브에서 데이터를 제공하지 않으며,
군 담당자를 통한 별도의 사용 신청이 필요합니다.