※ 26년 신규 개방되는 데이터로, 데이터 활용성 검토, 이용자 관점의 개선의견 수렴 등을 통해 수정/보완될 수 있으며 최종데이터, 샘플데이터, 산출물 등은 변경될 수 있습니다
-
데이터 변경이력
데이터 변경이력 버전 일자 변경내용 비고 1.0 2026-05-19 데이터 개방 Beta Version 데이터 히스토리
데이터 히스토리 일자 변경내용 비고 2026-05-19 산출물 최종 공개 소개
다양한 환경에서의 용접·용단 작업 중 발생하는 불티 비산 위험을 감지하기 위한 멀티모달 데이터
구축목적
다양한 환경에서의 용접·용단 작업 중 발생하는 불티 비산 위험을 감지하고, 용접·용단 불티 비산 단계 예측 및 이상 불티 비산 감지를 위한 멀티모달 학습용 데이터셋 구축
-
메타데이터 구조표 데이터 영역 재난안전환경 데이터 유형 이미지 데이터 형식 png 데이터 출처 직접 수집 라벨링 유형 Polygon(이미지) 라벨링 형식 json 데이터 활용 서비스 산업안전관리서비스, 용접 작업장·안전모니터링시스템 등 데이터 구축년도/
데이터 구축량2025년/152,688건 -
1. 데이터 구축 규모
1. 데이터 구축 규모 데이터 종류 데이터 형태 규모 어노테이션 규모 데이터 형식 용접·용단 불티 비산 데이터 이미지 152,688장 152,688건 png/json 2. 데이터 분포
- 작업방식별2. 데이터 분포 - 작업방식별 데이터명 카테고리 수량 분포 용접·용단 불티 비산 데이터 MIG 34,184 22.39% 아크 65,082 42.62% 레이저 21,821 14.29% 산소 31,601 20.70% 합계 152,688 100% - 비산단계별
2. 데이터 분포 - 비산단계별 MIG 아크 레이저 산소 발생단계 13.66% 4.68% 16.56% 5.57% 비산1단계 26.90% 30.49% 67.09% 23.70% 비산2단계 13.90% 26.55% 7.52% 14.21% 비산3단계 31.32% 32.93% 2.41% 42.79% 소멸단계 14.21% 5.35% 6.42% 13.73% 합계 100% 100% 100% 100% -
-
AI 모델 상세 설명서 다운로드
AI 모델 상세 설명서 다운로드 AI 모델 다운로드• 이중 스트림 방식으로 RGB 및 IR 이미지를 독립적으로 처리한 후 융합하여 용접 진행 단계 분류와 세그멘테이션을 동시에 수행하는 멀티태스크 딥러닝 모델
• ResNet50 백본 기반으로 구축되었으며, 작업 및 환경 메타데이터를 통합하여 예측 정확도를 향상시킨 커스텀 아키텍처
서비스 활용 시나리오
• 실시간 모니터링
- 용접 현장에서 실시간으로 불티 발생 위치 및 유형을 시각화하여 작업자에게 즉각적인 피드백 제공 가능
• 품질 자동 검사
- 용접 완료 후 세그멘테이션 결과를 기반으로 이상 불티 비율을 자동 산출하여 작업 이력 기록 가능
• 공정 최적화
- 진행 단계별 용접 불티 비산 패턴과 메타데이터 분석을 통한 최적 용접 조건 도출 -
설명서 및 활용가이드 다운로드
데이터 설명서 다운로드 구축활용가이드 다운로드1. 데이터 구성
1. 데이터 구성 Key Descriptiion Type Child Type dataset_id 데이터셋 식별자 string version 데이터셋 버전 string description 데이터셋 설명 string category 데이터셋 카테고리 string license 라이센스 정보 string creator 제작자 string creator_homepage 제작자 홈페이지 string work_id 작업 ID string work_datetime 작업 일시 string work_type 작업 유형 number work_method 작업 방식 number work_location 작업 장소 number material_type 용접 재료 number material_max_thickness 작업물의 최대 두께(mm) number material_min_thickness 작업물의 최소 두께(mm) number input_current 작업시 입력되는 전력 값(W) number input_gas_1_pressure 가스압력1 number input_gas_2_pressure 가스압력2 number input_gas_type_1 가스종류1 number input_gas_type_2 가스종류2 number locations 작업장 위치 string temperature 작업장 환경 온도(°C) number humidity 작업장 환경 습도(%) number oxygen_level 작업장 산소농도(%) number pm2_5 작업장 미세먼지 농도(PM2.5, μg/m³) number atmospheric_pressure 작업장 대기압(hPa) number wind_speed 작업장 풍속(m/s) number image_type 이미지 파일 구분 number image_id 이미지 식별자 string file_name 이미지 파일명 string creation_date 이미지 생성 일자 string file_extension 이미지 확장자 string width 이미지 가로 크기(픽셀) number height 이미지 세로 크기(픽셀) number path 이미지 파일 경로 string weld_progress 불티비산단계 number weld_id 용접부 ID number weld_zone[] array $value$ 용접부(안전지대) number spatter_annotations 불티_어노테이션 Object spatter_id 불티비산 ID number spatter_type 불티비산 유형 number spatter_form 불티비산 형태 number points[] array $value$ 불티 좌표 number spatter_id 불티비산 ID number spatter_size 불티크기 number spatter_distance 불티비산 용접점과의 거리(픽셀) number spatter_temp 불티비산 추정온도(°C) number image_caption 이미지 캡션 image_caption_id 이미지 캡션 ID number text 이미지 캡션 string language 이미지 캡션 언어 string 2. 어노테이션 포맷
2. 어노테이션 포맷 No 항목 타입 필수
여부비고 영문 한글 1 info 데이터셋정보 Object 1-1 dataset_id 데이터셋 식별자 string Y 1-2 version 데이터셋 버전 string N 1-3 description 데이터셋 설명 string Y 1-4 category 데이터셋 카테고리 string Y 1-5 license 라이센스 정보 string Y 1-6 creator 제작자 string Y 1-7 creator_homepage 제작자 홈페이지 string N 2 work_process 작업과정 Object 2-1 work_id 작업 ID string Y 2-2 work_datetime 작업 일시 string Y 2-3 work_type 작업 유형 number Y 1: 용접
2: 용단2-4 work_method 작업 방식 number Y 1: MIG
2: 아크
3: 레이저
4: 산소2-5 work_location 작업 장소 number Y 1: 실내
2: 실외2-6 material_type 용접 재료 number Y 1: 금속
2: 비금속2-7 material_max_thickness 작업물의 최대 두께(mm) number Y 3.0: 3mm
6.0: 6mm2-8 material_min_thickness 작업물의 최소 두께(mm) number Y 3.0: 3mm
6.0: 6mm2-9 input_current 작업시 입력되는 전력 값(W) number N 2-10 input_gas_1_pressure 가스압력1 number N 2-11 input_gas_2_pressure 가스압력2 number N 2-12 input_gas_type_1 가스종류1 number Y 1: 혼합가스
2: 아르곤
3: 산소
4: 질소
5: LPG
6: 해당없음2-13 input_gas_type_2 가스종류2 number Y 1: 혼합가스
2: 아르곤
3: 산소
4: 질소
5: LPG
6: 해당없음3 environment 환경 Object 3-1 locations 작업장 위치 string Y 3-2 temperature 작업장 환경 온도(°C) number Y 3-3 humidity 작업장 환경 습도(%) number Y 3-4 oxygen_level 작업장 산소농도(%) number Y 3-5 pm2_5 작업장 미세먼지 농도(PM2.5, μg/m³) number Y 3-6 atmospheric_pressure 작업장 대기압(hPa) number Y 3-7 wind_speed 작업장 풍속(m/s) number Y 4 images 이미지 Object 4-1 image_type 이미지 파일 구분 number Y 1: RGB
2: 열화상4-2 image_id 이미지 식별자 string Y 4-3 file_name 이미지 파일명 string Y 4-4 creation_date 이미지 생성 일자 string Y 4-5 file_extension 이미지 확장자 string Y 4-6 width 이미지 가로 크기(픽셀) number Y 4-7 height 이미지 세로 크기(픽셀) number Y 4-8 path 이미지 파일 경로 string Y 5 annotations 어노테이션 Object 5-1 weld_progress 불티비산단계 number Y 1: 발생단계
2: 비산1단계
3: 비산2단계
4: 비산3단계
5: 소멸단계5-2 weld_id 용접부 ID number Y 5-3 weld_zone[] array Y 5-3-1 $value$ 용접부(안전지대) number Y 6 spatter_annotations 불티_어노테이션 Object 6-1 spatter_id 불티비산 ID number N 6-2 spatter_type 불티비산 유형 number N 1: 정상
2: 이상6-3 spatter_form 불티비산 형태 number N 1: 해당없음
2: 착화
3: 2차비산6-4 points[] array N 6-4-1 $value$ 불티 좌표 number N 7 annotations_auto 어노테이션_자동 Object 7-1 spatter_id 불티비산 ID number N 7-2 spatter_size 불티크기 number N 7-3 spatter_distance 불티비산 용접점과의 거리(픽셀) number N 7-4 spatter_temp 불티비산 추정온도(°C) number N 8 image_caption 이미지 캡션 8-1 image_caption_id 이미지 캡션 ID number Y 8-2 text 이미지 캡션 string Y 8-3 language 이미지 캡션 언어 string Y 3. 데이터 포맷
- 원본데이터 특성3. 데이터 포맷 - 원본데이터 특성 종류 내용 원시데이터 형태 동영상 원시데이터
제작유형컨소시엄에서 자체 촬영한 다양한 환경에서 용접·용단 작업 중 발생하는 불티 비산 위험을 반영한 영상데이터 원천데이터 형태 이미지 원천데이터 유형 다양한 환경에서 용접·용단 작업 중 발생하는 불티 비산 위험을 반영한 영상데이터에서 추출한 이미지데이터 원본제작시기 2025년 파일포맷(원천데이터) png 이미지해상도 1440*1080(RGB) / 640*480(열화상) 규모 152,688건 예시이미지 
[W001_RGB_250902_092319.036]4. 실제 예시
- json{ "info": {
"dataset_id": "welding_cutting_spatter_data",
"version": "1.0",
"description": "용접/용단 불티/비산 데이터셋",
"category": "재난, 안전",
"license": "SPT AIDATA 2025-001",
"creator": "(주)쇼우테크 컨소시엄",
"creator_homepage": "https://ishowtech.co.kr"
},
"work_process": {
"work_id": "W001",
"work_datetime": "2025-09-02 09:23:20",
"work_type": 1,
"work_method": 2,
"work_location": 1,
"material_type": 1,
"material_max_thickness": 3,
"material_min_thickness": 3,
"input_current": 1596,
"input_gas_1_pressure": null,
"input_gas_2_pressure": null,
"input_gas_type_1": 6,
"input_gas_type_2": 6
},
"environment": {
"locations": "경상남도 김해시",
"temperature": 28.3,
"humidity": 81.7,
"pm2_5": 153,
"atmospheric_pressure": 1006,
"wind_speed": 0,
"oxygen_level": 20.9
},
"images": {
"image_type": 1,
"image_id": "W001_RGB_250902_092320.008",
"file_name": "W001_RGB_250902_092320.008",
"creation_date": "2025-09-02 09:23:20",
"file_extension": "png",
"width": 1440,
"height": 1080,
"path": "W001/RGB"
},
"annotations": {
"weld_progress": 2,
"weld_id": 1,
"weld_zone": [
{
"x": 0.43571826538929076,
"y": 0.8623733897661008
},
{
"x": 0.5737182653892907,
"y": 0.8623733897661008
},
{
"x": 0.5737182653892907,
"y": 1
},
{
"x": 0.43571826538929076,
"y": 1
}
]
},
이하생략- 실제예시

-
데이터셋 구축 담당자
수행기관(주관) : 쇼우테크
수행기관(주관) 책임자명 전화번호 대표이메일 담당업무 황강연 이사 070-4454-2476 gyhwang@ishowtech.co.kr 총괄책임, 데이터 정제, 데이터 가공, 데이터 검수, 데이터 품질관리 수행기관(참여)
수행기관(참여) 기관명 담당업무 빌리언이십일 원시데이터(작업환경데이터) 수집, 저작도구 개발 승현아이텍 원시데이터(작업촬영, 작업내용데이터)수집 인제대학교 산학협력단 AI모델 개발 및 학습 현성기업 원시데이터(작업촬영, 작업내용데이터)수집 데이터 관련 문의처
데이터 관련 문의처 담당자명 전화번호 이메일 황강연 070-4454-2476 gyhwang@ishowtech.co.kr 염다정 070-4454-2476 dajy@ishowtech.co.kr AI모델 관련 문의처
AI모델 관련 문의처 담당자명 전화번호 이메일 김경이 055-320-3309 kimky@inje.ac.kr 김영록 055-320-3309 stonedev255@gmail.com 저작도구 관련 문의처
저작도구 관련 문의처 담당자명 전화번호 이메일 유호원 031-341-6114 ghdnjs1541@billion21.com 정수용 031-341-6005 wjdtndyd22@billion21.com
-
인터넷과 물리적으로 분리된 온라인·오프라인 공간으로 의료 데이터를 포함하여 보안 조치가 요구되는 데이터를 다운로드 없이 접근하고 분석 가능
* 온라인 안심존 : 보안이 보장된 온라인 네트워크를 통해 집, 연구실, 사무실 등 어디서나 접속하여 데이터에 접근하고 분석
* 오프라인 안심존 : 추가적인 보안이 필요한 데이터를 대상으로 지정된 물리적 공간에서만 접속하여 데이터에 접근하고 분석 -
- AI 허브 접속
신청자 - 안심존
사용신청신청자신청서류 제출* - 심사구축기관
- 승인구축기관
- 데이터 분석 활용신청자
- 분석모델반출신청자
- AI 허브 접속
-
1. 기관생명윤리위원회(IRB) 심의 결과 통지서 [IRB 알아보기] [공용IRB 심의신청 가이드라인]
2. 기관생명윤리위원회(IRB) 승인된 연구계획서
3. 신청자 소속 증빙 서류 (재직증명서, 재학증명서, 근로계약서 등 택1)
4. 안심존 이용 신청서 [다운로드]
5. 보안서약서 [다운로드]
※ 상기 신청서 및 첨부 서류를 완비한 후 신청을 진행하셔야 정상적으로 절차가 이루어집니다. -
신청 및 이용관련 문의는 safezone1@aihub.kr 또는 02-525-7708, 7709로 문의
데이터셋 다운로드 승인이 완료 된 후 API 다운로드 서비스를 이용하실 수 있습니다.
API 다운로드 파일은 분할 압축되어 다운로드 됩니다. 분할 압축 해제를 위해서는 분할 압축 파일들의 병합이 필요하며 리눅스 명령어 사용이 필요합니다.
리눅스 OS 계열에서 다운로드 받으시길 권장하며 윈도우에서 파일 다운로드 시 wsl(리눅스용 윈도우 하위 시스템) 설치가 필요합니다.
※ 파일 병합 리눅스 명령어
find "폴더경로" -name "파일명.zip.part*" -print0 | sort -zt'.' -k2V | xargs -0 cat > "파일명.zip"
- 해당 명령어 실행 시, 실행 경로 위치에 병합 압축 파일이 생성됩니다.
- 병합된 파일 용량이 0일 경우, 제대로 병합이 되지 않은 상태이니 "폴더경로"가 제대로 입력되었는지 확인 부탁드립니다.
※ 데이터셋 소개 페이지에서 다운로드 버튼 클릭하여 승인이 필요합니다.
오프라인 데이터 이용 안내
본 데이터는 K-ICT 빅데이터센터에서도 이용하실 수 있습니다.
다양한 데이터(미개방 데이터 포함)를 분석할 수 있는 오프라인 분석공간을 제공하고 있습니다.
데이터 안심구역 이용절차 및 신청은 K-ICT빅데이터센터 홈페이지를 참고하시기 바랍니다.

국방데이터 개방 안내
본 데이터는 국방데이터로 군사 보안에 따라 AI허브에서 데이터를 제공하지 않으며,
군 담당자를 통한 별도의 사용 신청이 필요합니다.