※ 24년 신규 개방되는 데이터로, 데이터 활용성 검토, 이용자 관점의 개선의견 수렴 등을 통해 수정/보완될 수 있으며 최종데이터, 샘플데이터, 산출물 등은 변경될 수 있습니다.
-
데이터 변경이력
데이터 변경이력 버전 일자 변경내용 비고 1.0 2024-12-20 데이터 개방 Beta Version 소개
반도체, 디스플레이, 자동차, 의료 등 제조 현장에서 적용 가능한 탄화 예측을 위한 OHT, AGV의 센서 및 열화상 이미지 멀티모달 데이터셋 구축
구축목적
반도체, 디스플레이, 자동차, 의료 등 제조 현장에서 활용되는 온디바이스 AI 기반의 OHT, AGV 장치를 대상으로, 실시간으로 수집하는 데이터를 기반으로 탄화 발생을 사전 예측하고 방지하는 서비스 개발 지원
-
메타데이터 구조표 데이터 영역 제조 데이터 유형 이미지 , 센서 데이터 형식 JSON, CSV, BIN 데이터 출처 자체 수집 라벨링 유형 태깅(Tagging) 라벨링 형식 JSON 데이터 활용 서비스 수요처((주)SFA) 및 제조기업들이 온디바이스 AI 기반의 탄화예측 서비스를 활용하여 제조 현장의 안전성과 생산성을 향상 데이터 구축년도/
데이터 구축량2024년/원천데이터: CSV(센서값) 총 구축량 124,263(1차 개방10.6%:13,121개) / BIN(이미지) 총 구축량 124,263(1차 개방10.6%:13,121개) 라벨링데이터: JSON 총 구축량 124,263set(1차 개방 10.6%:13,121set) 메타데이터: CSV 총 구축량 124,263개(1차 개방 10.7%:13,.121개) -
1. 데이터 구축 규모(총 구축량 124,263세트 : 1차 개방 10.7% 13,121세트)
데이터 구축 규모 구축 데이터 데이터 형식 수량 (건) OHT json 5,948 AGV json 7,173 2. 데이터 분포
전체 파일 규모전체 파일 규모 이송장치 수량 (건) OHT 5,948 AGV 7,173 합계 13,121 다양성(통계)
- 제조사 별 분포제조사 별 분포 비식별화 코드 제조사명 수량 비율 A ㈜에스에프에이 5,948 4.80% B ㈜미르 3,586 2.90% C ㈜씨에이시스템 3,587 2.90% 합계 13,121 10.60% - 이송장치 모델 별 분포
이송장치 모델 별 분포 비식별화 코드 제조사명 수량 비율 A1 OHT-OCS 5,948 4.80% B1 Mir-100 3,586 2.90% C1 저상용 AGV 3,587 2.90% 합계 13,121 10.60% - 이송장치 별 분포
이송장치 별 분포 AGV 1 361 5.03% OHT 1 297 4.99% 2 361 5.03% 2 298 5.01% 3 361 5.03% 3 298 5.01% 4 361 5.03% 4 298 5.01% 5 357 4.98% 5 298 5.01% 6 357 4.98% 6 297 4.99% 7 357 4.98% 7 297 4.99% 8 357 4.98% 8 298 5.01% 9 357 4.98% 9 297 4.99% 10 357 4.98% 10 298 5.01% 11 357 4.98% 11 298 5.01% 12 360 5.02% 12 298 5.01% 13 360 5.02% 13 297 4.99% 14 360 5.02% 14 297 4.99% 15 360 5.02% 15 297 4.99% 16 359 5.00% 16 297 4.99% 17 359 5.00% 17 297 4.99% 18 358 4.99% 18 297 4.99% 19 357 4.98% 19 297 4.99% 20 357 4.98% 20 297 4.99% 합계 7,173 100.00% 합계 5,948 100.00% - OHT 이송장치 별 판별등급 분포
OHT 이송장치 별 판별등급 분포 위험도 상태 수량 비율 정상 상태 1,840세트 30.94% 관심 상태 1,793세트 30.14% 경고 상태 1,805세트 30.35% 위험 상태 510세트 8.57% 합계 5,948세트 100% - AGV 이송장치 별 판별등급 분포
위험도 상태 수량 비율 정상 상태 2,996세트 41.77% 관심 상태 1,817세트 25.33% 경고 상태 1,826세트 25.46% 위험 상태 534세트 7.44% 합계 7,173세트 100% - 판별등급 별 분포
판별등급 별 분포 위험도 상태 수량 비율 정상 상태 4,836세트 3.90% 관심 상태 3,610세트 2.90% 경고 상태 3,631세트 2.90% 위험 상태 1,044세트 0.90% 합계 13,121세트 10.60% -
활용 모델 설명 AI모델 task AI모델(후보) 성능 지표 및 목표값 Data I/O Time Series
ClassificationMMTransformer 1) 분류 목표 성능 Input Output 이상장치 탄화
상태 예측Accuracy
(0.8)OHT, AGV
내부 센서이상장치
상태Macro F1-Score(0.68) 열화상 이미지 [MMTransformer Architecture]
1. MMTransformer 모델은 겨울철 도로 표면 상태를 감지하고 예측하기 위해 Multimodal Transformer 모델을 제안하였으며, 기존 방법들은 고정점 카메라로 촬영한 이미지와 보조 데이터를 단순하게 결합하여 사용하였지만 제안된 방법은 Cross-Attention Mechanism과 Time Series 처리를 통해 Modality 간의 효과적인 통합을 기반으로 발전된 성능을 제시함
- 해당 연구에서는 일본의 많은 지역에서 발생하는 겨울철 도로 표면 상태로 인해 교통사고가 자주 발생하는 것과 기존 디지털 지리 데이터를 기반으로 한 예측, 차량 장착 카메라로 촬영한 이미지 기반 등을 통한 연구의 한계점을 제시함
- 학습에 사용된 데이터는 2017년부터 2019년까지의 동부 일본 고속도로 회사에서 제공한 도로 표면 이미지를 사용하였으며, 각 이미지에는 건조, 습기, 검은 셔벗, 흰 셔벗, 눈, 압축된 눈, 얼음으로 7개의 라벨이 지정됨
- 보조 데이터의 경우 온도, 도로 온도, 강성량, 교통량 및 차량 속도 등이 포함된 시계열 데이터로 구성됨
- 제시된 MMTransformer 모델은 ViT(Vision Transformer)와 MLP(Multi Layer Perceptron)으로 구성됨
- 이미지 데이터의 특징 추출을 위해 ImageNet 데이터가 사전 학습된 ViT 모델에 이미지를 패치 단위로 나누어 위치 임베딩과 함께 입력하여 Transformer 인코더를 통해 특징을 추출함
- 시계열 데이터의 특징 추출을 위해 연속형 데이터는 그대로 입력하고, 명목형 데이터는 One-Hot Encoding 및 Soft Label Encoding 방식을 통해 특징을 추출함
- 각각의 Modality를 결합하기 위해 Cross-Attention Mechanism을 통해 이미지와 시계열 데이터의 특징을 여러 시점에 걸친 입력 데이터의 상관성을 고려하여 특징을 통합
- 여러 시점에 걸친 도로 표면 상태 변화를 고려하여, 각 시점의 데이터를 입력하여 Cross-Attention Mechanism을 통해 결합된 특징을 MLP에 입력하여 최종 예측을 수행함
- 동부 일본 고속도로에서 제공한 데이터를 기반으로 제시된 모델 성능 평가를 수행하여 Accuracy(0.95)/Macro F1-Score(0.75)로 TSC 기반 모델에서 SOTA 성능을 달성
- 제시된 SOTA 모델을 기반으로 본 과제의 데이터 유효성 검증을 위한 성능지표와 성능치를 산정함 Accuracy(0.80)/Macro F1-Score(0.68) -
o 데이터 구성
탄화 예측 모델의 예측 정확도를 개선하기 위해 산업 현장과 동일한 환경으로 구성된 Test-bed에서 수집된 OHT ,AGV 센서값 및 열화상 이미지 정보를 세트(Set)로 구성 (1SET = 8유형의 센서값 데이터와 열화상 이미지 1장으로 구성)
※ 정상, 관심, 경고, 위험등급 데이터는 모사시스템에서 수집
ㅇ (총 구축 수량) 124,263개 세트(1차 개방 10.7%:13,238개 세트)
- OHT, AGV 판별 등급별 분포OHT, AGV 판별 등급별 분포 데이터명 category_2 (판별 종류) 구축수량 파일수) 비율(%) 제조현장 이송장치의 열화 예지보전 멀티모달 데이터 정상 60,100 48.40% 관심 27,299 21.90% 경고 27,467 22.10% 위험 9,397 7.60% 합계(센서값+이미지 SET) 124,263 100% - 측정 대상별 분포
측정 대상별 분포 데이터명 Category_1 수집대상 구축수량(파일수) 비율(%) 제조현장 이송장치의 열화 예지보전 멀티모달 데이터 OHT 73,733 59.30% AGV 50,530 40.70% 합계(센서값+이미지 SET) 124,263개 세트 100% • OHT 속성 데이터(JSON) *AGV 동일
{
"meta_info": [
{
"device_id": "oht01",
"device_manufacturer": "A",
"device_name": "A1",
"dust_sensor_manufacturer": "S01",
"dust_sensor_name": "S02",
"temp_sensor_manufacturer": "S09",
"temp_sensor_name": "S10",
"overcurrent_sensor_manufacturer": "S17",
"overcurrent_sensor_name": "S18",
"thermal_camera_sensor_manufacturer": "S25",
"thermal_camera_sensor_name": "S26",
"installation_environment": "테스트베드",
"collection_date": "08-26",
"collection_time": "20:29:01",
"duration_time": "1",
"sensor_types": "NTC, PM10, PM2.5, PM1.0, CT1, CT2, CT3, CT4",
"cumulative_operating_day": "18",
"equipment_history": "13",
"img-id": "oht01_0826_202901",
"location": "oht/01/",
"filename": "oht01_0826_202901.json",
"img_name": "oht01_0826_202901.bin",
"img_description": "oht01의 현재 내부 온도(최대값)"
}
],
"sensor_data": [
{
"PM10": [
{
"data_unit": "µg/m3",
"value": 10.0,
"trend": "1"
}
],
"PM2.5": [
{
"data_unit": "µg/m3",
"value": 12.0,
"trend": "1“
}
],
"PM1.0": [
{
"data_unit": "µg/m3",
"value": 20.0,
"trend": "1"
}
],
"NTC": [
{
"data_unit": "℃",
"value": 27.1,
"trend": "1"
}
],
"CT1": [
{
"data_unit": "A",
"value": 2.0,
"trend": "1"
}
],
"CT2": [
{
"data_unit": "A",
"value": 1.38,
"trend": "1"
}
],
"CT3": [
{
"data_unit": "A",
"value": 0.3,
"trend": "1"
}
],
"CT4": [
{
"data_unit": "A",
"value": 0.38,
"trend": "1"
}
]
}
],
"ir_data": [
{
"temp_max": [
{
"value_TGmx": 43.67,
"X_Tmax": 11.0,
"Y_Tmax": 85.0
}
]
}
],
"annotations": [
{
"tagging": [
{
"annotation_type": "tagging",
"state": "0"
}
]
}
],
"external_data": [
{
"ex_temperature": [
{
"data_unit": "℃",
"value": 23.0,
"trend": "1"
}
],
"ex_humidity": [
{
"data_unit": "%",
"value": 35.0,
"trend": "1"
}
],
"ex_illuminance": [
{
"data_unit": "lux",
"value": 528.0,
"trend": "1"
}
]
}
]
}- 어노테이션 구성
어노테이션 구성 구분 속성명 타입 필수여부 설명 범위 비고 1 meta_info 1-1 device_id string 필수 설치 장비 식별자 01-20 1-2 device_manufacturer string 필수 수집대상장비 제조사 A,B,C SFA(A), ㈜미르(B), ㈜씨에이시스템(C) 1-3 device_name string 필수 수집대상 장비모델명 A1,B1,C1 OHT-OCS(A1), Mri-100(B1) , 저상용 AGV(C1) 1-4 dust_sensor_manufacturer string 필수 미세먼지센서 제조사 S01, S03, S05, S07 Sharp(S01),Sensirion(S03),Shinyei(S05),Winsen(S07) 1-5 dust_sensor_name string 필수 미세먼지센서 모델명 S02, S04, S06, S08 GP2Y1014AU0F(S02),SPS30(S04),PPD42S(S06),ZH03(S08) 1-6 temp_sensor_manufacturer string 필수 온도센서 제조사 S09, S11, S13, S15 Vishay(S09),Samkyung(S11),TEWA(S13),Cantherm(S15) 1-7 temp_sensor_name string 필수 온도센서 모델명 S10, S12, S14, S16 NTCLE413(S10),NTC-103 F343F(S12),TT7-50KC3-3(S14),MF52(S16) 1-8 overcurrent_sensor_manufacturer string 필수 전류센서 제조사 S17, S19, S21, S23 KEMET(S17),CR MAGENETICS(S19),Talema(S21),TDK(S23) 1-9 overcurrent_sensor_name string 필수 전류센서 모델명 S18, S20, S22, S24 CT-06(S18),CR8400(S20),Az-0500(S22),CCT406393(S24) 1-10 thermal_camera_sensor_manufacturer string 필수 열화상카메라센서 제조사 S25, S27, S29, S31 TeraRanger(S25),Panasonic(S27),Meridian Innovation(S29),Melexis (S31) 1-11 thermal_camera_sensor_name string 필수 열화상카메라센서 모델명 S26, S28, S30, S32 Evo Thermal 33(S26),Grid-EYE AMG88(S28),MI0801(S30), MLX90640(S32) 1-12 installation_environment string 선택 구축환경 테스트베드 테스트베드 1-13 collection_date string 선택 수집날짜 08월27일 1-14 collection_time string 선택 수집시간 2:23:24 1-15 duration_time number 선택 수집기간 1-300 1-16 sensor_types string 필수 센서유형 1-17 cumulative_operating_day number 선택 누적가동일 1-50 1-18 equipment_history number 선택 장비이력 0-20 1-19 img-id string 필수 이미지 설명 16_0827_022324 1-20 location string 필수 저장 위치 oht16 1-21 filename string 필수 json 파일 이름 oht16_0827_022324.json 1-22 img_name string 필수 이미지 설명 oht16_0827_022324.bin 1-23 img_description number 필수 현재 상태 0이상 oht16의 현재 내부 온도(최대값) 2 sensor_data 2-1 PM10, PM2.5 PM1.0 number 필수 미세먼지 측정값 1-1000 µg/m3 2-2 NTC number 필수 온도 측정값 0-200 ℃ 2-3 CT1, CT2, CT3, CT4 number 필수 전류 측정값 0-200 A 3 ir_data 3-1 temp_max number 필수 열화상 이미지 최고 온도, X/Y좌표 4 annotations 4-1 annotations_type string 필수 태깅 4-2 state number 필수 0:정상, 1:관심, 2:경고, 3:위험 0-3 5 external_data 5-1 ex_temperature number 필수 외부온도 22-27 ℃ 5-2 ex_temperature number 필수 습도 27.5-37.2 % 5-3 ex_illuminance number 필수 조도 151-531 lux -
데이터셋 구축 담당자
수행기관(주관) : 에이치씨아이플러스㈜
수행기관(주관) 책임자명 전화번호 대표이메일 담당업무 정승필 02-6925-0325 jsp8882@hciplus.kr 총괄기획 / 데이터 수집, 가공 / 품질 수행기관(참여)
수행기관(참여) 기관명 담당업무 ㈜엔티시소프트 수집 및 획득 가이드라인 작성 제주대학교 산학협력단 데이터 정제 ㈜케이솔루션즈 AI 모델 개발 데이터 관련 문의처
데이터 관련 문의처 담당자명 전화번호 이메일 정승필 02-6925-0325 jsp8882@hciplus.kr AI모델 관련 문의처
AI모델 관련 문의처 담당자명 전화번호 이메일 이재건 02-6415-2236 jg.lee@ksolution.kr 저작도구 관련 문의처
저작도구 관련 문의처 담당자명 전화번호 이메일 정승필 02-6925-0325 jsp8882@hciplus.kr
-
인터넷과 물리적으로 분리된 온라인·오프라인 공간으로 의료 데이터를 포함하여 보안 조치가 요구되는 데이터를 다운로드 없이 접근하고 분석 가능
* 온라인 안심존 : 보안이 보장된 온라인 네트워크를 통해 집, 연구실, 사무실 등 어디서나 접속하여 데이터에 접근하고 분석
* 오프라인 안심존 : 추가적인 보안이 필요한 데이터를 대상으로 지정된 물리적 공간에서만 접속하여 데이터에 접근하고 분석 -
- AI 허브 접속
신청자 - 안심존
사용신청신청자신청서류 제출* - 심사구축기관
- 승인구축기관
- 데이터 분석 활용신청자
- 분석모델반출신청자
- AI 허브 접속
-
1. 기관생명윤리위원회(IRB) 심의 결과 통지서 [IRB 알아보기] [공용IRB 심의신청 가이드라인]
2. 기관생명윤리위원회(IRB) 승인된 연구계획서
3. 신청자 소속 증빙 서류 (재직증명서, 재학증명서, 근로계약서 등 택1)
4. 안심존 이용 신청서 [다운로드]
5. 보안서약서 [다운로드]
※ 상기 신청서 및 첨부 서류를 완비한 후 신청을 진행하셔야 정상적으로 절차가 이루어집니다. -
신청 및 이용관련 문의는 safezone1@aihub.kr 또는 02-525-7708, 7709로 문의
데이터셋 다운로드 승인이 완료 된 후 API 다운로드 서비스를 이용하실 수 있습니다.
API 다운로드 파일은 분할 압축되어 다운로드 됩니다. 분할 압축 해제를 위해서는 분할 압축 파일들의 병합이 필요하며 리눅스 명령어 사용이 필요합니다.
리눅스 OS 계열에서 다운로드 받으시길 권장하며 윈도우에서 파일 다운로드 시 wsl(리눅스용 윈도우 하위 시스템) 설치가 필요합니다.
※ 파일 병합 리눅스 명령어
find "폴더경로" -name "파일명.zip.part*" -print0 | sort -zt'.' -k2V | xargs -0 cat > "파일명.zip"
- 해당 명령어 실행 시, 실행 경로 위치에 병합 압축 파일이 생성됩니다.
- 병합된 파일 용량이 0일 경우, 제대로 병합이 되지 않은 상태이니 "폴더경로"가 제대로 입력되었는지 확인 부탁드립니다.
※ 데이터셋 소개 페이지에서 다운로드 버튼 클릭하여 승인이 필요합니다.
오프라인 데이터 이용 안내
본 데이터는 K-ICT 빅데이터센터에서도 이용하실 수 있습니다.
다양한 데이터(미개방 데이터 포함)를 분석할 수 있는 오프라인 분석공간을 제공하고 있습니다.
데이터 안심구역 이용절차 및 신청은 K-ICT빅데이터센터 홈페이지를 참고하시기 바랍니다.