-
데이터 변경이력
데이터 변경이력 버전 일자 변경내용 비고 1.1 2023-12-15 데이터 최종 개방 1.0 2023-06-07 데이터 개방(Beta Version) 데이터 히스토리
데이터 히스토리 일자 변경내용 비고 2024-01-05 산출물 전체 공개 소개
□ 제조업 노동자 근골격계 부담요인 예방을 위한 인공지능 데이터 구축 □ ‘제조업 부담작업 유해요인 실시간 예측 서비스’의 AI모델 학습에 필요한 노동자 작업자세(자세정보, 각도·위치정보, 부가정보) 인공지능 학습 데이터 구축
구축목적
□ 제조업 생산현장 노동자의 작업환경을 개선하고 각종 직업적인 근골격계 질병을 사전에 예방함으로서 노동자의 노동 생산성을 높이기 위함 □ 노동자 작업자세를 실시간으로 분석함으로써 인간공학기반 근골격계 부담요인의 자동 분석·평가·개선을 지원
-
메타데이터 구조표 데이터 영역 영상이미지 데이터 유형 이미지 데이터 형식 jpg 데이터 출처 자체 수집 라벨링 유형 바운딩박스(이미지), 키포인트(이미지) 라벨링 형식 JSON 데이터 활용 서비스 제조업 사업장 노동자의 근무환경을 개선하기 위한 SW 및 서비스 개발에 활용, 작업 위해요인 평가도구 데이터 구축년도/
데이터 구축량2022년/□ 이미지 데이터(120,000장) □ 어노테이션: 바운딩박스, 관절 키포인트 27개 포인트, 작업자세정보 5종, 작업부가정보 14종 -
1. 데이터 구축 규모
노동자 이미지 데이터: 120,000장
1. 데이터 구축 규모 데이터 구분 데이터 종류 파일포맷 데이터 규모 합계 원천데이터 이미지 이미지(JPG) 120,000장 120,000장 라벨링데이터 이미지 텍스트(JSON) 120,000건 120,000건 2. 데이터 분포
2. 데이터 분포 번호 작업 공정 데이터 분포(%) 비고 1 절단 공정 13.42 철제 등, 제품, 재료 분리 2 벤딩 공정 1.05 파이프에 대한 벤딩 작업 3 사상1 공정 4.34 선박 부품에 대한 사항 4 사상2 공정 2.79 선형 철구조물 사상 5 사상3 공정 2.79 안전 지지대에 대한 사상 6 사상4 공정 3.01 사다리 부품에 대한 사상 7 사상5 공정 2.88 앵글 부품에 대한 사상 8 사상6 공정 13.88 철구조물 사상 9 용접1 공정 2.28 기구물에 대한 용접 10 용접2 공정 6.85 선박부품에 대한 용접 11 용접3 공정 2.15 소형 철구조물에 대한 용접 12 용접4 공정 9.86 선철 주조물에 대한 용접 13 도색 공정 0.55 철제 선반 도색 작업 14 조립 공정 9.5 밸브에 대한 조립 작업 15 가공 공정 6.39 밸브 및 간판 가공 16 주조 공정 13.38 주조 및 몰딩틀 제작 17 선별 공정 4.66 선별 작업 합계 100 -
-
AI 모델 상세 설명서 다운로드
AI 모델 상세 설명서 다운로드 AI 모델 다운로드1. AI 모델 설명
1.1. 객체 탐지 모델
- 입력 이미지에서 작업자를 찾는 객체 탐지 모델로 YOLO v5선정
- 객체 탐지 알고리즘로서 대중적으로 많이 사용되며, 다른 AI 모델보다 접근성·범용성 및 성능이 뛰어남
- YOLO v5는 v4에 비해 낮은 용량과 빠른 속도를 가지며, 가장 큰 특징으로는 Darknet이 아닌 PyTorch로 구현하여 범용 개발 환경을 제공함1.2. 관절 위치 추론 모델
- 입력 영상의 크기를 줄이지 않고 처리하여 고해상도 표현을 유지할 수 있는 HR-net 선정
- 작업자의 손과 같은 작은 부위를 검출하기에 적합하며, COCO 데이터셋의 벤치마크 중 SOTA 유지 중인 모델1.3. 작업 자세 분류 모델
- NAS(Neural Architecture Search)를 통해 설계한 새로운 Baseline 네트워크이며, 기존의 이미지 분류모델보다 훨씬 적은 파라미터로 좋은 성능을 내는 알고리즘인 EfficientNet 선정
- Student 모델의 Loss를 Teacher 모델에 추가 학습이 가능하며, 이를 통해 더 좋은 성능을 끌어냄2. 활용 서비스 예시
- 본 사업을 통해 구축된 데이터는 근골격계 부담요인 분석을 위한 인공지능 서비스 데이터로 활용 가능
- 제조업 현장에서 실제로 적용 가능한 서비스로 확대될 수 있고, 근무환경 개선 등 안전한 일자리를 위해 활용될 수 있음 -
데이터 성능 점수
측정값 (%)기준값 (%)데이터 성능 지표
데이터 성능 지표 번호 측정항목 AI TASK 학습모델 지표명 기준값 점수 측정값 점수 1 작업 자세 분류 정확성 Image Classification EfficientNet b3 Accuracy 70 % 83.18 % 2 작업 자세 관절 추론 정확성 Pose Estimation dite-HRNet AP@IoU 0.5 80 % 88.96 % 3 작업 객체 탐지 정확성 Object Detection YOLO v5 mAP@IoU 0.5 90 % 99.5 %
※ 데이터 성능 지표가 여러 개일 경우 각 항목을 클릭하면 해당 지표의 값이 그래프에 표기됩니다.
※ AI모델 평가 지표에 따라 측정값의 범위, 판단 기준이 달라질 수 있습니다. (ex. 오류율의 경우, 낮을수록 좋은 성능을 내는 것으로 평가됩니다)
-
설명서 및 활용가이드 다운로드
데이터 설명서 다운로드 구축활용가이드 다운로드1. 데이터 소개
□ 근골격계 부담요인 분석을 위한 인공지능 데이터 구축: 제조업 생산현장 노동자의 작업 환경을 개선하고 각종 직업적인 근골격계 질병을 사전에 예방함으로써 노동자의 노동 생산성을 높이기 위함
□ ‘제조업 부담작업 유해요인 실시간 예측 서비스’의 AI모델 학습에 필요한 노동자 작업 자세(자세정보, 각도·위치정보, 부가정보) 인공지능 학습 데이터 구축: 노동자 작업자세를 실시간으로 분석함으로써 인간공학기반 근골격계 부담요인의 자동 분석·평가·개선을 지원
□ 모델 임무 유형: 작업자 탐지 및 관절 추론, 작업 자세 분류
□ 어노테이션: 바운딩박스(노동자 전신), 키포인트 추론(사진 내 노동자 관절), 관절 꺾임 각도 · 관절 각도에 따른 평가 지표(점수)
2. 데이터 포맷
2. 데이터 포맷 데이터 구분 유형 포맷 원천데이터 이미지 데이터 jpg 학습데이터 라벨링 데이터 json 구분 원천데이터 최종데이터 데이터 형태 동영상 → 스틸 컷 디지털 파일 형태로 산출 (디지털 파일 → 디지털 파일) 데이터 포멧 □ 데이터포맷 : jpg파일
□ 해상도
: 작업자이미지 (3840 : 2160) 픽셀
□ 데이터포맷 : jpg파일
□ 해상도
: 이미지 (3840 : 2160) 픽셀
□ 가공데이터 : JSON3. 데이터 예시
□ 원천데이터 : 노동자 작업 이미지
□ 키포인트 라벨링 샘플
□ 작업 자세 라벨링 기준
□ 작업 자세 라벨링 샘플
4. 어노테이션 포맷
4. 어노테이션 포맷 No. 속성명 항목 설명 타입 필수 작성예시 여부 1 images 이미지 정보 list 필수 1-1 id 식별자 number 필수 0 1-2 images[].id 이미지 식별자 number 필수 2034040 1-3 images[].file_name 이미지 파일명 string 필수 F01_P003_A1_D2021-10-01-11-23-14_001.JPG 1-4 images[].width 이미지 너비 number 필수 1920 1-5 images[].height 이미지 높이 number 필수 1080 1-6 images[].date_caputred 취득시간 datetime 필수 2021-09-01 10:22 1-7 images[].camera_angle 카메라 구도 string 필수 A1 2 annotations 라벨링 list 필수 2-1 annotations[].id 어노테이션ID number 필수 1 2-2 annotations[].image_id 이미지 식별자 매칭 number 필수 2034040 2-3 annotations[].factory_no 작업장/사업장 number 필수 1 2-4 annotations[].process_id 작업공정 number 필수 1 2-5 annotations[].bbox 작업자 인식 list 필수 [1, 2, 3, 4] 2-6 annotations[].keypoints 키포인트 수 list 필수 [1, 2, 3, 4, 5, 6, 7, 8, 9 ... , 81, 82, 83] 2-7 annotations[].POSTURE 작업자세 동작정보 list 필수 2-7-1 annotations[].POSTURE.neck 목 enum 선택 3 2-7-2 annotations[].POSTURE.trunk 허리 enum 필수 1 2-7-3 annotations[].POSTURE.legs 다리 enum 선택 2 2-8 annotations[].ADJUST 작업자세 부가정보 list 필수 2-8-1 annotations[].ADJUST.neck 목 부가정보 list 선택 2-8-1-1 annotations[].ADJUST.neck.twisted 목 비틀림 여부 boolean 선택 FALSE 2-8-1-2 annotations[].ADJUST.neck.bending 목 굽혀짐 여부 boolean 선택 TRUE 2-8-2 annotations[].ADJUST.trunk 허리 부가정보 list 선택 2-8-2-1 annotations[].ADJUST.trunk.twisted 허리 비틀림 여부 boolean 선택 FALSE 2-8-2-2 annotations[].ADJUST.trunk.bending 허리 옆으로 구부림 여부 boolean 선택 TRUE 2-8-2-3 annotations[].ADJUST.trunk.supported 허리 지지됨 여부 boolean 선택 FALSE 2-8-3 annotations[].ADJUST.legs 다리 부가정보 list 선택 2-8-3-1 annotations[].ADJUST.legs.supprted 다리 지지됨 여부 boolean 선택 TRUE 2-8-4 annotations[].ADJUST.upper_arm 위팔 부가정보 list 선택 2-8-4-1 annotations[].ADJUST.upper_arm.abduction 위팔 벌어짐 여부 boolean 선택 FALSE 2-8-4-2 annotations[].ADJUST.upper_arm.raised 어깨 들림 boolean 선택 TRUE 2-8-4-3 annotations[].ADJUST.upper_arm.supported 위팔 지지됨 여부 boolean 선택 FALSE 2-8-4-4 annotations[].ADJUST.upper_arm.across 위팔 교차됨 여부 boolean 선택 TRUE 2-8-5 annotations[].ADJUST.lower_arm 아래팔 부가정보 list 선택 2-8-5-1 annotations[].ADJUST.lower_arm.outbody 팔 몸통을 벗어남 여부 boolean 선택 FALSE 2-8-6 annotations[].ADJUST.wrist 손목 부가정보 list 선택 2-8-6-1 annotations[].ADJUST.wrist.bent 손목 옆으로 굽혀짐 boolean 선택 TRUE 2-8-6-2 annotations[].ADJUST.wrist.twisted 손목 비틀림 여부 boolean 선택 FALSE 2-8-6-3 annotations[].ADJUST.wrist.twisted_end 손목 운동범위 끝에서 비틀림 boolean 선택 TRUE -
데이터셋 구축 담당자
수행기관(주관) : 에이치엔아이엔씨(주)
수행기관(주관) 책임자명 전화번호 대표이메일 담당업무 김진형 070-7204-9246 empir@hncorp.world 총괄 책임 수행기관(참여)
수행기관(참여) 기관명 담당업무 ㈜글로비트 데이터 라벨링, 크라우드 소싱 에스티리서치㈜ 데이터 라벨링 부산시기계공업협종조합 데이터제공 나사렛대학교 산학협력단 데이터 정제 동의대학교 산학협력단 인공지능 모델 개발 및 검증 데이터 관련 문의처
데이터 관련 문의처 담당자명 전화번호 이메일 김진형 070-7204-9246 empir@hncorp.world
-
인터넷과 물리적으로 분리된 온라인·오프라인 공간으로 의료 데이터를 포함하여 보안 조치가 요구되는 데이터를 다운로드 없이 접근하고 분석 가능
* 온라인 안심존 : 보안이 보장된 온라인 네트워크를 통해 집, 연구실, 사무실 등 어디서나 접속하여 데이터에 접근하고 분석
* 오프라인 안심존 : 추가적인 보안이 필요한 데이터를 대상으로 지정된 물리적 공간에서만 접속하여 데이터에 접근하고 분석 -
- AI 허브 접속
신청자 - 안심존
사용신청신청자신청서류 제출* - 심사구축기관
- 승인구축기관
- 데이터 분석 활용신청자
- 분석모델반출신청자
- AI 허브 접속
-
1. 기관생명윤리위원회(IRB) 심의 결과 통지서 [IRB 알아보기] [공용IRB 심의신청 가이드라인]
2. 기관생명윤리위원회(IRB) 승인된 연구계획서
3. 신청자 소속 증빙 서류 (재직증명서, 재학증명서, 근로계약서 등 택1)
4. 안심존 이용 신청서 [다운로드]
5. 보안서약서 [다운로드]
※ 상기 신청서 및 첨부 서류를 완비한 후 신청을 진행하셔야 정상적으로 절차가 이루어집니다. -
신청 및 이용관련 문의는 safezone1@aihub.kr 또는 02-525-7708, 7709로 문의
데이터셋 다운로드 승인이 완료 된 후 API 다운로드 서비스를 이용하실 수 있습니다.
API 다운로드 파일은 분할 압축되어 다운로드 됩니다. 분할 압축 해제를 위해서는 분할 압축 파일들의 병합이 필요하며 리눅스 명령어 사용이 필요합니다.
리눅스 OS 계열에서 다운로드 받으시길 권장하며 윈도우에서 파일 다운로드 시 wsl(리눅스용 윈도우 하위 시스템) 설치가 필요합니다.
※ 파일 병합 리눅스 명령어
find "폴더경로" -name "파일명.zip.part*" -print0 | sort -zt'.' -k2V | xargs -0 cat > "파일명.zip"
- 해당 명령어 실행 시, 실행 경로 위치에 병합 압축 파일이 생성됩니다.
- 병합된 파일 용량이 0일 경우, 제대로 병합이 되지 않은 상태이니 "폴더경로"가 제대로 입력되었는지 확인 부탁드립니다.
※ 데이터셋 소개 페이지에서 다운로드 버튼 클릭하여 승인이 필요합니다.