AI-Hub

신체 말단 움직임 영상

분야영상이미지
유형 비디오

구축년도 : 2020 갱신년월 : 2023-03 조회수 : 8,176 다운로드 : 556 용량 :

샘플 데이터

※샘플데이터는 데이터의 이해를 돕기 위해 별도로 가공하여 제공하는 정보로써 원본 데이터와 차이가 있을 수 있으며,
데이터에 따라서 민감한 정보는 일부 마스킹(*) 처리가 되어 있을 수 있습니다.

소개 파일 목록 (API 다운로드)

※ 내국인만 데이터 신청이 가능합니다.

문의하기 목록

데이터 변경이력

데이터 변경이력
버전	일자	변경내용
1.3	2023-03-31	원천데이터 수정
1.2	2021-12-01	데이터 추가 개방
1.1	2021-08-30	데이터 품질 보완
1.0	2021-06-30	데이터 최초 개방

데이터 히스토리

데이터 히스토리
일자	변경내용	비고
2025-04-03	구축업체정보 수정
2022-10-13	신규 샘플데이터 개방

소개

3D hand pose와 lip reading을 추정하는 AI개발을 위한 신체말단(손, 입술) 영상 데이터

- 데이터 영역 : 영상이미지

- 데이터 유형 : 비디오

- 구축년도 : 2020년

- 구축량 : 15만

구축목적

다양한 동작의 신체 말단(손, 입술) 움직임 데이터로부터 손 자세 및 발화단어를 도출해낼 수 있도록 인공지능을 훈련하기 위한 데이터셋

구축 내용 및 제공 데이터량

손 데이터

- 다양한 성별과 나이로 구성된 209명의 배우로부터 72개의 동작 데이터를 직접 촬영 방식으로 획득

- 2D 영상 50만 장, 3D 모델 10만 개, 3D 손 자세 10만 개, 손 영역 50만 개로 구성되어 있음

신체 말단 움직임 영상-구축내용표-1
데이터 종류	2D 영상	3D 모델	3D 손 자세	손 영역
분량	500,000장	100,000개	100,000개	500,000개
데이터 구성	Full-HD 영상,카메라파라미터	30K 이상 polygon	21개 관절 위치	6영역 depth 영상 분할
데이터 포맷	jpg	obj 파일 포맷	json 파일 포맷	json 파일 포맷

입술데이터

- 다양한 성별과 나이로 구성된 200명의 배우로부터 1,000개의 단어 발화 영상에 대한 입술 움직임 데이터를 직접 촬영 방식으로 획득

- 2D 영상 50만 장, 3D 모델 10만 개, 2D 입술 키포인트 50만 개로 구성되어 있음

신체 말단 움직임 영상-구축내용표-2
데이터 종류	2D 영상	2D 입술 데이터	3D 모델
분량	500,000개	500,000개	100,000개
데이터 구성	Full-HD 영상, 카메라 파라미터	24개 입술 특징 위치 (x, y)	3K 이상 Polygon
데이터 포맷	mp4 파일 포맷	json 파일 포맷	obj 파일 포맷

저작도구 설명서 및 저작도구 다운로드
저작도구 설명서 다운로드 저작도구 다운로드
AI 모델 상세 설명서 다운로드
AI 모델 다운로드

데이터 성능 점수

측정값 (%)

기준값 (%)

데이터 성능 지표

데이터 성능 지표
번호	측정항목	AI TASK	학습모델	지표명	기준값 점수	측정값 점수
1	손 데이터 - 3D 관절 유효성	Pose Estimation	RootNet, H3Net	MPJPE	18 mm	17.8 mm
2	손 데이터 - 2D 관절 유효성	Pose Estimation	RootNet, H3Net	PCK	75 %	94 %
3	입술 데이터 - 2D 관절 유효성	Pose Estimation	ResNet-18	RMSE	0.1 mm	0.017 mm
4	입술 데이터 - 단어 정확도	Estimation	Inception v4	WER	10 %	3.5 %

※ 데이터 성능 지표가 여러 개일 경우 각 항목을 클릭하면 해당 지표의 값이 그래프에 표기됩니다.

※ AI모델 평가 지표에 따라 측정값의 범위, 판단 기준이 달라질 수 있습니다. (ex. 오류율의 경우, 낮을수록 좋은 성능을 내는 것으로 평가됩니다)

설명서 및 활용가이드 다운로드

데이터 설명서 다운로드 구축활용가이드 다운로드

데이터 변경이력

신체 말단 움직임 영상-데이터변경이력
버전	일자	변경내용
1.2	2021.12.01	데이터 추가 개방
1.1	2021.08.30	데이터 품질 보완
1.0	2021.06.30	데이터 최초 개방

구축목적

다양한 동작의 신체 말단(손, 입술) 움직임 데이터로부터 손 자세 및 발화단어를 도출해낼 수 있도록 인공지능을 훈련하기 위한 데이터셋

활용 분야

손의 움직임을 이용하는 커뮤니케이션 서비스 및 UI
시각장애인을 위한 독순술 및 입술 형태로 추정 가능한 커뮤니케이 션 서비스 및 UI

소개

본 과제는 손과 입술의 신체 말단의 움직임 영상에 대한 데이터 셋을 구축 하여 손 제스처, 정교한 악기 연주 모션, 독순술 등 VR, AR,MR 등 기반 산업, 3D 엔터테인먼트 산업, 재활 치료 및 질병 예방 등의 의료분야, 장애 인 복지 사업 등에서 활용할 수 있도록 하는 것을 목적으로 함

구축 내용 및 제공 데이터량

손 데이터

- 다양한 성별과 나이로 구성된 209명의 배우로부터 72개의 동작 데이터를 직접 촬영 방식으로 획득

- 2D 영상 50만 장, 3D 모델 10만 개, 3D 손 자세 10만 개, 손 영역 50만 개로 구성되어 있음

신체 말단 움직임 영상-구축내용표-1
데이터 종류	2D 영상	3D 모델	3D 손 자세	손 영역
분량	500,000장	100,000개	100,000개	500,000개
데이터 구성	Full-HD 영상,카메라파라미터	30K 이상 polygon	21개 관절 위치	6영역 depth 영상 분할
데이터 포맷	jpg	obj 파일 포맷	json 파일 포맷	json 파일 포맷

입술데이터

- 다양한 성별과 나이로 구성된 200명의 배우로부터 1,000개의 단어 발화 영상에 대한 입술 움직임 데이터를 직접 촬영 방식으로 획득

- 2D 영상 50만 장, 3D 모델 10만 개, 2D 입술 키포인트 50만 개로 구성되어 있음

신체 말단 움직임 영상-구축내용표-2
데이터 종류	2D 영상	2D 입술 데이터	3D 모델
분량	500,000개	500,000개	100,000개
데이터 구성	Full-HD 영상, 카메라 파라미터	24개 입술 특징 위치 (x, y)	3K 이상 Polygon
데이터 포맷	mp4 파일 포맷	json 파일 포맷	obj 파일 포맷

대표도면

신체 말단 움직임 영상- 대표도면

필요성

사람 동작을 이용한 커뮤니케이션 시 표정과 함께 가장 많이 사용되는 신체 부분이 손이므로 손과 입을 이용한 제스처 데이터셋 확보는 우리나라 AI 기술 연구 및 산업 확장에 큰 부분을 이바지할 것으로 예상함
신체 말단을 이용한 제스처 데이터는 주로 외국인을 대상으로 수집 및 공개가 된 경우가 많기에, 한국인을 대상으로 데이터를 수집하고, 우리나라 환경에 맞춰 구조를 설계하는 일련의 과정에 대한 노력이 필요함
독순술 및 수어 등 관련 데이터 셋을 확보하여 인공지능 기술과 결합한 연구개발 인프라를 구축하고, 연구·개발한 결과를 적용한 기술 및 서비스를 사회적 약자인 장애인들에게 보급하는 사회보장 정책이 필요함

데이터 구조

데이터 구성

1. 손 데이터

신체 말단 움직임 영상-데이터구조표-1
데이터 구성 형태			파일명 규칙
경로(폴더명)	포멧	데이터 종류	파일명 규칙
라벨링 데이터
┣Annotations		라벨링 데이터	■ JSON 파일(Keypoint) (action_id)_(actor_id)_(camera_id)_(hand_type)_(frame_idx).json ⋅ action_id = 동작별 고유 ID 값 ⋅ actor_id = 모델 고유 ID 값 ⋅ camera_id = 카메라 ID ⋅ hand_type = 오른손 or 왼손 or 양손 ⋅ frame_idx = 추출 이미지 프레임 번호 ■ JSON 파일(Segmentation) (action_id)_(actor_id)_(camera_id)_(hand_type)_(seg_id)_(frame_idx).json ⋅ action_id = 동작별 고유 ID 값 ⋅ actor_id = 모델 고유 ID 값 ⋅ camera_id = 카메라 ID ⋅ hand_type = 오른손 or 왼손 or 양손 ⋅ seg_id = segmentation ID ⋅ frame_idx = 추출 이미지 프레임 번호
┣Action[n]_Actor[k]
┣Camera[1~8]
┣Keypoint	json
┣Segmentation[1]	json
┣Segmentation[2]	json
┣Segmentation[3]	json
┣Segmentation[4]	json
원천데이터
┣Images		이미지	■ JPG 파일 (action_id)_(actor_id)_(camera_id)_(hand)_(frame_idx).jpg ⋅ action_id = 동작별 고유 ID 값 ⋅ actor_id = 모델 고유 ID 값 ⋅ camera_id = 카메라 ID ⋅ hand = 오른손 or 왼손 or 양손 ⋅ frame_idx = 추출 이미지 프레임 번호
┣Action[n]_Actor[k]
┗Camera[1~8]
┗Mesh		메쉬	■ OBJ 파일 (action_id)_(actor_id)_(image_id).obj ⋅ ex) 001_M255_0135465.obj ■ 텍스쳐 파일 (action_id)_(actor_id)_(image_id).jpg ⋅ ex) 001_M255_0135465.jpg
┗Action[n]_Actor[k]	obj, jpg	메쉬

2. 입술

신체 말단 움직임 영상-데이터구조표-2
데이터 구성 형태			파일명 규칙
경로(폴더명)	포멧	데이터 종류	파일명 규칙
라벨링 데이터
┣Annotations		라벨링 데이터	■ JSON 파일 (word_id)_(actor_id)_(camera_id)_(frame_idx).json ⋅ word_id = 동작별 고유 ID 값 ⋅ actor_id = 모델 고유 ID 값 ⋅ camera_id = 카메라 ID(C:center, D:down, L:left, R:right, U:up) ⋅ frame_idx = 추출 이미지 프레임 번호
┣Word[n]_Actor[k]
┣Camera[1~5]
┗Keypoint	json
원천데이터
┣Images		이미지	■ JPG 파일 (word_id)_(actor_id)_(camera_id)_(frame_idx).jpg ⋅ word_id = 동작별 고유 ID 값 ⋅ actor_id = 모델 고유 ID 값 ⋅ camera_id = 카메라 ID(C:center, D:down, L:left, R:right, U:up) ⋅ frame_idx = 추출 이미지 프레임 번호
┣Word[n]_Actor[k]
┗Camera[1~5]	JPG
┗Mesh		메쉬	■ OBJ 파일 (word_id)_(actor_id)_(image_id).obj ⋅ ex) 001_M255_0135465.obj ■ 텍스쳐 파일 (word_id)_(actor_id)_(image_id).jpg ⋅ ex) 001_M255_0135465.jpg
┗Action[n]_Actor[k]	obj, jpg	메쉬

어노테이션 포맷

1. 손　　　　　　　　　　　　　　　　

어노테이션 포맷
No		항목	내용	타입	필수 여부
1		categories	카테고리	List	Y
	1	type	데이터 종류	String	Y
	2	type_id	데이터 종류 ID	Number	Y
	3	skeleton	관절 정의	List	Y
	4	keypoints	키포인트 정의	List	Y
	5	segments	Segmentation 정의	List	Y
2		licenses	라이선스	List	Y
	1	id	라이선스 ID	Number	Y
	2	name	라이선스 이름	String	Y
	3	url	라이선스 URL	String	Y
3		info	데이터 정보	List	Y
	1	version	데이터 버전	String	Y
	2	description	데이터 설명	String	Y
	3	contributor	데이터 제작자	String	Y
	4	url	데이터 제공 주소	String	Y
	5	date_created	데이터 생성 날짜	String	Y
4		annotations	어노테이션 정보	List	Y
	1	id	어노테이션 ID	Number	Y
	2	image_id	이미지 ID	Number	Y
	3	video_id	비디오 ID	Number	Y
	4	actor_id	배우 ID	String	Y
	5	action_id	행동 ID	Number	Y
	6	is_both_hands	양손 유무	Number	Y
	7	is_right_hand	오른손 유무	Number	Y
	8	num_keypoints	키포인트 개수	Number	Y
	9	left_hand	왼손 정보	List	N
	9-1	2D keypoints	2D 키포인트	List	N
	9-2	3D keypoints	3D 키포인트	List	N
	9-3	segmentation	세그멘테이션 정보	List	N
	10	right_hand	오른손 정보	List	N
	10-1	2D keypoints	2D 키포인트	List	N
	10-2	3D keypoints	3D 키포인트	List	N
	10-3	segmentation	세그멘테이션 정보	List	N
5		videos	비디오 정보	List	Y
	1	id	비디오 ID	Number	Y
	2	frame_rate	프레임 레이트	Number	Y
	3	width	비디오 너비	Number	Y
	4	height	비디오 높이	Number	Y
	5	camera_id	카메라 ID	Number	Y
	6	parameters	카메라 파라미터	List	Y
	6-1	intrinsic	내부 파라미터	List	Y
	6-2	extrinsic	외부 파라미터	List	Y
	7	file_name	비디오 파일 이름	String	Y
6		images	이미지 정보	List	Y
	1	id	이미지 ID	Number	Y
	2	file_name	이미지 파일 이름	String	Y
	3	width	이미지 너비	Number	Y
	4	height	이미지 높이	Number	Y
	5	frame_index	프레임 번호	Number	Y
7		actors	배우 정보	List	Y
	1	id	배우 ID	String	Y
	2	sex	배우 성별	String	Y
	3	age	배우 나이	Number	Y
8		meshs	메쉬 정보	List	N
	1	id	메쉬 ID	Number	N
	2	texture_file_name	텍스처 파일 이름	String	N
	3	obj_file_name	메쉬 파일 이름	String	N

2. 입술　　　　　　　　　　　　　　　　　　　　　　　　

데이터구조 어노테이션 포맷 입술 데이터 테이블
No		항목	내용	타입	필수 여부
1		categories	카테고리	List	Y
	1	type	데이터 종류	String	Y
	2	type_id	데이터 정류 ID	Number	Y
	3	keypoints	키포인트 정의	List	Y
	4	segments	Segmentation 정의	List	Y
2		licenses	라이선스	List	Y
	1	id	라이선스 ID	Number	Y
	2	name	라이선스 이름	String	Y
	3	url	라이선스 URL	String	Y
3		info	데이터 정보	List	Y
	1	version	데이터 버전	String	Y
	2	description	데이터 설명	String	Y
	3	contributor	데이터 제작자	String	Y
	4	url	데이터 제공 주소	String	Y
	5	date_created	데이터 생성 날짜	String	Y
4		annotations	어노테이션 정보	List	Y
	1	id	어노테이션 ID	Number	Y
	2	image_name	이미지 파일 이름	String	Y
	3	image_id	이미지 ID	Number	Y
	4	video_id	비디오 ID	Number	Y
	5	bbox	바운딩 박스	List	Y
	6	segmentation	세그멘테이션	List	Y
	7	area	세그멘테이션 넓이	List	Y
	8	actor_id	배우 ID	String	Y
	9	word	단어	String	Y
	10	word_id	단어 ID	Number	Y
	11	num_keypoints	키포인트 개수	Number	Y
	12	2D keypoints	2D 키포인트	List	Y
5		videos	비디오 정보	List	Y
	1	id	비디오 ID	Number	Y
	2	frame_rate	프레임 레이트	Number	Y
	3	width	비디오 너비	Number	Y
	4	height	비디오 높이	Number	Y
	5	camera_id	카메라 ID	Number	Y
	6	parameters	카메라 파라미터	List	Y
	6-1	intrinsic	내부 파라미터	List	Y
	6-2	extrinsic	외부 파라미터	List	Y
	7	file_name	비디오 파일 이름	String	Y
	8	date_captured	데이터 촬영 날짜	String	Y
6		images	이미지 정보	List	Y
	1	id	이미지 ID	Number	Y
	2	file_name	이미지 파일 이름	String	Y
	3	width	이미지 너비	Number	Y
	4	height	이미지 높이	Number	Y
	5	frame_index	프레임 번호	Number	Y
7		meshs	메쉬 정보	List	N
	1	id	메쉬 ID	Number	N
	2	texture_file_name	텍스처 파일 이름	String	N
	3	obj_file_name	메쉬 파일 이름	String	N
8		actor	배우 정보	List	Y
	1	id	배우 ID	String	Y
	2	sex	배우 성별	String	Y
	3	age	배우 나이	Number	Y

데이터셋 구축 담당자

수행기관(주관) : KT

수행기관(주관)
책임자명	전화번호	대표이메일	담당업무
소영준	02-2057-1015	yjun.so@kt.com	· 과제 관리 · 데이터 수집, 가공, 활용 시나리오 설계 · AI 모델 프로토타입 개발

수행기관(참여)

수행기관(참여)
기관명	담당업무
이오이스	· 원천 데이터 촬영 및 정제
에이모	· 데이터셋 구축 · 어노테이션 저작도구 제작
에프엑스기어	· AI 모델을 활용한 응용 서비스 개발 (손 동작 리타겟팅, 독순술 서비스)
홍익대학교	·데이터 가공

데이터 관련 문의처

데이터 관련 문의처
담당자명	전화번호	이메일
소영준(KT)	02-2057-1015	yjun.so@kt.com

보건의료 데이터 개방 안내

보건의료 데이터는 온라인 및 오프라인 안심존을 통해 개방됩니다.

안심존이란 안심존 이용메뉴얼 안심존 이용신청 데이터 열람신청

인터넷과 물리적으로 분리된 온라인·오프라인 공간으로 의료 데이터를 포함하여 보안 조치가 요구되는 데이터를 다운로드 없이 접근하고 분석 가능
* 온라인 안심존 : 보안이 보장된 온라인 네트워크를 통해 집, 연구실, 사무실 등 어디서나 접속하여 데이터에 접근하고 분석
* 오프라인 안심존 : 추가적인 보안이 필요한 데이터를 대상으로 지정된 물리적 공간에서만 접속하여 데이터에 접근하고 분석
1. AI 허브 접속
  신청자
2. 안심존
  사용신청신청자신청서류 제출*
3. 심사구축기관
4. 승인구축기관
5. 데이터 분석 활용신청자
6. 분석모델반출신청자
1. 기관생명윤리위원회(IRB) 심의 결과 통지서 [IRB 알아보기] [공용IRB 심의신청 가이드라인]
2. 기관생명윤리위원회(IRB) 승인된 연구계획서
3. 신청자 소속 증빙 서류 (재직증명서, 재학증명서, 근로계약서 등 택1)
4. 안심존 이용 신청서 [다운로드]
5. 보안서약서 [다운로드]
※ 상기 신청서 및 첨부 서류를 완비한 후 신청을 진행하셔야 정상적으로 절차가 이루어집니다.
신청 및 이용관련 문의는 safezone1@aihub.kr 또는 02-525-7708, 7709로 문의