-
데이터 변경이력
데이터 변경이력 버전 일자 변경내용 비고 1.2 2023-12-08 데이터 최종 개방 1.1 2023-10-30 데이터 최조 개방 1.0 2023-05-26 데이터 개방(Beta Version) 데이터 히스토리
데이터 히스토리 일자 변경내용 비고 2023-12-08 산출물 전체 공개 소개
3,000명을 대상으로, 다양한 배경, 각도, 액세서리 등의 변인을 주며 촬영한 안면 이미지를 19개의 안면 세부 구성 요소로 분할하여 픽셀 단위 라벨링하고 안면 106점 키포인트 라벨링을 통해 안면 이미지 내의 얼굴 구성 요소(눈, 코, 입 등)을 픽셀 단위로 분류할 수 있는 Face Parsing 학습용 데이터 구축
구축목적
안면 구성 요소의 교체 또는 변형을 통해서 새로운 안면을 합성해 내는 기반 기술인 Face Parsing은 안면 인식, 안면 검출, 안면 정렬 기술에 비해 상대적으로 난이도가 높은 가공 작업 및 비용으로 인해 학습데이터가 충분하지 않아 발전이 더딘 편이므로 성능 개선의 여지가 큰 Face Parsing 기술 분야에서의 국제 경쟁력 강화를 위해 고품질의 충분한 학습용 데이터 확보가 필요함
-
메타데이터 구조표 데이터 영역 재난안전환경 데이터 유형 이미지 데이터 형식 png 데이터 출처 자체 수집 라벨링 유형 키포인트, 세그멘테이션 라벨링 형식 json, grayscale png 데이터 활용 서비스 의료·미용 서비스(메이크업·헤어스타일·성형 적용 전 사전 확인 서비스),미디어·영상·엔터테인먼트 서비스(가상공간 캐릭터 생성) 데이터 구축년도/
데이터 구축량2022년/150,000건 -
1. 데이터 구축 규모
1. 데이터 구축 규모 구분 상세 형식 수량 원천 데이터 3,000명 안면 RGB 이미지(1인당 50장) PNG 150,000 라벨링 데이터 안면 구성 요소(19개 클래스) 라벨링 정보를 담고 있는 grayscale PNG 파일 PNG 150,000 촬영 메타 정보, 안면 106점 키포인트 및 바운딩박스 좌표값으로 구성된 파일 JSON 150,000 2. 데이터 분포
2. 데이터 분포 항목 구분 비율(%) 수량(건) 참여자 성별 남자 46.97% 70,450건 여자 53.03% 79,550건 합계 100.00% 150,000건 참여자 연령 분포 20대 22.03% 33,050건 30대 24.53% 36,800건 40대 21.80% 32,700건 50세 이상 31.63% 47,450건 합계 100.00% 150,000건 -
-
AI 모델 상세 설명서 다운로드
AI 모델 상세 설명서 다운로드 AI 모델 다운로드활용 모델
⚪ 모델 설명
- 기존의 안면 구성 요소별 영역 탐지 모델에서는 얼굴 구성 요소 간의 관계를 고려하지 않는 방식이었다면 제시하는 알고리즘은 적응형 그래프 표현(graph representation)을 학습하고 추론하여 구성 요소별 관계를 활용함
- 그래프 표현을 학습하여 영역별 관계를 모델링 및 추론하고 정밀한 분할을 위해 edge 정보를 활용하고 강조하는 모델임
⚪ 전처리
- 원천 이미지, 라벨 이미지를 json 파일을 사용하여 crop, resize 수행
- 라벨 이미지로부터 edge 이미지 생성
- 최종적으로 원천 이미지, 라벨 이미지, edge 이미지를 학습에 사용⚪ 서비스 활용 시나리오
⚪ 서비스 활용 시나리오 활용 분야 활용 서비스 의료 산업 사고로 인한 안면 재건이나 미용 목적의 성형을 하기 전 안면 변형의 결과를 미리 보여 주는 서비스 미용 산업 원하는 화장 또는 헤어스타일을 하기 전 미리 시연하는 서비스 패션 산업 안경이나 액세서리 등을 소비자가 직접 착용하지 않아도 자신의 모습과 구매하려는 물품을 컴퓨터, 스마트폰 등으로 자연스럽게 확인할 수 있는 고품질 온라인 판매 서비스 관련 기업이 제품 기획 단계에서 현실감 있는 상품 착용 정보 제공 가상 현실 플랫폼 게임, 메타버스 플랫폼과 같은 가상 공간에서 자신의 특징적인 안면 요소를 강조하여 개성 있는 캐릭터 생성 영상/미디어 산업 영화나 엔터테인먼트 산업계에서 실제 배우나 인물의 개성있는 안면 구성 요소를 변형하여 3D 캐릭터룰 구축하는 서비스 엔터테인먼트 산업 -
데이터 성능 점수
측정값 (%)기준값 (%)데이터 성능 지표
데이터 성능 지표 번호 측정항목 AI TASK 학습모델 지표명 기준값 점수 측정값 점수 1 안면 구성 요소별 영역 탐지 성능 Object Detection AGRNet F1-Score 0.7 점 0.8116 점
※ 데이터 성능 지표가 여러 개일 경우 각 항목을 클릭하면 해당 지표의 값이 그래프에 표기됩니다.
※ AI모델 평가 지표에 따라 측정값의 범위, 판단 기준이 달라질 수 있습니다. (ex. 오류율의 경우, 낮을수록 좋은 성능을 내는 것으로 평가됩니다)
-
설명서 및 활용가이드 다운로드
데이터 설명서 다운로드 구축활용가이드 다운로드1. 데이터 예시
세그멘테이션 라벨링 데이터
(grayscale PNG)Grayscale 라벨링 데이터 시각화 원천 데이터 106점 라벨링 데이터(JSON) 키포인트 라벨링 시각화 * 샘플 데이터는 촬영 모델 얼굴을 블러링 처리하였으나, AI-Hub 상에서 해당 데이터 신청 승인을 득한 후 다운로드 받으면 촬영 모델 얼굴이 정상적으로 표시됨
2. 세그멘테이션 라벨링 데이터 구성 – 19개 클래스
2. 세그멘테이션 라벨링 데이터 구성 – 19개 클래스 Class Class 명 상세 설명 0 Backgoround 배경 1 Skin (얼굴) 피부 2 Left Eyebrow 왼쪽 눈썹 3 Right Eyebrow 오른쪽 눈썹 4 Left Eye 왼쪽 눈 5 Right Eye 오른쪽 눈 6 Eyeglass 안경 7 Left Ear 왼쪽 귀 8 Right Ear 오른쪽 귀 9 EarRing 귀걸이 10 Nose 코 11 Mouth 입 12 Upper Lip 윗 입술 13 Lower Lip 아랫 입술 14 Neck 목 15 Necklace 목걸이 16 Cloth 옷 17 Hair 머리 18 Hat 모자 3. 키포인트 라벨링 데이터 JSON 구성
3. 키포인트 라벨링 데이터 JSON 구성 구분 속성명 타입 필수여부 설명 범위 1 filename string 필수 원천데이터 이름 2 id string 필수 ID 4자리 숫자 문자열 3 date string 선택 촬영일자 10자리 문자열 yyyy.mm.dd 4 format string 필수 포맷 png, PNG 5 imgsize string 필수 이미지 파일 크기(MB) (MB) 6 width number 필수 이미지 가로길이 7 height number 필수 이미지 세로길이 8 device string 필수 촬영 기기 정보 9 gender string 필수 성별 male, female 10 birth string 필수 피촬영자 출생연도 4자리 숫자 문자열 11 location string 필수 촬영장소 indoor, outdoor 12 accessory string 필수 악세사리 착용 여부 acc, normal 13 annotation object 필수 13-1 box object 필수 안면 바운딩박스 x number 필수 안면 바운딩박스의 min의 x 좌표값 y number 필수 안면 바운딩박스의 min의 y 좌표값 w number 필수 안면 바운딩박스의 width h number 필수 안면 바운딩박스의 height 13-2 points array 필수 안면 106개 points $value$ number 필수 안면 106개 points x,y 좌표값 4. Face parsing 세그멘테이션 라벨링 데이터(grayscale png) 예시
5. 안면 106점 키포인트 라벨링 데이터(json) 예시
-
데이터셋 구축 담당자
수행기관(주관) : ㈜씨유박스
수행기관(주관) 책임자명 전화번호 대표이메일 담당업무 박준석 02-6227-7035 jspark@cubox.aero 과제 총괄, 데이터 품질 검증, 모델 개발 수행기관(참여)
수행기관(참여) 기관명 담당업무 ㈜알체라 데이터 수집·정제·가공 ㈜딥핑소스 데이터 수집 ㈜솔트룩스 데이터 가공 데이터 관련 문의처
데이터 관련 문의처 담당자명 전화번호 이메일 박준석 02-6227-7035 jspark@cubox.aero
-
인터넷과 물리적으로 분리된 온라인·오프라인 공간으로 의료 데이터를 포함하여 보안 조치가 요구되는 데이터를 다운로드 없이 접근하고 분석 가능
* 온라인 안심존 : 보안이 보장된 온라인 네트워크를 통해 집, 연구실, 사무실 등 어디서나 접속하여 데이터에 접근하고 분석
* 오프라인 안심존 : 추가적인 보안이 필요한 데이터를 대상으로 지정된 물리적 공간에서만 접속하여 데이터에 접근하고 분석 -
- AI 허브 접속
신청자 - 안심존
사용신청신청자신청서류 제출* - 심사구축기관
- 승인구축기관
- 데이터 분석 활용신청자
- 분석모델반출신청자
- AI 허브 접속
-
1. 기관생명윤리위원회(IRB) 심의 결과 통지서 [IRB 알아보기] [공용IRB 심의신청 가이드라인]
2. 기관생명윤리위원회(IRB) 승인된 연구계획서
3. 신청자 소속 증빙 서류 (재직증명서, 재학증명서, 근로계약서 등 택1)
4. 안심존 이용 신청서 [다운로드]
5. 보안서약서 [다운로드]
※ 상기 신청서 및 첨부 서류를 완비한 후 신청을 진행하셔야 정상적으로 절차가 이루어집니다. -
신청 및 이용관련 문의는 safezone1@aihub.kr 또는 02-525-7708, 7709로 문의
데이터셋 다운로드 승인이 완료 된 후 API 다운로드 서비스를 이용하실 수 있습니다.
API 다운로드 파일은 분할 압축되어 다운로드 됩니다. 분할 압축 해제를 위해서는 분할 압축 파일들의 병합이 필요하며 리눅스 명령어 사용이 필요합니다.
리눅스 OS 계열에서 다운로드 받으시길 권장하며 윈도우에서 파일 다운로드 시 wsl(리눅스용 윈도우 하위 시스템) 설치가 필요합니다.
※ 파일 병합 리눅스 명령어
find "폴더경로" -name "파일명.zip.part*" -print0 | sort -zt'.' -k2V | xargs -0 cat > "파일명.zip"
- 해당 명령어 실행 시, 실행 경로 위치에 병합 압축 파일이 생성됩니다.
- 병합된 파일 용량이 0일 경우, 제대로 병합이 되지 않은 상태이니 "폴더경로"가 제대로 입력되었는지 확인 부탁드립니다.
※ 데이터셋 소개 페이지에서 다운로드 버튼 클릭하여 승인이 필요합니다.
오프라인 데이터 이용 안내
본 데이터는 K-ICT 빅데이터센터에서도 이용하실 수 있습니다.
다양한 데이터(미개방 데이터 포함)를 분석할 수 있는 오프라인 분석공간을 제공하고 있습니다.
데이터 안심구역 이용절차 및 신청은 K-ICT빅데이터센터 홈페이지를 참고하시기 바랍니다.