한국인 안면 이미지

한국인 안면 이미지

데이터셋명 한국인 안면 이미지
데이터 분야 비전 데이터 유형 이미지
구축기관 한국과학기술연구원 구축기관 연락처 담당자명 조정현
가공기관 전화번호 02-958-6650
검수기관 이메일 kface@imrc.kist.re.kr
구축 데이터량 2,860만 구축년도 2017, 2018, 2019년
버전 1.0 최종수정일자 2018.01.02.
소개 한국인 얼굴 특성에 맞는 각도, 조도, 가림, 표정, 해상도 등으로 한국형 얼굴 데이터 베이스를 구축한 이미지 데이터 제공
주요 키워드 얼굴 복원, 얼굴 인식, 얼굴 생성, 얼굴 변환, 얼굴 판별, 한국인 얼굴, 얼굴 이미지, 얼굴 포즈 이미지, 얼굴 표정 이미지
저작권 및 이용정책 본 데이터는 과학기술정보통신부가 주관하고 한국지능정보사회진흥원이 지원하는 '인공지능 학습용 데이터 구축사업'으로 구축된 데이터입니다. [데이터 이용정책 상세보기]
데이터설명서 구축활용가이드 자료보기
샘플데이터 교육활용동영상
데이터 변경이력
버전 일자 변경내용 비고
1.0 2018.01.02 데이터 최초 개방  
구축목적
  • 연구 목적으로 활용되는 얼굴 데이터베이스는 대부분 해외에서 구축됨에 따라, 한국인 대상의 인공지능 기반 안면응용기술 개발에는 어려움이 있음
  • 따라서, 한국에 실적용 가능한 기술 개발을 위해서는 한국인들의 얼굴 특성에 맞는 한국형 얼굴 데이터베이스가 필요함
  • 이에 본 데이터 구축은 한국인 얼굴의 통계적 특징을 파악하기 위함을 목적으로 함
활용분야
산업분야

 

  • 한국인 안면 이미지의 기계학습을 통한 얼굴인식기술의 고도화로 모바일 금융보안서비스, 출입보안시스템, 범죄용의자 탐색시스템, 매장방문 고객지원 서비스 등 얼굴인식기반 서비스의 고도화에 활용 가능
  • 한국인 안면 이미지의 기계학습을 통한 한국인 얼굴생성모델의 개발로 사용자 맞춤형 아바타 제작 서비스, 가상 영상 제작 서비스의 고도화에 활용 가능

 

연구분야

 

  • 얼굴 탐지(Detection), 얼굴 복원(Restoration), 얼굴 인식(Recognition), 얼굴 생성 및 변환(Generation & Translation) 기술의 고도화, 효율화, 일반화 연구 가능
  • 가짜 얼굴 판별을 위한 실제 얼굴 이미지의 통계 분석용으로 활용 가능
  • 영상 내 인물 중심의 영상 편집 기술 (포즈, 조명 자동 변경 등) 고도화에 활용 가능
사례
  • AI R&D 챌린지에 가짜 얼굴 판별 대회에서 학습 데이터용으로 활용
  • 경찰청 범죄자 신원인식기 성능 고도화에 활용
구축량
  • 공개수량 : 1,000명 (19년도 600명, 18년도 400명)
    포함내용 :
    - 각도 (20 views)
    - 조도 (30 lightings)
    - 가림 (안경 등 6종)
    - 표정 (3개 표정)
    - 해상도 (3개 해상도)
대표 도면
image
 <이미지 분야 한국인 얼굴 이미지 데이터베이스 구조 이미지 예시>
image
<이미지 분야 한국인 얼굴 이미지 데이터베이스 구조 이미지 예시>

 

필요성
  • 해외 주요국가에서는 시각지능 분야에서 인공지능(AI) 기술개발을 위한 기계학습 데이터 구축 등 관련 인프라를 확보하여 개방
  • 국내 인공지능 기술의 활성화를 위해서는 무엇보다 기계학습에 활용할 다양한 패턴의 고품질 이미지 데이터 확보가 중요
  • 현재까지 대규모 얼굴 영상 데이터베이스는 국외 연구기관에서 주도적으로 구축한 사례들이 존재하나, 대부분 서양인 위주의 얼굴 영상을 포함하고 있어서 한국인 특성에 맞는 신원확인 기술 및 얼굴 관련 응용 기술에 대한 성능 최적화 등에 어려움 존재
  • 기계학습 기반의 안면 응용 기술의 발전을 위해서는 대규모의 정제되고, 색인된 안면 이미지 데이터셋이 반드시 필요한 실정이며, 기술 고도화를 위해서는 다양한 환경이 고려된 데이터셋이 필요
     
구축내용
  • 한국인 얼굴에 대한 국내 특화 시각지능기술 및 서비스 개발을 위해 필요한 이미지 데이터의 제작, 수집, 분류 체계를 마련하고 관련 정보를 레이블링
  • 얼굴 데이터의 실효성 제고를 위해 각도 20종, 조도 30종, 가림 6종, 표정 3종, 해상도 3종을 반영한 1,000명(인당 약 3만장)의 안면 이미지 데이터 제작
데이터 구조
  • 얼굴 이미지 데이터베이스의 구조는 영상 해상도, ID, 액세서리 유무, 조명 위치 및 세기, 표정, 포즈 방향을 고려하여 설계되어 있음. 파일명은 영상 해상도 별로 “ID_액세서리속성_조명속성_표정속성_포즈속성.jpg“으로 구분하며 각 파일 당 얼굴 영역 정보를 텍스트 파일로 별도 저장함.
  • 파일 저장시의 각 요소별 Label 정보는 다음과 같음
    1. 포즈 20종 (C1 ~ C20)
    2. 조명 30종 (L1 ~ L30)
    3. 액세서리 6종 (S001 ~ S006)
    4. 표정 3종 (E01 ~ E03)
    데이터 구조-Expression
    Expression
    E01 무표정
    E02 활짝웃음
    E03 찡그림
image
<이미지 분야 한국인 얼굴 이미지 데이터베이스 Label 정보>

 

데이터 구축 담당자
수행기관(주관) : 한국과학기술연구원

 

 
책임자명 전화번호 대표이메일 담당업무
조정현 - kface@imrc.kist.re.kr · 데이터 설계, 검수 및 제작
수행기관(참여)
 
 
기관명 담당업무 기관명 담당업무
㈜휴먼ICT · 데이터 획득, 정제 및 색인 ㈜SQI소프트 · 시범서비스 개발