자동차 환경 인물 인식용 데이터셋
외부 데이터는 해당 기관의 이용정책과 다운로드 절차를 따라야 하며 AI 허브와 관련이 없음을 알려 드립니다. [저작권 및 이용정책 상세보기]
구축량
- 1차년도: 인물 14명 시내코스 30-45분 주행 데이터
필요성
- 해외 주요국가에서는 시각지능 분야에서 인공지능(AI) 기술개발을 위한 기계학습 데이터 구축 등 관련 인프라를 확보하여 개방
- 국내 인공지능 기술의 활성화를 위해서는 무엇보다 기계학습에 활용할 다양한 패턴의 고품질 이미지 데이터 확보가 중요
- 공개된 얼굴 인식 데이터베이스들에서는 주로 백인 얼굴 데이터에 치중된 분포를 지니고 있기 때문에 한국인에게 맞는 기술을 개발하기 위해서는 한국인에게서 취득한 얼굴 데이터의 구축 필요
구축내용




- 주행 상황에서 운전자의 상태를 확인하기 위해 한국인 얼굴 인식 기능 개발을 위해 필요한 이미지 데이터의 제작, 수집하고 관련 정보를 레이블링
- 얼굴 데이터의 실효성 제고를 위해 다양한 각도, 조도, 가림, 표정등을 반영한 12명의 얼굴(인당 약 1천장)의 이미지 데이터 제작
- 국내 인공지능 기술의 활성화를 위해서는 무엇보다 기계학습에 활용할 다양한 패턴의 고품질 이미지 데이터 확보가 중요
- 얼굴 인식 및 얼굴의 위치까지 확인하기 위하여 바운딩 박스를 이용하여 얼굴의 위치까지 태깅
데이터 구조
- 각 이미지 파일마다 해당 파일과 동일한 이름의 텍스트 파일로 얼굴의 위치를 표시
- 형식은 레이블, 바운딩 박스 중심의 가로 세로 위치와 바운딩 박스의 가로 세로 크기를 순서대로 표시
- 숫자는 해당 좌표를 이미지 전체 크기로 나눈 값
예시) 파일명 “1_1.txt”, 내용 “0 0.317592 0.480555 0.237037 0.237037”