한국형 사물 이미지 AI데이터
Korean Type Object Image AI Training Dataset
구축목적
- 국가지정문화재, 도시별 랜드마크, 국내 상품 등 한국형 사물에 대한 데이터셋 구축
- 4차 산업(스마트관광, 스마트스토어 등)에 필요한 데이터셋 구축
활용분야
- 스마트관광(한국형사물이미지 : 유적건조물,랜드마크 데이터셋 활용)
- AI 관광도우미 : 국가지정문화재 및 도시별 랜드마크가 학습된 AI관광 도우미를 통해 외국인 관광객(일반인 포함)의 관광 안내 및 청소년 현장 교육에 활용 - 스마트스토어(한국형사물이미지 : 상품 데이터셋 활용)
- AI 상품결재 시스템 : AI 데이터셋 학습을 통한 무인 상품결재 시스템 및 관련 알고리즘 개발에 활용 - 4차 산업관련 활용
- VR/AR 및 3D 매핑 소스 활용하여 디지털 복원 기술 향상
사례
- 유적건조물 및 랜드마크 데이터셋을 활용한 ‘문서작성도우미’ AI 상품결재 알고리즘 서비스 ‘AI 캐셔’ (2021년 상반기 오픈 예정)
구축량
- 총 데이터 구축량 : 360만장
- 세부분류
구분 | 데이터구축량 | 비고 |
---|---|---|
유적건조물 | 260만장 | 궁궐,가옥,탑,무덤,사찰,교회,성곽,성당 등 |
상품 | 80만장 | 귀금속,화장품,시계,악세사리,신발,가방,지갑,모자,아이웨어 |
랜드마크 | 20만장 | 동상,타워,전망대,빌딩,대교,센터,역사,정자,성문,등대 |
대표도면
{
"image" : {
"identifier" : "",//파일명
"imsize" : [ 이미지 가로 사이즈, 이미지 세로 사이즈 ]
"copyright" : "",//저작권 정보
"date" : "",//촬영일
"resolution" : "",//해상도
"bit" : "",//비트값
"F-Stop" : "",//조리개 투과량
"exposure time" : "",//노출 시간
"ISO" : "",//ISO 감도
"focal length" : "",//초점 거리
"full aperture" : "",//조리개 최대 개방 수치
"view angle" : "",//화각
"white balance" : "",//화이트 밸런스
"depth" : ""//RGB 여부
},
"regions" : [ {
"type" : "",//어노테이션 종류
"boxcorners" : [좌측 X,Y좌표/ 우측 X,Y좌표]
"ansize" : [ 이미지 가로 사이즈, 이미지 세로 사이즈 ]
"class" : "",//클래스명
"tags" : //분류항목
[ "truncated:0",//대상체 짤림 여부
"종ID:","대분류:","중분류:","소분류:",
"Instance:",//대상체","Instance Upper:",//대상체 상위","GPS 위도:","GPS 경도:"]
"instance_uri" : "",//온톨로지 uri 정보
"sem_ext" : [ {// 온톨로지 의미확장 정보
"property" : "locatedIn", // 온톨로지 의미확장 지역정보
"value" : ""
}, {
"property" : "relatedTerm", // 온톨로지 의미확장 연관정보
"value" : ""
}, {
"property" : "description", // 온톨로지 의미확장 상세정보
"value" : ""
} ]
} ]
필요성
- 인공지능 사물 이미지 인식기술은 자율주행, 스마트시티, 스마트제조, 무인스토어 등 다양한 산업분야에서 활용 가능한 기술임
- 구글, 이미지넷, MS COCO 등 대용량 이미지 공개 사이트에는 국내 특성에 맞는 AI 학습데이터 부족함
- 국내 장소, 객체에 대한 인공지능기반의 시각지능 기술 개발 및 서비스 강화를 위해 한국형 사물이미지 AI 데이터 공개 필요
구축내용
- 한국형 사물 이미지 학습용 데이터 구축을 위한 객체 및 속성정보를 취득하여 정보이용자(산업계,학계 및 연구소)가 연구개발에 쉽고 효율적으로 활용할수 있는 고품질의 인공지능 학습데이터 구축
-촬영(수집)데이터 : 한국형 이미지 360만장
-국가지정 유적건조물(탑,성곽,가옥 등) 260만장, 상품(신발,가방,지갑,장화 등) 80만장, 35개도시 랜드마크 20만장
-데이터 촬영 및 이미지 수집을 통한 데이터 구축
데이터 구조
No | 항목명 | 설명 | 필수여부 | ||||
---|---|---|---|---|---|---|---|
유적건조물 | 상품 | 랜드마크 | |||||
1 | image | 이미지 정보 | Y | Y | Y | ||
1-1 | identifier | 파일명 | Y | Y | Y | ||
1-2 | imsize | 이미지 파일 크기 | Y | Y | Y | ||
1-3 | copyright | 이미지 저작권 소유자 | Y | Y | Y | ||
1-4 | date | 데이터 취득 일자 | |||||
1-5 | resolution | 해상도 | Y | Y | Y | ||
1-6 | bit | 비트값 | Y | Y | Y | ||
1-7 | F-Stop | 조리개 투과량 | |||||
1-8 | exposure time | 노출 시간 | |||||
1-9 | ISO | ISO 감도 | |||||
1-10 | focal length | 초점 거리 | |||||
1-11 | full aperture | 조리개 최대 개방 수치 | |||||
1-12 | view angle | 화각 | |||||
1-13 | white balance | 화이트 밸런스 | Y | Y | Y | ||
1-14 | depth | RGB 여부 | Y | Y | Y | ||
2 | regions | 관련 정보 | Y | Y | Y | ||
2-1 | type | 어노테이션 종류 | Y | Y | Y | ||
2-2 | boxcorners | 어노테이션 좌표 값 | Y | Y | Y | ||
2-3 | ansize | 이미지 영역 사이즈 | Y | Y | Y | ||
2-4 | class | 클래스명 | Y | Y | Y | ||
2-5 | tags | 분류항목 | Y | Y | Y | ||
2-5-1 | truncated | 대상체 잘림 여부 | Y | Y | Y | ||
2-5-2 | 종ID | 종 아이디 정보 | Y | Y | Y | ||
2-5-3 | 대분류 | 대분류 정보 | Y | Y | Y | ||
2-5-4 | 중분류 | 중분류 정보 | Y | Y | Y | ||
2-5-5 | 소분류 | 소분류 정보 | Y | Y | Y | ||
2-5-6 | Instance | 대상체 | Y | Y | Y | ||
2-5-7 | Instance Upper | 대상체 상위 레벨 | |||||
2-5-8 | GPS 위도 | GPS 위도 값 | |||||
2-5-9 | GPS 경도 | GPS 경도 값 | |||||
2-6 | instance_uri | 온톨로지 uri 정보 | Y | Y | Y | ||
2-7 | 2-7-1 | sem_ext | 의미확장 정보 | Y | Y | Y | |
2-7-2 | property : locatedIn | 의미확장 지역정보 | |||||
2-7-3 | property : relatedTerm | 의미확장 연관정보 | Y | Y | Y | ||
2-7-4 | property : description | 의미확장 상세정보 | Y | Y | Y |
데이터 구축 담당자
수행기관(주관) : ㈜미디어그룹사람과숲
책임자명 | 전화번호 | 대표이메일 | 담당업무 |
---|---|---|---|
한윤기 | 02-401-4347 | hanykee@hanmail.net | · AI 학습용 데이터 설계/구축 · 정제, 품질관리 · 홍보, AI 시범 사이트 개발 / 가공 |
수행기관(참여)
기관명 | 담당업무 | 기관명 | 담당업무 |
---|---|---|---|
㈜인피닉 | · AI 학습용 데이터 가공 · 데이터 유효성 검증 |
㈜솔트룩스 | · 온톨로지 기반 의미 확장 · AI시범서비스 모델 개발 |
가이드라인 다운로드