한국형 사물 이미지

한국형 사물 이미지 AI데이터

Korean Type Object Image AI Training Dataset

구축목적
  • 국가지정문화재, 도시별 랜드마크, 국내 상품 등 한국형 사물에 대한 데이터셋 구축
  • 4차 산업(스마트관광, 스마트스토어 등)에 필요한 데이터셋 구축
활용분야
  • 스마트관광(한국형사물이미지 : 유적건조물,랜드마크 데이터셋 활용)
    - AI 관광도우미 : 국가지정문화재 및 도시별 랜드마크가 학습된 AI관광 도우미를 통해 외국인 관광객(일반인 포함)의 관광 안내 및 청소년 현장 교육에 활용
  • 스마트스토어(한국형사물이미지 : 상품 데이터셋 활용)
    - AI 상품결재 시스템 : AI 데이터셋 학습을 통한 무인 상품결재 시스템 및 관련 알고리즘 개발에 활용
  • 4차 산업관련 활용
    - VR/AR 및 3D 매핑 소스 활용하여 디지털 복원 기술 향상
사례
  • 유적건조물 및 랜드마크 데이터셋을 활용한 ‘문서작성도우미’ AI 상품결재 알고리즘 서비스 ‘AI 캐셔’ (2021년 상반기 오픈 예정)
구축량
  • 총 데이터 구축량 : 360만장
  • 세부분류
 
구분 데이터구축량 비고
유적건조물 260만장 궁궐,가옥,탑,무덤,사찰,교회,성곽,성당 등
상품 80만장 귀금속,화장품,시계,악세사리,신발,가방,지갑,모자,아이웨어
랜드마크 20만장 동상,타워,전망대,빌딩,대교,센터,역사,정자,성문,등대
대표도면
<이순신장군상>
{
  "image" : {
    "identifier" : "",//파일명
    "imsize" : [ 이미지 가로 사이즈, 이미지 세로 사이즈 ]
    "copyright" : "",//저작권 정보
    "date" : "",//촬영일
    "resolution" : "",//해상도
    "bit" : "",//비트값
    "F-Stop" : "",//조리개 투과량
    "exposure time" : "",//노출 시간
    "ISO" : "",//ISO 감도
    "focal length" : "",//초점 거리
    "full aperture" : "",//조리개 최대 개방 수치
    "view angle" : "",//화각
    "white balance" : "",//화이트 밸런스
    "depth" : ""//RGB 여부
  },
  "regions" : [ {
    "type" : "",//어노테이션 종류
    "boxcorners" : [좌측 X,Y좌표/ 우측 X,Y좌표]
    "ansize" : [ 이미지 가로 사이즈, 이미지 세로 사이즈 ]
    "class" : "",//클래스명
    "tags" : //분류항목 
   [ "truncated:0",//대상체 짤림 여부 
     "종ID:","대분류:","중분류:","소분류:", 
     "Instance:",//대상체","Instance Upper:",//대상체 상위","GPS 위도:","GPS 경도:"]
    "instance_uri" : "",//온톨로지 uri 정보
    "sem_ext" : [ {// 온톨로지 의미확장 정보
    "property" : "locatedIn", // 온톨로지 의미확장 지역정보
    "value" : ""
    }, {
    "property" : "relatedTerm", // 온톨로지 의미확장 연관정보
    "value" : ""
    }, {
    "property" : "description", // 온톨로지 의미확장 상세정보
    "value" : ""
    } ]
  } ]

필요성
  • 인공지능 사물 이미지 인식기술은 자율주행, 스마트시티, 스마트제조, 무인스토어 등 다양한 산업분야에서 활용 가능한 기술임
  • 구글, 이미지넷, MS COCO 등 대용량 이미지 공개 사이트에는 국내 특성에 맞는 AI 학습데이터 부족함
  • 국내 장소, 객체에 대한 인공지능기반의 시각지능 기술 개발 및 서비스 강화를 위해 한국형 사물이미지 AI 데이터 공개 필요
구축내용
  • 한국형 사물 이미지 학습용 데이터 구축을 위한 객체 및 속성정보를 취득하여 정보이용자(산업계,학계 및 연구소)가 연구개발에 쉽고 효율적으로 활용할수 있는 고품질의 인공지능 학습데이터 구축
    -촬영(수집)데이터 : 한국형 이미지 360만장
    -국가지정 유적건조물(탑,성곽,가옥 등) 260만장, 상품(신발,가방,지갑,장화 등) 80만장, 35개도시 랜드마크 20만장
    -데이터 촬영 및 이미지 수집을 통한 데이터 구축
데이터 구조
특허 데이터 구축내용 표 (구축년도,데이터종류,포함내용,제공방식)
No 항목명 설명 필수여부
유적건조물 상품 랜드마크
1     image 이미지 정보 Y Y Y
  1-1   identifier 파일명 Y Y Y
  1-2   imsize 이미지 파일 크기 Y Y Y
  1-3   copyright 이미지 저작권 소유자 Y Y Y
  1-4   date 데이터 취득 일자      
  1-5   resolution 해상도 Y Y Y
  1-6   bit 비트값 Y Y Y
  1-7   F-Stop 조리개 투과량      
  1-8   exposure time 노출 시간      
  1-9   ISO ISO 감도      
  1-10   focal length 초점 거리      
  1-11   full aperture 조리개 최대 개방 수치      
  1-12   view angle 화각      
  1-13   white balance 화이트 밸런스 Y Y Y
  1-14   depth RGB 여부 Y Y Y
2     regions 관련 정보 Y Y Y
  2-1   type 어노테이션 종류 Y Y Y
  2-2   boxcorners 어노테이션 좌표 값 Y Y Y
  2-3   ansize 이미지 영역 사이즈 Y Y Y
  2-4   class 클래스명 Y Y Y
  2-5   tags 분류항목 Y Y Y
    2-5-1 truncated 대상체 잘림 여부 Y Y Y
    2-5-2 종ID 종 아이디 정보 Y Y Y
    2-5-3 대분류 대분류 정보 Y Y Y
    2-5-4 중분류 중분류 정보 Y Y Y
    2-5-5 소분류 소분류 정보 Y Y Y
    2-5-6 Instance 대상체 Y Y Y
    2-5-7 Instance Upper 대상체 상위 레벨      
    2-5-8 GPS 위도 GPS 위도 값      
    2-5-9 GPS 경도 GPS 경도 값      
  2-6   instance_uri 온톨로지 uri 정보 Y Y Y
  2-7 2-7-1 sem_ext 의미확장 정보 Y Y Y
    2-7-2 property : locatedIn 의미확장 지역정보      
    2-7-3 property : relatedTerm 의미확장 연관정보 Y Y Y
    2-7-4 property : description 의미확장 상세정보 Y Y Y
데이터 구축 담당자
수행기관(주관) : ㈜미디어그룹사람과숲

 

 
책임자명 전화번호 대표이메일 담당업무
한윤기 02-401-4347 hanykee@hanmail.net · AI 학습용 데이터 설계/구축
· 정제, 품질관리
· 홍보, AI 시범 사이트 개발 / 가공
수행기관(참여)
 
 
기관명 담당업무 기관명 담당업무
㈜인피닉 · AI 학습용 데이터 가공
· 데이터 유효성 검증
㈜솔트룩스 · 온톨로지 기반 의미 확장
· AI시범서비스 모델 개발
가이드라인 다운로드