한국형 사물 이미지

한국형 사물 이미지 AI데이터

Korean Type Object Image AI Training Dataset

'19년 구축량
  • 총 데이터 구축량 : 360만장
  • 세부분류
 
구분 데이터구축량 비고
유적건조물 260만장 궁궐,가옥,탑,무덤,사찰,교회,성곽,성당 등
상품 80만장 귀금속,화장품,시계,악세사리,신발,가방,지갑,모자,아이웨어
랜드마크 20만장 동상,타워,전망대,빌딩,대교,센터,역사,정자,성문,등대
대표도면
<이순신장군상>
{
  "image" : {
    "identifier" : "",//파일명
    "imsize" : [ 이미지 가로 사이즈, 이미지 세로 사이즈 ]
    "copyright" : "",//저작권 정보
    "date" : "",//촬영일
    "resolution" : "",//해상도
    "bit" : "",//비트값
    "F-Stop" : "",//조리개 투과량
    "exposure time" : "",//노출 시간
    "ISO" : "",//ISO 감도
    "focal length" : "",//초점 거리
    "full aperture" : "",//조리개 최대 개방 수치
    "view angle" : "",//화각
    "white balance" : "",//화이트 밸런스
    "depth" : ""//RGB 여부
  },
  "regions" : [ {
    "type" : "",//어노테이션 종류
    "boxcorners" : [좌측 X,Y좌표/ 우측 X,Y좌표]
    "ansize" : [ 이미지 가로 사이즈, 이미지 세로 사이즈 ]
    "class" : "",//클래스명
    "tags" : //분류항목 
   [ "truncated:0",//대상체 짤림 여부 
     "종ID:","대분류:","중분류:","소분류:", 
     "Instance:",//대상체","Instance Upper:",//대상체 상위","GPS 위도:","GPS 경도:"]
    "instance_uri" : "",//온톨로지 uri 정보
    "sem_ext" : [ {// 온톨로지 의미확장 정보
    "property" : "locatedIn", // 온톨로지 의미확장 지역정보
    "value" : ""
    }, {
    "property" : "relatedTerm", // 온톨로지 의미확장 연관정보
    "value" : ""
    }, {
    "property" : "description", // 온톨로지 의미확장 상세정보
    "value" : ""
    } ]
  } ]

필요성
  • 인공지능 사물 이미지 인식기술은 자율주행, 스마트시티, 스마트제조, 무인스토어 등 다양한 산업분야에서 활용 가능한 기술임
  • 구글, 이미지넷, MS COCO 등 대용량 이미지 공개 사이트에는 국내 특성에 맞는 AI 학습데이터 부족함
  • 국내 장소, 객체에 대한 인공지능기반의 시각지능 기술 개발 및 서비스 강화를 위해 한국형 사물이미지 AI 데이터 공개 필요
구축내용
  • 한국형 사물 이미지 학습용 데이터 구축을 위한 객체 및 속성정보를 취득하여 정보이용자(산업계,학계 및 연구소)가 연구개발에 쉽고 효율적으로 활용할수 있는 고품질의 인공지능 학습데이터 구축
    -촬영(수집)데이터 : 한국형 이미지 360만장
    -국가지정 유적건조물(탑,성곽,가옥 등) 260만장, 상품(신발,가방,지갑,장화 등) 80만장, 35개도시 랜드마크 20만장
    -데이터 촬영 및 이미지 수집을 통한 데이터 구축
데이터 구조
특허 데이터 구축내용 표 (구축년도,데이터종류,포함내용,제공방식)
No 항목명 설명 필수여부
유적건조물 상품 랜드마크
1     image 이미지 정보 Y Y Y
  1-1   identifier 파일명 Y Y Y
  1-2   imsize 이미지 파일 크기 Y Y Y
  1-3   copyright 이미지 저작권 소유자 Y Y Y
  1-4   date 데이터 취득 일자      
  1-5   resolution 해상도 Y Y Y
  1-6   bit 비트값 Y Y Y
  1-7   F-Stop 조리개 투과량      
  1-8   exposure time 노출 시간      
  1-9   ISO ISO 감도      
  1-10   focal length 초점 거리      
  1-11   full aperture 조리개 최대 개방 수치      
  1-12   view angle 화각      
  1-13   white balance 화이트 밸런스 Y Y Y
  1-14   depth RGB 여부 Y Y Y
2     regions 관련 정보 Y Y Y
  2-1   type 어노테이션 종류 Y Y Y
  2-2   boxcorners 어노테이션 좌표 값 Y Y Y
  2-3   ansize 이미지 영역 사이즈 Y Y Y
  2-4   class 클래스명 Y Y Y
  2-5   tags 분류항목 Y Y Y
    2-5-1 truncated 대상체 잘림 여부 Y Y Y
    2-5-2 종ID 종 아이디 정보 Y Y Y
    2-5-3 대분류 대분류 정보 Y Y Y
    2-5-4 중분류 중분류 정보 Y Y Y
    2-5-5 소분류 소분류 정보 Y Y Y
    2-5-6 Instance 대상체 Y Y Y
    2-5-7 Instance Upper 대상체 상위 레벨      
    2-5-8 GPS 위도 GPS 위도 값      
    2-5-9 GPS 경도 GPS 경도 값      
  2-6   instance_uri 온톨로지 uri 정보 Y Y Y
  2-7 2-7-1 sem_ext 의미확장 정보 Y Y Y
    2-7-2 property : locatedIn 의미확장 지역정보      
    2-7-3 property : relatedTerm 의미확장 연관정보 Y Y Y
    2-7-4 property : description 의미확장 상세정보 Y Y Y
활용예시
산업분야

 

  • (스마트관광)AI관광 도우미 : 문화재 및 도시별 랜드마크가 학습된 AI관광 도우미를 통해 외국인 관광객(일반인 포함)의 관광 안내 및 청소년 현장교육에 활용
  • (스마트교육)AI문서작성도우미 : 문서작성시 문서의 맥락을 분석하고 삽입된 이미지에 대한 연관데이터를 추천함으로 별도의 검색 작업을 최소화하는 솔루션 개발가능
  • (스마트팩토리/스토어)스마트제조: 상품에 대한 AI자동인식 기반의 제품 분류/품질 검수 및 자동 결재 솔루션 개발 가능

 

연구분야

 

  • (인식 알고리즘)이미지넷 등 해외 사물 인식 데이터 공개사이트의 자료와 연계하여 한국형 사물 이미지를 제공함으로 국내 AI 사물 이미지에 대한 탐지 및 인식 알고리즘 기술 향상
  • (디지털 복원)문화재 등 주요 희소가치 대상체의 상세 이미지 제공으로 3D 매핑 소스 활용 및 디지털 복원 기술 향상 국내 중소・벤처, 스타트업 등 AI 관련 기업들의 데이터 활용성 증대
데이터 구축 담당자
수행기관(주관) : ㈜미디어그룹사람과숲

 

 
책임자명 전화번호 대표이메일 담당업무
한윤기 02-401-4347 hanykee@hanmail.net · AI 학습용 데이터 설계/구축
· 정제, 품질관리
· 홍보, AI 시범 사이트 개발 / 가공
수행기관(참여)
 
 
기관명 담당업무 기관명 담당업무
㈜인피닉 · AI 학습용 데이터 가공
· 데이터 유효성 검증
㈜솔트룩스 · 온톨로지 기반 의미 확장
· AI시범서비스 모델 개발
가이드라인 다운로드