AI Hub

랜드마크 이미지 소개

랜드마크 이미지 소개

데이터셋명 랜드마크 이미지
데이터 분야 비전 데이터 유형 이미지
구축기관 피씨앤 데이터 관련 문의처 담당자명 강진규(크라우드웍스)
가공기관 크라우드웍스 전화번호 02-6954-2960
검수기관 크라우드웍스 이메일 jkkang@crowdworks.kr
구축 데이터량 500만장 이상 구축년도 2020년
버전 1.1 최종수정일자 2021.12.03
소개 인공지능 기반의 컴퓨터 비전 기술 및 서비스 개발에 활용하기 위해 국내 특성(지리 공간적, 기능적)이 반영된 국내 도심 민간건물, 공공기관, 관광명소, 편의시설 등 국내 도시별 주요 랜드마크 이미지 데이터 구축
주요 키워드 인공지능(Artificial Intelligence), 데이터셋(Data Set), 랜드마크(Landmark)), 기계학습(Machine Learning), 딥러닝(Deep Learning), 객체 검출(Object Detection), 이미지 분류(Image Classification), 이미지 검색(Image Retrieval)
저작권 및 이용정책 본 데이터는 과학기술정보통신부가 주관하고 한국지능정보사회진흥원이 지원하는 '인공지능 학습용 데이터 구축사업'으로 구축된 데이터입니다. [데이터 이용정책 상세보기]
데이터설명서 자료보기 구축활용가이드 자료보기
샘플데이터 다운로드 교육활용동영상 영상보기
저작도구 다운로드 AI모델 다운로드
데이터 변경이력
데이터 변경이력
버전 일자 변경내용 비고
1.1 2021.12.03 데이터 추가 개방  
1.0 2021.06.30 데이터 최초 개방  
구축목적
  • AI 기술 및 응용서비스 개발에 활용가치가 높은 인공지능 학습용 데이터 구축 및 개방, AI응용 서비스 개발
  • 국내 특성(지리 공간적, 기능적)이 반영된 국내 도심 민간건물, 공공기관, 관광명소, 편의시설 등 국내 도시별 주요 랜드마크 이미지 데이터 구축
활용분야
  • 인공지능 학습용 데이터를 구축‧개방하고자 하는 기업, 협회, 출연연, 공공기관, 대학 등 민간‧공공 법인 등의 서비스 개발에 활용, 대용량 이미지 검색 및 추상화-레벨 분류 AI 모델 개발(A Large-Scale Instance-level Recognition and Image Retrieval), 랜드마크 객체 검출 AI 모델에 활용(Landmark Object Detection)
주요 키워드
  • 인공지능(Artificial Intelligence), 데이터셋(Data Set), 랜드마크(Landmark)), 기계학습(Machine Learning), 딥러닝(Deep Learning), 객체 검출(Object Detection), 이미지 분류(Image Classification), 이미지 검색(Image Retrieval)
소개
  • 인공지능 기반의 컴퓨터 비전 기술 및 서비스 개발에 활용하기 위한 국내 특성이 반영된 국내 도심 민간건물, 공공기관, 관광명소, 편의시설 등 국내 도시별 주요 랜드마크 이미지 데이터 구축
구축 내용 및 제공 데이터량
  • AI 학습용 데이터 구축량
    - 전국 50개 도시의 랜드마크(국내 공공기관, 주요 건물, 관광명소, 편의시설 등) 이미지를 구축하되 도시별 500개 랜드마크 각 200장 내외, 총 500만장 이상 이미지 구축

랜드마크 이미지 AI 학습용 데이터 구축량 예시 이미지

  • 인공지능 학습용 데이터 활용 응용서비스‧제품 개발 방안
    - 사전학습 모델(Pre-Trained Model) 연구 개발
    : 구축된 500만장의 랜드마크 이미지를 활용하여 25,000개의 클래스(50개 도시, 500 랜드마크)를 분류하는 Instance-Level Recognition 모델과 이미지가 주어졌을때 유사 이미지를 판별하는 Retrieval 모델 개발
  • 사전학습 모델을 활용한 응용서비스 개발 방안
    - Instance-Level Image-classification 모델 개발
대표도면

랜드마크 이미지 수집 저작도구
< 랜드마크 이미지 수집 저작도구 >

 

필요성
  • 국내 공공데이터의 개방수준은 세계 최고 수준이지만, AI 성능향상에 필수적인 기계학습용 데이터의 제공은 부족한 상황
  • 학습용 데이터, 알고리즘, 컴퓨팅 파워는 AI 혁신의 핵심원천이나, 공공․민간의 자발적 축적‧개방을 통한 활성화 노력이 미진
  • 국내 중소·벤처기업들은 AI 학습용 데이터를 자체 구축하기에 많은 시간과 비용이 소요되고 원천 데이터 확보의 어려움 호소
데이터 구조
특허 데이터 구축내용 표 (구축년도,데이터종류,포함내용,제공방식)
No 항목 길이 타입 필수여부 비고
한글명 영문명
1 기본정보 info   object    
1-1 데이터 정보 description 200 string Y  
1-2 데이터 공개 URL url 200 string    
1-3 데이터버전 version 20 string    
1-4 데이터 공개 연도 year 50 string    
2 라이센스정보 licenses   list    
2-1 소유권 possession 100 string    
2-2 라이센스 id값 id 50 string    
3 이미지 정보 images   list    
3-1 라이센스 id값 license 50 string    
3-2 파일네임 file name 100 number Y  
3-3 이미지 사이즈 (높이) height 100
100
number Y  
3-4 이미지 사이즈 (넓이) width   number Y  
4 어노테이션 정보 Annotations   list    
4-1 bounding box type   list Y  
4-2 대상체 클래스 class 100 string Y  
4-3 x좌표 x 200 number Y  
4-4 y좌표 y 200 number Y  
4-5 bounding box 사이즈(높이) height 200 number Y  
4-6 bounding box 사이즈(넓이) width 200 number Y  
5 메타정보 metainfo   list    
5-1 지역정보 inlocationfo 100 string Y  
5-2 하위지역정보 location_sub 20 string Y  
5-3 유형 Type 20 string Y  
5-4 유형(하위속성) Type_sub 20 string Y  
5-5 랜드마크 한글명 landmark_kr 50 string Y  
56 랜드마크 주소정보 add 200 string Y  
데이터셋 구축 담당자
수행기관(주관) : 피씨앤
수행기관(주관) 표
책임자명 전화번호 대표이메일 담당업무
안지용 02-565-7740 pinusan@pcninc.co.kr · 랜드마크이미지 AI데이터 구축 총괄
수행기관(참여)
 
기관명 책임자명 전화번호 대표이메일 담당업무
크라우드웍스 강진규 02-6954-2960 jkkang@crowdworks.kr · 참여기관 총괄
· 크라우드소싱을 통한 데이터 수집 및 정제
· 수집 데이터 가공
· 데이터 저작도구 개발 및 제공
㈜데이콘 - - - · AI해커톤 개최 및 상용서비스 개발