랜드마크 이미지 AI데이터
기본탭
구축목적
- AI 기술 및 응용서비스 개발에 활용가치가 높은 인공지능 학습용 데이터 구축 및 개방, AI응용 서비스 개발
- 국내 특성(지리 공간적, 기능적)이 반영된 국내 도심 민간건물, 공공기관, 관광명소, 편의시설 등 국내 도시별 주요 랜드마크 이미지 데이터 구축
활용분야
- 인공지능 학습용 데이터를 구축‧개방하고자 하는 기업, 협회, 출연연, 공공기관, 대학 등 민간‧공공 법인 등의 서비스 개발에 활용, 대용량 이미지 검색 및 추상화-레벨 분류 AI 모델 개발(A Large-Scale Instance-level Recognition and Image Retrieval), 랜드마크 객체 검출 AI 모델에 활용(Landmark Object Detection)
주요 키워드
- 인공지능(Artificial Intelligence), 데이터셋(Data Set), 랜드마크(Landmark)), 기계학습(Machine Learning), 딥러닝(Deep Learning), 객체 검출(Object Detection), 이미지 분류(Image Classification), 이미지 검색(Image Retrieval)
소개
- 인공지능 기반의 컴퓨터 비전 기술 및 서비스 개발에 활용하기 위한 국내 특성이 반영된 국내 도심 민간건물, 공공기관, 관광명소, 편의시설 등 국내 도시별 주요 랜드마크 이미지 데이터 구축
구축 내용 및 제공 데이터량
- AI 학습용 데이터 구축량
- 전국 50개 도시의 랜드마크(국내 공공기관, 주요 건물, 관광명소, 편의시설 등) 이미지를 구축하되 도시별 500개 랜드마크 각 200장 내외, 총 500만장 이상 이미지 구축
- 인공지능 학습용 데이터 활용 응용서비스‧제품 개발 방안
- 사전학습 모델(Pre-Trained Model) 연구 개발
: 구축된 500만장의 랜드마크 이미지를 활용하여 25,000개의 클래스(50개 도시, 500 랜드마크)를 분류하는 Instance-Level Recognition 모델과 이미지가 주어졌을때 유사 이미지를 판별하는 Retrieval 모델 개발 - 사전학습 모델을 활용한 응용서비스 개발 방안
- Instance-Level Image-classification 모델 개발
대표도면
필요성
- 국내 공공데이터의 개방수준은 세계 최고 수준이지만, AI 성능향상에 필수적인 기계학습용 데이터의 제공은 부족한 상황
- 학습용 데이터, 알고리즘, 컴퓨팅 파워는 AI 혁신의 핵심원천이나, 공공․민간의 자발적 축적‧개방을 통한 활성화 노력이 미진
- 국내 중소·벤처기업들은 AI 학습용 데이터를 자체 구축하기에 많은 시간과 비용이 소요되고 원천 데이터 확보의 어려움 호소
데이터 구조
No | 항목 | 길이 | 타입 | 필수여부 | 비고 | |
---|---|---|---|---|---|---|
한글명 | 영문명 | |||||
1 | 기본정보 | info | object | |||
1-1 | 데이터 정보 | description | 200 | string | Y | |
1-2 | 데이터 공개 URL | url | 200 | string | ||
1-3 | 데이터버전 | version | 20 | string | ||
1-4 | 데이터 공개 연도 | year | 50 | string | ||
2 | 라이센스정보 | licenses | list | |||
2-1 | 소유권 | possession | 100 | string | ||
2-2 | 라이센스 id값 | id | 50 | string | ||
3 | 이미지 정보 | images | list | |||
3-1 | 라이센스 id값 | license | 50 | string | ||
3-2 | 파일네임 | file name | 100 | number | Y | |
3-3 | 이미지 사이즈 (높이) | height | 100 100 |
number | Y | |
3-4 | 이미지 사이즈 (넓이) | width | number | Y | ||
4 | 어노테이션 정보 | Annotations | list | |||
4-1 | bounding box | type | list | Y | ||
4-2 | 대상체 클래스 | class | 100 | string | Y | |
4-3 | x좌표 | x | 200 | number | Y | |
4-4 | y좌표 | y | 200 | number | Y | |
4-5 | bounding box 사이즈(높이) | height | 200 | number | Y | |
4-6 | bounding box 사이즈(넓이) | width | 200 | number | Y | |
5 | 메타정보 | metainfo | list | |||
5-1 | 지역정보 | inlocationfo | 100 | string | Y | |
5-2 | 하위지역정보 | location_sub | 20 | string | Y | |
5-3 | 유형 | Type | 20 | string | Y | |
5-4 | 유형(하위속성) | Type_sub | 20 | string | Y | |
5-5 | 랜드마크 한글명 | landmark_kr | 50 | string | Y | |
56 | 랜드마크 주소정보 | add | 200 | string | Y |
데이터셋 구축 담당자
수행기관(주관) : ㈜피씨앤
책임자명 | 전화번호 | 대표이메일 | 담당업무 |
---|---|---|---|
안지용 | 02-565-7740 | pinusan@pcninc.co.kr | · 랜드마크이미지 AI데이터 구축 총괄 |
수행기관(참여)
기관명 | 책임자명 | 전화번호 | 대표이메일 | 담당업무 |
---|---|---|---|---|
㈜크라우드웍스 | 강진규 | 02-6954-2960 | jkkang@crowdworks.kr | · 참여기관 총괄 · 크라우드소싱을 통한 데이터 수집 및 정제 · 수집 데이터 가공 · 데이터 저작도구 개발 및 제공 |
㈜데이콘 | - | - | - | · AI해커톤 개최 및 상용서비스 개발 |
논문 인용 정보