콘텐츠로 건너뛰기 메뉴로 건너뛰기 푸터로 건너뛰기
데이터를 불러오고 있습니다
데이터를 저장하고 있습니다
#지식재산 # 상표 # 인공지능 # AI학습용 데이터 # AI데이터 활용 모델 # 유사 이미지 검색 # 사용자 상표 이미지 # 객체 인식 # IP # Intellectual property

유사 상표 이미지 검색 서비스의 사용자 입력 이미지 데이터

유사 상표 이미지 검색 서비스의 사용자 입력 이미지 데이터 아이콘 이미지
  • 분야지식재산
  • 유형 이미지
구축년도 : 2022 갱신년월 : 2023-11 조회수 : 27,846 다운로드 : 118 용량 :
샘플 데이터 ?

샘플데이터는 데이터의 이해를 돕기 위해 별도로 가공하여 제공하는 정보로써 원본 데이터와 차이가 있을 수 있으며,
데이터에 따라서 민감한 정보는 일부 마스킹(*) 처리가 되어 있을 수 있습니다.

※ 내국인만 데이터 신청이 가능합니다.

  • 데이터 변경이력

    데이터 변경이력
    버전 일자 변경내용 비고
    1.1 2023-11-30 데이터 최종 개방
    1.0 2023-05-30 데이터 개방(Beta Version)

    데이터 히스토리

    데이터 히스토리
    일자 변경내용 비고
    2023-11-30 산출물 전체 공개

    소개

    유사 상표 검색 서비스의 사용자가 서비스를 이용하며 입력한 상표 이미지를 수집 및 정제하고 상표 도형분류코드인 ‘비엔나코드’ 중분류 기준으로 가공하여 구축한 인공지능 학습용 데이터 셋

    구축목적

    ■ 공공 데이터셋을 이용해 개발한 서비스로부터 얻은 데이터를 다시 데이터셋으로 공개함으로써 ‘데이터 활용·환류’ 에 기여
    ■ 창의적인 도형으로 이루어진 상표 이미지를 인공지능 학습에 적합한 형태로 가공하여 데이터셋으로 공개하여 관련 연구에 기여
  • 1. 데이터 구축 규모

     

    1. 데이터 구축 규모
    데이터 구분 수량 데이터 형식 용량
    원천데이터 279,595 장 이미지(.jpg) 16.31GB
    라벨링 데이터 517,620 개 어노테이션(.json) 407.81MB


    2. 데이터 분포

    ■ 원천데이터: 국제상품분류(Nice classification)* 분포
      - 국제상품분류는 상표를 출원하고자 하는 산업군을 총 45개로 정의해놓은 국제기준

     

    *원천데이터(이미지) 기준

    원천데이터(이미지) 기준
    구분 비율(%) 구분 비율(%)
    nc01 2.22 nc24 2.22
    nc02 2.22 nc25 2.22
    nc03 2.22 nc26 2.22
    nc04 2.22 nc27 2.22
    nc05 2.22 nc28 2.22
    nc06 2.22 nc29 2.22
    nc07 2.22 nc30 2.22
    nc08 2.22 nc31 2.22
    nc09 2.22 nc32 2.22
    nc10 2.22 nc33 2.22
    nc11 2.22 nc34 2.22
    nc12 2.22 nc35 2.22
    nc13 2.22 nc36 2.22
    nc14 2.22 nc37 2.22
    nc15 2.22 nc38 2.22
    nc16 2.22 nc39 2.22
    nc17 2.22 nc40 2.22
    nc18 2.22 nc41 2.22
    nc19 2.22 nc42 2.22
    nc20 2.22 nc43 2.22
    nc21 2.22 nc44 2.22
    nc22 2.22 nc45 2.22
    nc23 2.22 총 합 100%

     


    ■ 라벨링데이터: 비엔나 코드 중분류 기준 분포
     - 라벨링 데이터는 소분류 기준으로 할 경우 클래스가 1,400개 이상이 되므로, 비엔나코드 중분류(앞에서 4자리) 기준 총 137개의 클래스를 제공

     

    *라벨링 데이터 기준

    라벨링 데이터 기준
    구분 설명 비율(%) 구분 설명 비율(%)
    101 별, 혜성 1.678 1409 농업용 또는 원예용 도구, 쇄빙 도끼 0.016
    103 태양 0.838 1411 사다리 0.008
    105 지구, 지구본, 행성 0.955 1501 산업용 또는 농업용 기계, 산업설비, 모터, 엔진, 다양한 기계장치 0.195
    107 0.162 1503 가사 용도의 기계, 물레 0.015
    111 성좌, 성군, 별이 있는 하늘, 천구의, 천체지도 0.163 1505 사무용 기계 0.003
    113 고대<아밀러리> 천구의, 천문관, 천문궤도, 원자 모형, 분자 모형 0.256 1507 바퀴, 베어링 0.283
    115 자연현상 1.826 1509 전기 장치 0.118
    117 지리학적 지도, 평면 천체도(성좌도) 0.161 1601 통신, 녹음 또는 재생, 컴퓨터 0.324
    201 남성 2.23 1603 사진 촬영, 영화 촬영, 광학 0.151
    203 여성 0.726 1701 시계류 0.091
    205 어린이 0.437 1702 보석류 0.105
    207 혼성 그룹, 단체장면 0.299 1703 저울, 체중계, 저울추 0.021
    209 신체의 일부, 골격, 두개골 1.471 1705 측정 기구 0.095
    301 네발짐승 (I 계열군) 1.079 1801 육상 차량 0.367
    302 네발짐승 (II 계열군) 0.21 1802 동물용구 0.042
    303 네발짐승 (III 계열군) 0.233 1803 수중 및 수륙양용 운송구 0.303
    304 네발짐승 (IV 계열군) 0.655 1804 닻, 부표, 구명대(조끼) 0.054
    305 네발짐승 (V 계열군) 0.319 1805 항공 또는 우주 수송 기구 0.224
    306 네발짐승의 신체의 일부, 골격, 두개골 0.148 1807 교통 신호 및 이정표 0.047
    307 조류, 박쥐 1.484 1901 대형 용기 0.128
    309 수생 동물, 전갈 0.683 1903 소형 용기 0.354
    311 파충류, 양서류, 달팽이, 바다표범, 강치, 물개 0.313 1907 병, 휴대용기 0.453
    313 곤충, 거미, 미생물 0.448 1908 병의 일부 또는 병 부분품 0.017
    315 기타 다른 동물; 선사시대 거대 동물 0.014 1909 암포라, 항아리, 꽃병, 화분, 꽃받이 0.039
    317 본 류의 각기 다른 군에 속하는 동물의 집단 0.017 1911 실험실 및 의약용 용기 0.06
    401 날개 또는 뿔을 가진 사람 0.217 1913 내과 또는 외과 장비, 기구 또는 용품, 인공 보철물, 의족, 의치, 내복약 0.15
    402 반인반수 0.038 1919 각종 잡다한 제품 0.007
    403 전설적 동물 0.201 2001 필기·제도 또는 그림용 재료, 소형 사무용품 0.1
    405 사람 또는 동물을 나타내는 식물, 물체 또는 기하도형; 마스크·공상적 형태의 머리·식별하기 힘든 머리 형태 1.26 2005 종이, 문서 0.373
    501 나무, 관목 0.701 2007 서적, 제본, 신문 0.08
    503 나뭇잎, 침엽, 나뭇잎 또는 침엽을 가지는 나뭇가지 1.825 2101 게임용구, 장난감 0.254
    505 화초, 과수 꽃 1.582 2103 스포츠 용품, 회전목마 0.353
    507 곡물, 씨앗, 과일 0.953 2201 악기, 악기 부속품, 음악 부속품 0.116
    509 야채 0.294 2203 0.033
    511 기타 다른 식물 0.255 2205 그림, 조각 0.055
    513 식물로 만들어진 장식품 0.22 2301 휴대용 무기, 화약을 사용하지 않은 기타 다른 무기 0.09
    601 산, 바위, 동굴 0.195 2303 화기, 탄약, 폭발물 0.035
    603 물, 강 또는 개울이 있는 풍경 0.123 2305 갑옷 0.05
    606 사막 또는 열대 풍경 0.024 2401 방패 1.005
    607 도시 풍경 또는 마을 풍경 0.098 2403 인장, 도장, 스탬프 1.025
    619 기타 다른 풍경 0.217 2405 메달(훈장), 주화, 훈위 0.176
    701 거주지, 빌딩, 광고판 또는 광고기둥, 동물우리 또는 사육장 0.878 2407 깃발 0.287
    703 거주지 또는 빌딩의 일부, 인테리어 0.202 2409 왕관, 보석이 박힌 머리띠 장식 0.756
    705 기념비, 경기장, 분수 0.25 2411 표장, 기장 0.121
    711 대형 건조물 0.099 2413 십자가 0.612
    715 건축 자재, 벽, 문 또는 장벽, 비계 0.118 2415 화살(표) [Note] 다트 포함 1.438
    801 제과 제품, 페이스트리, 과자류, 초콜릿 0.345 2417 기호, 표시, 심볼 1.659
    803 우유, 유제품, 치즈 0.042 2501 장식용 무늬(장식재) 1.935
    805 육류, 돈육, 생선류 0.097 2503 수평으로 길게 늘여진 장식 0.693
    807 기타 다른 음식물 0.269 2505 두 개 또는 네 개로 분할된 배경 2.916
    901 의류를 제외한 직물, 재봉틀(직조기)의 북 0.29 2507 도형 또는 문자가 반복 표현된 표면 또는 배경 1.185
    903 의류 0.201 2512 기타 다른 장식으로 덮인 표면 또는 배경 0.158
    905 재봉(바느질) 부속품, 옷본 0.044 2601 원, 타원 7.695
    907 모자류 0.293 2602 원 또는 타원의 절단부 또는 부채꼴 0.422
    909 신발류 0.095 2603 삼각형, 각을 형성하는 선 2.135
    1001 담배, 흡연 기구, 성냥 0.034 2604 사변형 14.987
    1003 여행용품, 부채, 가방 0.189 2605 기타 다각형 0.581
    1005 세면용품, 거울 0.074 2607 병렬로 놓이거나 접하거나 또는 교차된 2종의 기하도형 1.118
    1101 나이프, 포크 및 숟가락, 주방용품 및 기계 0.238 2611 선, 띠 6.399
    1103 음료용기, 접시 및 식기류, 음식 또는 음료를 요리·준비 및 서빙하기 위한 주방용품 0.484 2613 기타 기하 도형, 정의하기 곤란한 도형 0.659
    1107 기타 다른 가사 용품 0.026 2615 기하학적 입체도형 1.138
    1201 가구 0.099 2701 기하학적 도형을 형성하는 문자 또는 숫자, 원근법으로 쓰여지거나 인쇄된 문자 또는 숫자 0.789
    1203 위생 설비 0.025 2703 사람, 동물, 식물 또는 대상(천체 또는 자연현상, 사물 포함)을 표현하는 문자 또는 숫자 1.243
    1301 조명, 무선 밸브(진공관) 0.147 2705 특이 서체를 표현하는 문자 8.484
    1303 가열·조리 또는 냉장 기구, 세탁 기계, 건조 기구 0.06 2707 특이 서체를 표현하는 숫자 0.261
    1401 관, 케이블, 중(대형) 철물용구 0.13 2709 알파벳 문자 도형 4.725
    1403 소형 철물, 스프링 0.194 2803 중국, 일본 또는 한국 문자 0.008
    1405 자물쇠용 열쇠, 자물쇠, 맹꽁이 자물쇠 0.12 2817 고대 설형 문자 또는 상형 문자 0.003
    1407 연장 0.13 총 합 100%
  • 저작도구 설명서 및 저작도구 다운로드

    저작도구 설명서 다운로드 저작도구 다운로드
  • AI 모델 상세 설명서 다운로드

    AI 모델 상세 설명서 다운로드 AI 모델 다운로드

    1. 인공지능 기반 상표 이미지 객체 탐지 모델

    ◾ 개발 목표: 사용자 입력 상표 이미지 내 비엔나코드에 해당하는 객체(도형) 탐지
    ◾ 개발 내용: 구축되는 학습데이터를 활용 YOLOv5 기반 상표 이미지에서 라벨(비엔나코드 중분류)에 해당하는 객체(도형)를 탐지함.


    ◾ 상표 이미지 객체 탐지 YOLOv5 모델의 기본 구조는 다음과 같음.

    상표 이미지 객체 탐지 YOLOv5 모델의 기본 구조
    YOLOv5 구조

    YOLOv5 구조 YOLO의 작동 방식 이미지

    [그림] YOLO의 작동 방식

    설명 • Step object detection 기법을 제안하여 기존의 모형보다 객체 검출 속도 및 정확도가 획기적으로 향상되었으며, 해당 모형에 대한 설명은 아래와 같음.
    • YOLO에서 활용되는 CNN의 입력 크기는 수식 416×416으로 가로와 세로 길이 비율이 동일하나, 일반적인 영상 데이터의 가로 세로 비율이 1:1이 아닌 경우 영상에 여백을 추가하여 가로 세로의 비율을 1:1로 조정함.
    • 가로와 세로의 비율이 조정된 영상 데이터를 이미지로 분할하여 CNN에 통과시키며, fully connected layer까지 통과된 특성 벡터를 아래 식과 같은 형태로 변환함.

     수식 7×7×((Anchors×parameters)+classnumbers)식(1)

    • 위의 식에서 수식 Anchors는 anchor의 개수를 의미하며, 수식 parameters수식 Pₒ(object가 존재할 확률), 수식 x,y,w,h (x center, y center, width, height), 수식 classnumbers는 클래스 개수를 의미함.
    • 각 그리드 셀에서 수식 Pₒ가 threshhold 미만으로 나타난 bounding box를 제거하며, threshhold 이상으로 나타난 bounding box 중 region별로 수식 Pₒ가 가장 높은 boundig box만 남김으로써 객체의 위치 및 클래스를 검출함.

     

    2. 응용서비스 - 상표 이미지 기반 유사 이미지 검색 서비스 ‘마크뷰’ 고도화

    ◾ 전문가뿐만 아니라 일반인도 쉽게 사용할 수 있는 유사 상표 이미지 및 텍스트 검색 플랫폼 개발을 통해 상표권/디자인권 보호 및 지식재산권 취약계층 격차 해소
    ◾ 본 개발을 통해, 지식재산보호 취약계층인 중소기업, 소상공인에 대한 지식재산보호 강화, 노동집약적인 지식재산 산업에 인공지능 기술을 접목하여 기술 선진화에 이바지하고자 함.

     

    응용서비스인 유사 상표 이미지와 텍스트 검색 서비스 '마크뷰' 화면

    [그림] 유사 상표 이미지/텍스트 검색 서비스 ‘마크뷰’

  • 데이터 성능 점수

    측정값 (%)
    기준값 (%)

    데이터 성능 지표

    데이터 성능 지표
    번호 측정항목 AI TASK 학습모델 지표명 기준값 점수 측정값 점수
    1 상표 인식 성능 Object Detection YOLO v5 mAP 60 % 60 %

    ※ 데이터 성능 지표가 여러 개일 경우 각 항목을 클릭하면 해당 지표의 값이 그래프에 표기됩니다.

    ※ AI모델 평가 지표에 따라 측정값의 범위, 판단 기준이 달라질 수 있습니다. (ex. 오류율의 경우, 낮을수록 좋은 성능을 내는 것으로 평가됩니다)

  • 설명서 및 활용가이드 다운로드

    데이터 설명서 다운로드 구축활용가이드 다운로드

    1. 데이터 개요
    ■ 상표 출원시, 유사한 상표가 있을 경우 등록이 거절되는 경우가 존재하므로 출원 이전에 유사한 선등록상표의 존재여부를 조사하는것이 필수적임.
    ■ 유사상표 검색 서비스를 이용하는 사용자가 제공한 상표 이미지를 수집하여, 이를 도형 분류코드인 ‘비엔나 코드’ 기준으로 가공하여 인공지능 학습용 데이터셋을 구축함.
    ■ 하나의 상표 이미지에서 평균적으로 2.5개 이상의 비엔나코드를 부여하므로, 이를 바탕으로 원천데이터는 20만건, 라벨링 데이터는 50만건 이상을 구축 목표로 함.

     

    2. 원천데이터
    ■ 예시

     

    원천데이터 예시 상표 1 날개 달린 말 그림원천데이터 예시 상표 2 무지개 그림

     

    ■ 디렉토리 구조:  국제상품분류(Nice classification)* 기준
      - 국제상품분류는 상표를 출원하고자 하는 산업군을 총 45개로 정의해놓은 국제기준
       - 본 사업에서는 유사상표 이미지 검색 서비스를 통해 이미지를 검색 할 경우 사용자에게 상품 분류(상표를 출원하고자 하는 산업군)를 선택하여 검색하도록 하므로 이미지 분류의 기준으로 삼음.

     

    디렉토리 구조
    No Field name Meaning 구조
    1 nc01 상품분류(Nice Classification) 1류에 속하는 상표 디렉토리 구조 폴더 아이콘 nc01부터 nc45까지 일렬로 나열
    2 nc02 상품분류(Nice Classification) 2류에 속하는 상표
    3 nc03 상품분류(Nice Classification) 3류에 속하는 상표
    4 nc04 상품분류(Nice Classification) 4류에 속하는 상표
    5 nc05 상품분류(Nice Classification) 5류에 속하는 상표
    6 nc06 상품분류(Nice Classification) 6류에 속하는 상표
    7 nc07 상품분류(Nice Classification) 7류에 속하는 상표
    8 nc08 상품분류(Nice Classification) 8류에 속하는 상표
    9 nc09 상품분류(Nice Classification) 9류에 속하는 상표
    10 nc10 상품분류(Nice Classification) 10류에 속하는 상표
    11 nc11 상품분류(Nice Classification) 11류에 속하는 상표
    12 nc12 상품분류(Nice Classification) 12류에 속하는 상표
    13 nc13 상품분류(Nice Classification) 13류에 속하는 상표
    14 nc14 상품분류(Nice Classification) 14류에 속하는 상표
    15 nc15 상품분류(Nice Classification) 15류에 속하는 상표
    16 nc16 상품분류(Nice Classification) 16류에 속하는 상표
    17 nc17 상품분류(Nice Classification) 17류에 속하는 상표
    18 nc18 상품분류(Nice Classification) 18류에 속하는 상표
    19 nc19 상품분류(Nice Classification) 19류에 속하는 상표
    20 nc20 상품분류(Nice Classification) 20류에 속하는 상표
    21 nc21 상품분류(Nice Classification) 21류에 속하는 상표
    22 nc22 상품분류(Nice Classification) 22류에 속하는 상표
    23 nc23 상품분류(Nice Classification) 23류에 속하는 상표
    24 nc24 상품분류(Nice Classification) 24류에 속하는 상표
    25 nc25 상품분류(Nice Classification) 25류에 속하는 상표
    26 nc26 상품분류(Nice Classification) 26류에 속하는 상표
    27 nc27 상품분류(Nice Classification) 27류에 속하는 상표
    28 nc28 상품분류(Nice Classification) 28류에 속하는 상표
    29 nc29 상품분류(Nice Classification) 29류에 속하는 상표
    30 nc30 상품분류(Nice Classification) 30류에 속하는 상표
    31 nc31 상품분류(Nice Classification) 31류에 속하는 상표
    32 nc32 상품분류(Nice Classification) 32류에 속하는 상표
    33 nc33 상품분류(Nice Classification) 33류에 속하는 상표
    34 nc34 상품분류(Nice Classification) 34류에 속하는 상표
    35 nc35 상품분류(Nice Classification) 35류에 속하는 상표
    36 nc36 상품분류(Nice Classification) 36류에 속하는 상표
    37 nc37 상품분류(Nice Classification) 37류에 속하는 상표
    38 nc38 상품분류(Nice Classification) 38류에 속하는 상표
    39 nc39 상품분류(Nice Classification) 39류에 속하는 상표
    40 nc40 상품분류(Nice Classification) 40류에 속하는 상표
    41 nc41 상품분류(Nice Classification) 41류에 속하는 상표
    42 nc42 상품분류(Nice Classification) 42류에 속하는 상표
    43 nc43 상품분류(Nice Classification) 43류에 속하는 상표
    44 nc44 상품분류(Nice Classification) 44류에 속하는 상표
    45 nc45 상품분류(Nice Classification) 45류에 속하는 상표

     

    2. 라벨링 데이터
    ■ 원천데이터에 비엔나코드 기준으로 가공하여 라벨링 데이터를 생성
    ■ 비엔나 코드
     - 비엔나 분류 코드(도형분류코드)는 상표의 표장에 포함된 도형, 기호, 문자, 입체적 형상, 색채, 동작, 홀로그램, 소리·냄새 등을 시각적인 방법으로 사실적으로 표현한 구성요소를 비엔나 분류라는 국제기준에 따라 6자리의 숫자로 기호화한 것임.
     - 예시: 남자어부 도형의 경우 “사람-남자-어부(02-01-12)”로 표시
     

    라벨링 데이터
    구분 속성명 타입 필수여부 설명 범위 비고
    1 images array Y 이미지    
      1-1 fileName string Y 이미지파일명    
      1-2 img_w number Y 이미지너비    
      1-3 img_h number Y 이미지높이    
      1-4 img_id number Y 이미지식별자    
      1-5 tot_mid_vienna_code array Y 전체비엔나코드중분류    
      1-6 tot_vienna_code array Y 전체비엔나코드    
      1-7 niceClassification string Y 상품분류 [01~45]  
      1-8 item_sort string Y 이미지분류구분    
      1-9 tmDivisionCode string N 명칭구분코드    
    2 annotation object Y 어노테이션    
      2-1 bbox array Y 바운딩박스    
      2-1-1 bbox_id string Y 바운딩박스식별자    
     
        2-1-2 fileName string Y 이미지파일명    
        2-1-3 mid_vienna_code string Y 비엔나코드 중분류    
        2-1-4 points array Y 바운딩박스 좌표    
      2-2 polygon array N 객체 세그멘테이션    
        2-2-1 poly_id string Y 세그멘테이션식별자    
        2-2-2 fileName string Y 이미지파일명    
        2-2-3 mid_vienna_code string Y 비엔나코드 중분류    
        2-2-4 points array Y 세그멘테이션 좌표  
     

     

    3. 라벨링데이터 실제예시

     

    라벨링데이터 실제예시 코드

     

  • 데이터셋 구축 담당자

    수행기관(주관) : ㈜마크클라우드
    수행기관(주관)
    책임자명 전화번호 대표이메일 담당업무
    정상일 02-1833-4992 sijeong@markcloud.co.kr 총괄
    수행기관(참여)
    수행기관(참여)
    기관명 담당업무
    ㈜라임솔루션 AI 모델 개발, 데이터 검수
    ㈜아이웹 홍보 / 마케팅, 서비스 구축
    특허법인로얄 AI 학습용 데이터 검수, 데이터 품질 관리, 법적 이슈사항 검토
    해율특허법률사무소 사용자 입력 이미지 데이터 구축 및 품질관리, 법적이슈사항 검토, 공모전 개최
    데이터 관련 문의처
    데이터 관련 문의처
    담당자명 전화번호 이메일
    정상일 02-1833-4992 sijeong@markcloud.co.kr
보건의료 데이터 개방 안내

보건의료 데이터는 온라인 및 오프라인 안심존을 통해 개방됩니다.

안심존이란 안심존 이용메뉴얼 안심존 이용신청 데이터 열람신청
  • 인터넷과 물리적으로 분리된 온라인·오프라인 공간으로 의료 데이터를 포함하여 보안 조치가 요구되는 데이터를 다운로드 없이 접근하고 분석 가능
    * 온라인 안심존 : 보안이 보장된 온라인 네트워크를 통해 집, 연구실, 사무실 등 어디서나 접속하여 데이터에 접근하고 분석
    * 오프라인 안심존 : 추가적인 보안이 필요한 데이터를 대상으로 지정된 물리적 공간에서만 접속하여 데이터에 접근하고 분석

    1. AI 허브 접속
      신청자
    2. 안심존
      사용신청
      신청자신청서류 제출*
    3. 심사구축기관
    4. 승인구축기관
    5. 데이터 분석 활용신청자
    6. 분석모델반출신청자
  • 1. 기관생명윤리위원회(IRB) 심의 결과 통지서 [IRB 알아보기] [공용IRB 심의신청 가이드라인]
    2. 기관생명윤리위원회(IRB) 승인된 연구계획서
    3. 신청자 소속 증빙 서류 (재직증명서, 재학증명서, 근로계약서 등 택1)
    4. 안심존 이용 신청서 [다운로드]
    5. 보안서약서 [다운로드]
    ※ 상기 신청서 및 첨부 서류를 완비한 후 신청을 진행하셔야 정상적으로 절차가 이루어집니다.

  • 신청 및 이용관련 문의는 safezone1@aihub.kr 또는 02-525-7708, 7709로 문의

데이터셋 다운로드 승인이 완료 된 후 API 다운로드 서비스를 이용하실 수 있습니다.

API 다운로드 파일은 분할 압축되어 다운로드 됩니다. 분할 압축 해제를 위해서는 분할 압축 파일들의 병합이 필요하며 리눅스 명령어 사용이 필요합니다.

리눅스 OS 계열에서 다운로드 받으시길 권장하며 윈도우에서 파일 다운로드 시 wsl(리눅스용 윈도우 하위 시스템) 설치가 필요합니다.

※ 파일 병합 리눅스 명령어

find "폴더경로" -name "파일명.zip.part*" -print0 | sort -zt'.' -k2V | xargs -0 cat > "파일명.zip"

- 해당 명령어 실행 시, 실행 경로 위치에 병합 압축 파일이 생성됩니다.

- 병합된 파일 용량이 0일 경우, 제대로 병합이 되지 않은 상태이니 "폴더경로"가 제대로 입력되었는지 확인 부탁드립니다.

※ 데이터셋 소개 페이지에서 다운로드 버튼 클릭하여 승인이 필요합니다.

오프라인 데이터 이용 안내

본 데이터는 K-ICT 빅데이터센터에서도 이용하실 수 있습니다.

K-ICT 빅데이터센터는 데이터 안심구역으로 지정되어
다양한 데이터(미개방 데이터 포함)를 분석할 수 있는 오프라인 분석공간을 제공하고 있습니다.

데이터 안심구역 이용절차 및 신청은 K-ICT빅데이터센터 홈페이지를 참고하시기 바랍니다.