콘텐츠로 건너뛰기 메뉴로 건너뛰기 푸터로 건너뛰기
데이터를 불러오고 있습니다
데이터를 저장하고 있습니다
#관광 #문화

디지털 K-Art 데이터

디지털 K-Art-데이터 아이콘 이미지
  • 분야문화관광
  • 유형 이미지
구축년도 : 2022 갱신년월 : 2023-12 조회수 : 7,338 다운로드 : 134 용량 :
샘플 데이터 ?

샘플데이터는 데이터의 이해를 돕기 위해 별도로 가공하여 제공하는 정보로써 원본 데이터와 차이가 있을 수 있으며,
데이터에 따라서 민감한 정보는 일부 마스킹(*) 처리가 되어 있을 수 있습니다.

※ 내국인만 데이터 신청이 가능합니다.

  • 데이터 변경이력

    데이터 변경이력
    버전 일자 변경내용 비고
    1.1 2023-12-22 데이터 최종 개방
    1.0 2023-05-04 데이터 개방(Beta Version)

    데이터 히스토리

    데이터 히스토리
    일자 변경내용 비고
    2024-04-23 데이터 설명서, 담당자 이메일 변경
    2024-01-12 산출물 전체 공개

    소개

    다양한 한국적 유물과 작품에 대한 2D 이미지 20만장 이상, 3D 이미지 1만장이상과 메타데이터 한국어/영어 30만건을 구축함

    구축목적

    디지털화된 K-Art 데이터를 통해 미술품, 유물 등의 복원 및 랜더링 연구분야 그리고 실감형 메타버스 관련 연구에 활용하기 위한 데이터를 구축함
  • 데이터 통계
    - 2D 이미지 데이터 221,291건, 3D 이미지 데이터 10,097건, 라벨링 데이터 231,388건

     
    - 2D 이미지 데이터 221,291건, 3D 이미지 데이터 10,097건, 라벨링 데이터 231,388건
    구분 포맷 형태 구축 규모(건)
    원시데이터 JPG/Obj 이미지 221,388
    원천데이터 JPG/Obj 이미지 221,388
    가공데이터 JSON 텍스트 221,388

     

    - 모델별 데이터 분포

     
    - 모델별 데이터 분포
    모델 Task 구분 Training Validation Test Total
    SE-Resnet 2D 이미지 분류 건수 177,015 22,138 22,138 221,291
    비율 80% 10% 10% 100%
    PointNet 3D 이미지 분류 건수 8,080 1,009 1,008 10,097
    비율 80% 10% 10% 100%
    Total 건수 185,095 23,147 23,146 231,388
    비율 80% 10% 10% 100%

    - 시대구분(2D/3D)

    - 시대구분(2D/3D)
    구분 2D 3D
    이미지(장) 비율 이미지(장) 비율
    고대 (선사~조선) 25548 11.54% 6689 66.25%
    근대 (대한제국~일제강점기) 6599 2.98% 1404 13.91%
    현대 (해방이후 ~) 189144 85.47% 2004 19.85%
    전체 객체 수 221,291 100.00% 10097 100.00%

     

    - 작품유형(2D/3D)

     
    - 작품유형(2D/3D)
    2D  빈도 비율 3D 작품유형 빈도 비율
    작품유형
    건축 760 0.34% 건축 210 2.08%
    조각 6,976 3.15% 조각 8,034 79.57%
    공예 31,623 14.29% 공예 65 0.64%
    악기 260 0.12% 악기 1,788 17.71%
    회화 86,489 39.08% 전체 10,097 100.00%
    서예 95,183 43.01%  
    전체 221,291 100.00%

     

  • 저작도구 설명서 및 저작도구 다운로드

    저작도구 설명서 다운로드 저작도구 다운로드
  • AI 모델 상세 설명서 다운로드

    AI 모델 상세 설명서 다운로드 AI 모델 다운로드

    모델학습

    1) 2D Image 분류모델
    - SE-Resnet은 K-art 2D 이미지 분류를 위해 검증용 이미지와 시험용 이미지를 각 클래스에 대해 10%로 구성한다. 그리고 각 클래스에 대해서 나머지 80%를 학습용 이미지로 제시한다. 전체 데이터는 약 20만장으로 이루어져 있음.
    - K-art 2D dataset인 2D Image를 입력으로 한다. 입력을 받은 2D 모델인 SE-ResNet은 각각의 분류 클래스에 대한 예측(prediction) 값을 결과물로 내놓는다. 그 후 실제 해당하는 클래스(분류) 라벨과 비교 학습하여 2D 이미지에 대한 분류 과정을 학습하는 모델임. 

    2D 분류 모델 학습과정

    3D 분류 모델 학습과정

    서비스 활용 시나리오
     1) 라벨링 활용
     - 각 미술관이나 기타 전시회에서 새롭게 전시되는 K-art 물품들에 대해서 자동적으로 labeling 하는데 활용 가능 
     2) 다른 task에 활용
     - K-art dataset으로 학습된 2D,3D classification pretrain model을 이용하여 좋은 feature를 추출하여 분류모델 외의 다른 task에 대해서 더 좋은 성능을 만드는 모델을 연구하는데 활용
     - 3D 이미지정보를 통한 문화재 3D 보존 데이터 활용
     - 신기술 기반의 체험형 콘텐츠 소스 데이터로 활용(상업적 이용은 별도 저작권 협의 필요)

    기타정보
     1) 대표성
     - 한국의 근현대 작품을 2D/3D 이미지로 수집하여, 2D는 6개 분야(건축, 공예, 조각, 악기, 서예, 회화)유형, 3D는 4개 분야(건축, 공예, 조각, 악기)를 대상으로 수집 구축함
     - 6개 분야는 십진분류법을 기준으로 실제 촬영 가능한 대상을 선별하였음

     2) 독립성
     - 한국에서 만들어진 다양한 분류로 이루어진 미술 관련 2D와 3D dataset은 이전에 만들어진 적이 없음 (타 데이터셋과 중복이 되지 않음)

  • 데이터 성능 점수

    측정값 (%)
    기준값 (%)

    데이터 성능 지표

    데이터 성능 지표
    번호 측정항목 AI TASK 학습모델 지표명 기준값 점수 측정값 점수
    1 2D 분류 모델 Image Classification SE-ResNet Accuracy 62.74 % 97.88 %
    2 3D 분류 모델 3D Object Classification PointNet Accuracy 71.38 % 85.86 %

    ※ 데이터 성능 지표가 여러 개일 경우 각 항목을 클릭하면 해당 지표의 값이 그래프에 표기됩니다.

    ※ AI모델 평가 지표에 따라 측정값의 범위, 판단 기준이 달라질 수 있습니다. (ex. 오류율의 경우, 낮을수록 좋은 성능을 내는 것으로 평가됩니다)

  • 설명서 및 활용가이드 다운로드

    데이터 설명서 다운로드 구축활용가이드 다운로드

    데이터 포맷
    1) 2D 데이터 (전체, 일부, 주요부분 이미지로 작품 당 3장의 이미지로 구성)
     - 서예 : 전통서예, 현대서예, 전각(도장), 서각(편지)
     - 회화 : 한국화, 서양화, 판화

    서예 작품 예시

    회화 작품 예시

    2) 3D 데이터 (작품당 1개 이미지로 구성)
    - 건축 : 궁전, 묘지, 성곽, 탑, 종교건물, 건축자재
    - 조각 : 목조, 석조, 금동조, 점토
    - 공예 : 도자공예, 금속공예, 보석공예, 폐류공예, 의복공예
    - 악기 : 건반악기, 타악기, 현악기, 국악기

    3D 건축 예시3D 조각 예시

    3D 공예 예시3D 악기 예시

    3) 2D-3D 연계데이터 (3D와 매핑되는 2D 이미지이며, 작품당 전/후/좌/우로 구성됨)
    - 건축 : 궁전, 묘지, 성곽, 탑, 종교건물, 건축자재
    - 조각 : 목조, 석조, 금동조, 점토
    - 공예 : 도자공예, 금속공예, 보석공예, 폐류공예, 의복공예
    - 악기 : 건반악기, 타악기, 현악기, 국악기

    2D-3D연계 건축 전/후/좌/우2D-3D연계 조각 전/후/좌/우

    2D-3D연계 공예 전/후/좌/우2D-3D연계 악기 전/후/좌/우

    데이터 구성포맷 

    데이터 구성포맷
    분류 항목 내용 타입 필수여부
    Object_Info MainCategory 대분류 String Y
    MiddleCategory 중분류 String Y
    SubCategory 소분류 String Y
    Photo_Info PhotoDate 촬영날짜 String Y
    PhotoEquipment 촬영장비 String Y
    Image_Info Width 작품 가로 길이(2D/3D) Integer Y
    length 작품 세로 길이(2D/3D) Integer Y
    Height 작품 높이(3D) Integer N
    Camera Intrinsic parameters 카메라 내부 파라메터 array Y
    Fx 초점거리(focal length) double Y
    Fy double Y
    Data_Info DataSort 2D or 3D String Y
    ImageFileName 이미지 파일명 String Y
    SourceDataExtension 원천데이터 확장자 String Y
    Rangeofuse 사용범위 String Y
    (공공누리 1유형/ 공공누리 2유형)
    Description Class_kor 작품구분(한글) String Y
    Class_eng 작품구분(영어) String Y
    ArtTitle_kor 작품명(한글) String Y
    ArtTitle_eng 작품명(영어) String Y
    ArtistName_kor 작가명(한글) String Y
    ArtistName_eng 작가명(영어) String Y
    Location_kor 소장처(한글) String Y
    Location_eng 소장처(영어) String Y
    Material_kor 재질(한글) String Y
    Material_eng 재질(영어) String Y
    Annotation polygon 2D 드로잉 정보 Array Y
    (2D)
    cuboid 3D cuboid (포인트 정보) Array Y
    (3D)

    어노테이션 포맷 (2D)

     
     
    어노테이션 포맷 (2D)
    No 항목(한글) 항목(영문) 타입 필수 범위
    1 객체 정보 Object_Info object Y  
      1-1 작품 시대(대분류) MainCategory string Y '고대', '현대', '근대'
      1-2 클래스명(중분류) MiddleCategory string Y '건축', '공예/장식미술', '서예', '악기', '조각', ‘회화’
      1-3 클래스 세부명(소분류) SubCategory string Y '한국화', '현대서예', '석조', '국악기', ‘도자공예’
    2 촬영 정보 Photo_Info object Y  
      2-1 작품 촬영 일자 PhotoDate string Y ‘2022-06-09’
      2-2 작품 촬영 도구 PhotoEquipment string Y 'Canon EOS 200D II'
    3 이미지 정보 Image_Info object Y  
      3-1 이미지 가로 길이 Width number Y 72.7
      3-2 이미지 세로 길이 Length number Y 53
      3-3 이미지 높이(3D) Height number N  (2D는 예외)
      3-4 카메라 내부 파라미터 Camera Intrinsic parameter object Y  
        3-4-1 초점거리 x fx number Y 12,396.12
        3-4-2 초점거리 y fy number Y 12,396.12
    4   Data_Info object Y  
      4-1 이미지 유형 DataSort string Y ‘2D’
      4-2 이미지 파일명 ImageFileName string Y ‘kart_3d00001’
    ‘kart_2d129884-C-8-82-1’
      4-3 원천데이터 확장자명 SourceDataExtension string Y ‘JPG’
      4-4 사용범위 Rangeofuse string Y ‘공공누리 1’, ‘공공누리 2’
    5 작품 설명 정보 Description object Y  
      5-1 한글 클래스명 Class_kor string Y 중분류명
      5-2 영문 클래스명 Class_eng string Y ‘Painting’
      5-3 한글 작품명 ArtTitle_kor string Y ‘파도’
      5-4 영문 작품명 ArtTitle_eng string Y ‘Wave’
      5-5 한글 작가명 ArtistName_kor string Y '정경훈'
      5-6 영문 작가명 ArtistName_eng string Y ‘Jung Kyunghoon’
      5-7 한글 작품 위치명 Location_kor string Y '개인'
      5-8 영문 작품 위치명 Location_eng string Y ‘Private’
      5-9 한글 작품 재료명 Material_kor string Y '종이'
      5-10 영문 작품 재료명 Material_eng string Y ‘paper’
    6 객체 라벨링 정보 Annotation_Info object Y  
      6-1 라벨링 값 Polygon array Y  
        6-2 좌표값(배열) [x,y] array Y [0,0], [4165,0],
    [4165,3009], [0,3009]

     

    실제예시 (2D)

    {
        "Object_Info": {
            "MainCategory": "현대",
            "MiddleCategory": "회화",
            "SubCategory": "현대회화"
        },
        "Photo_Info": {
            "PhotoDate": "2022-11-07",
            "PhotoEquipment": "Cannon EOS 200D II"
        },
        "Image_Info": {
            "Width": 53,
            "Length": 43,
            "Height": "N/A",
            "Camera Intrinsic parameter": {
                "fx": "12,396.12",
                "fy": "12,396.12"
            }
        },
        "Data_Info": {
            "DataSort": "2D",
            "ImageFileName": "kart_2d129895-C-8-82-3",
            "SourceDataExtension": "JPG",
            "Rangeofuse": "공공누리 2"
        },
        "Description": {
            "Class_kor": "회화",
            "Class_eng": "Painting",
            "ArtTitle_kor": " 항아리의 나들이 ",
            "ArtTitle_eng": "Outing",
            "ArtistName_kor": "정낙희",
            "ArtistName_eng": "Jung Nakhee",
            "Location_kor": "개인",
            "Location_eng": "Private",
            "Material_kor": "종이",
            "Material_eng": "Paper"
        },
        "Annotation_Info": {
            "Polygon": [
                [
                    0,
                    0,
                    545,
                    0,
                    545,
                    480,
                    0,
                    480
                ]
            ]
        }
    }

    어노테이션 포맷 (3D)

     
    어노테이션 포맷 (3D)
    No 항목(한글) 항목(영문) 타입 필수 범위
    1 객체 정보 Object_Info object Y  
      1-1 작품 시대(대분류) MainCategory string Y '고대', '현대', '근대'
      1-2 클래스명(중분류) MiddleCategory string Y '건축', '공예/장식미술', '악기', '조각', 
      1-3 클래스 세부명(소분류) SubCategory string Y '궁전', '목조', '석조', '석탑'
    2 촬영 정보 Photo_Info object Y  
      2-1 작품 촬영 일자 PhotoDate string Y ‘2022-06-09’
      2-2 작품 촬영 도구 PhotoEquipment string Y 'Canon EOS 200D II'
    3 이미지 정보 Image_Info object Y  
      3-1 이미지 가로 길이 Width number Y 22
      3-2 이미지 세로 길이 Length number Y 7.3
      3-3 이미지 높이(3D) Height number Y 45
      3-4 카메라 내부 파라미터 Camera Intrinsic parameter object Y  
        3-4-1 초점거리 x fx number Y 12,396.12
        3-4-2 초점거리 y fy number Y 12,396.12
    4   Data_Info object Y  
      4-1 이미지 유형 DataSort string Y ‘3D’
      4-2 이미지 파일명 ImageFileName string Y ‘kart_3d00729’
      4-3 원천데이터 확장자명 SourceDataExtension string Y ‘OBJ’
      4-4 사용범위 Rangeofuse string Y ‘공공누리 2’
    5 작품 설명 정보 Description object Y  
      5-1 한글 클래스명 Class_kor string Y ‘악기’
      5-2 영문 클래스명 Class_eng string Y ‘instrument’
      5-3 한글 작품명 ArtTitle_kor string Y ‘꽹과리1’
      5-4 영문 작품명 ArtTitle_eng string Y ‘kkwaenggwari’
      5-5 한글 작가명 ArtistName_kor string Y '미상'
      5-6 영문 작가명 ArtistName_eng string Y ‘unknown’
      5-7 한글 작품 위치명 Location_kor string Y '한국민속극박물관'
      5-8 영문 작품 위치명 Location_eng string Y ‘Korea Folk Drama Museum’
      5-9 한글 작품 재료명 Material_kor string Y '구리'
      5-10 영문 작품 재료명 Material_eng string Y ‘copper’
    6 객체 라벨링 정보 Annotation_Info object Y  
      6-1 라벨링 값 Cuboid array Y  
        6-1-1 좌표값(배열) [x,y] array Y [0,21,7.3], [22.21,7.3],
    [0,21,0], [22,21,0], [0,0,7.3], [22,0,7.3],
    [0,0,0], [22,0,0]

    실제예시 (3D)

    {
        "Object_Info": {
            "MainCategory": "고대",
            "MiddleCategory": "악기",
            "SubCategory": "국악기"
        },
        "Photo_Info": {
            "PhotoDate": "2022-10-26",
            "PhotoEquipment": "Canon EOS 200D II"
        },
        "Image_Info": {
            "Width": 42.3,
            "Length": 10.3,
            "Height": 53,
            "Camera Intrinsic parameter": {
                "fx": "12,396.12",
                "fy": "12,396.12"
            }
        },
        "Data_Info": {
            "DataSort": "3D",
            "ImageFileName": "kart_3d04044",
            "SourceDataExtension": "obj",
            "Rangeofuse": "공공누리 2"
        },
        "Description": {
            "Class_kor": "악기",
            "Class_eng": "instrument",
            "ArtTitle_kor": "징2",
            "ArtTitle_eng": "Jing",
            "ArtistName_kor": "미상",
            "ArtistName_eng": "unknown",
            "Location_kor": "김천민속박물관",
            "Location_eng": "Gimcheon Folk Museum",
            "Material_kor": "황동",
            "Material_eng": "Brass"
        },
        "Annotation_Info": {
            "cuboid": [
                [0, 53,10.2956],
                [42.2741,53,10.2956],
                [0,53,0],
                [42.2741,53,0],
                [0,0,10.2956],
                [42.2741,0,10.2956],
                [0,0,0],
                [42.2741,0,0]
            ]
        }
    }

     

  • 데이터셋 구축 담당자

    수행기관(주관) : 비큐에이아이
    수행기관(주관)
    책임자명 전화번호 대표이메일 담당업무
    이상규 070-7091-8072 sglee@becuai.com 실무 담당(사업관리, 품질관리)
    수행기관(참여)
    수행기관(참여)
    기관명 담당업무
    위프코 2D 이미지 수집/정제, 3D 이미지 수집/정제
    굿게이트 2D 이미지 수집/정제, 3D 이미지 수집/정제
    미디어그룹사람과숲 2D/3D 가공(라벨링)
    지티원 품질관리
    충남대학교 산학협력단 인공지능 학습모델 개발 및 검증
    데이터 관련 문의처
    데이터 관련 문의처
    담당자명 전화번호 이메일
    이상규 070-7091-8072 sglee@becuai.com
보건의료 데이터 개방 안내

보건의료 데이터는 온라인 및 오프라인 안심존을 통해 개방됩니다.

안심존이란 안심존 이용메뉴얼 안심존 이용신청
  • 인터넷과 물리적으로 분리된 온라인·오프라인 공간으로 의료 데이터를 포함하여 보안 조치가 요구되는 데이터를 다운로드 없이 접근하고 분석 가능
    * 온라인 안심존 : 보안이 보장된 온라인 네트워크를 통해 집, 연구실, 사무실 등 어디서나 접속하여 데이터에 접근하고 분석
    * 오프라인 안심존 : 추가적인 보안이 필요한 데이터를 대상으로 지정된 물리적 공간에서만 접속하여 데이터에 접근하고 분석

    1. AI 허브 접속
      신청자
    2. 안심존
      사용신청
      신청자신청서류 제출*
    3. 심사구축기관
    4. 승인구축기관
    5. 데이터 분석 활용신청자
    6. 분석모델반출신청자
  • 1. 기관생명윤리위원회(IRB) 심의 결과 통지서 [IRB 알아보기] [공용IRB 심의신청 가이드라인]
    2. 기관생명윤리위원회(IRB) 승인된 연구계획서
    3. 신청자 소속 증빙 서류 (재직증명서, 재학증명서, 근로계약서 등 택1)
    4. 안심존 이용 신청서 [다운로드]
    5. 보안서약서 [다운로드]
    ※ 상기 신청서 및 첨부 서류를 완비한 후 신청을 진행하셔야 정상적으로 절차가 이루어집니다.

  • 신청 및 이용관련 문의는 safezone1@aihub.kr 또는 02-525-7708, 7709로 문의

데이터셋 다운로드 승인이 완료 된 후 API 다운로드 서비스를 이용하실 수 있습니다.

API 다운로드 파일은 분할 압축되어 다운로드 됩니다. 분할 압축 해제를 위해서는 분할 압축 파일들의 병합이 필요하며 리눅스 명령어 사용이 필요합니다.

리눅스 OS 계열에서 다운로드 받으시길 권장하며 윈도우에서 파일 다운로드 시 wsl(리눅스용 윈도우 하위 시스템) 설치가 필요합니다.

※ 파일 병합 리눅스 명령어

find "폴더경로" -name "파일명.zip.part*" -print0 | sort -zt'.' -k2V | xargs -0 cat > "파일명.zip"

- 해당 명령어 실행 시, 실행 경로 위치에 병합 압축 파일이 생성됩니다.

- 병합된 파일 용량이 0일 경우, 제대로 병합이 되지 않은 상태이니 "폴더경로"가 제대로 입력되었는지 확인 부탁드립니다.

※ 데이터셋 소개 페이지에서 다운로드 버튼 클릭하여 승인이 필요합니다.