-
데이터 변경이력
데이터 변경이력 버전 일자 변경내용 비고 1.1 2023-12-22 데이터 최종 개방 1.0 2023-05-04 데이터 개방(Beta Version) 데이터 히스토리
데이터 히스토리 일자 변경내용 비고 2024-04-23 데이터 설명서, 담당자 이메일 변경 2024-01-12 산출물 전체 공개 소개
다양한 한국적 유물과 작품에 대한 2D 이미지 20만장 이상, 3D 이미지 1만장이상과 메타데이터 한국어/영어 30만건을 구축함
구축목적
디지털화된 K-Art 데이터를 통해 미술품, 유물 등의 복원 및 랜더링 연구분야 그리고 실감형 메타버스 관련 연구에 활용하기 위한 데이터를 구축함
-
메타데이터 구조표 데이터 영역 문화관광 데이터 유형 이미지 데이터 형식 JPG(2D), OBJ(3D) 데이터 출처 직접 촬영 (저작권 협의된 박물관, 전시장, 개인소장품 등) 라벨링 유형 세그멘테이센(2D: 폴리곤 3D: 큐보이드) 라벨링 형식 JSON 데이터 활용 서비스 가상박물관(VR, XR) 데이터 구축년도/
데이터 구축량2022년/2D 이미지 : 221392장, 3D 이미지 : 10097장 -
데이터 통계
- 2D 이미지 데이터 221,291건, 3D 이미지 데이터 10,097건, 라벨링 데이터 231,388건- 2D 이미지 데이터 221,291건, 3D 이미지 데이터 10,097건, 라벨링 데이터 231,388건 구분 포맷 형태 구축 규모(건) 원시데이터 JPG/Obj 이미지 221,388 원천데이터 JPG/Obj 이미지 221,388 가공데이터 JSON 텍스트 221,388 - 모델별 데이터 분포
- 모델별 데이터 분포 모델 Task 구분 Training Validation Test Total SE-Resnet 2D 이미지 분류 건수 177,015 22,138 22,138 221,291 비율 80% 10% 10% 100% PointNet 3D 이미지 분류 건수 8,080 1,009 1,008 10,097 비율 80% 10% 10% 100% Total 건수 185,095 23,147 23,146 231,388 비율 80% 10% 10% 100% - 시대구분(2D/3D)
- 시대구분(2D/3D) 구분 2D 3D 이미지(장) 비율 이미지(장) 비율 고대 (선사~조선) 25548 11.54% 6689 66.25% 근대 (대한제국~일제강점기) 6599 2.98% 1404 13.91% 현대 (해방이후 ~) 189144 85.47% 2004 19.85% 전체 객체 수 221,291 100.00% 10097 100.00% - 작품유형(2D/3D)
- 작품유형(2D/3D) 2D 빈도 비율 3D 작품유형 빈도 비율 작품유형 건축 760 0.34% 건축 210 2.08% 조각 6,976 3.15% 조각 8,034 79.57% 공예 31,623 14.29% 공예 65 0.64% 악기 260 0.12% 악기 1,788 17.71% 회화 86,489 39.08% 전체 10,097 100.00% 서예 95,183 43.01% 전체 221,291 100.00% -
-
AI 모델 상세 설명서 다운로드
AI 모델 상세 설명서 다운로드 AI 모델 다운로드모델학습
1) 2D Image 분류모델
- SE-Resnet은 K-art 2D 이미지 분류를 위해 검증용 이미지와 시험용 이미지를 각 클래스에 대해 10%로 구성한다. 그리고 각 클래스에 대해서 나머지 80%를 학습용 이미지로 제시한다. 전체 데이터는 약 20만장으로 이루어져 있음.
- K-art 2D dataset인 2D Image를 입력으로 한다. 입력을 받은 2D 모델인 SE-ResNet은 각각의 분류 클래스에 대한 예측(prediction) 값을 결과물로 내놓는다. 그 후 실제 해당하는 클래스(분류) 라벨과 비교 학습하여 2D 이미지에 대한 분류 과정을 학습하는 모델임.서비스 활용 시나리오
1) 라벨링 활용
- 각 미술관이나 기타 전시회에서 새롭게 전시되는 K-art 물품들에 대해서 자동적으로 labeling 하는데 활용 가능
2) 다른 task에 활용
- K-art dataset으로 학습된 2D,3D classification pretrain model을 이용하여 좋은 feature를 추출하여 분류모델 외의 다른 task에 대해서 더 좋은 성능을 만드는 모델을 연구하는데 활용
- 3D 이미지정보를 통한 문화재 3D 보존 데이터 활용
- 신기술 기반의 체험형 콘텐츠 소스 데이터로 활용(상업적 이용은 별도 저작권 협의 필요)기타정보
1) 대표성
- 한국의 근현대 작품을 2D/3D 이미지로 수집하여, 2D는 6개 분야(건축, 공예, 조각, 악기, 서예, 회화)유형, 3D는 4개 분야(건축, 공예, 조각, 악기)를 대상으로 수집 구축함
- 6개 분야는 십진분류법을 기준으로 실제 촬영 가능한 대상을 선별하였음2) 독립성
- 한국에서 만들어진 다양한 분류로 이루어진 미술 관련 2D와 3D dataset은 이전에 만들어진 적이 없음 (타 데이터셋과 중복이 되지 않음) -
데이터 성능 점수
측정값 (%)기준값 (%)데이터 성능 지표
데이터 성능 지표 번호 측정항목 AI TASK 학습모델 지표명 기준값 점수 측정값 점수 1 2D 분류 모델 Image Classification SE-ResNet Accuracy 62.74 % 97.88 % 2 3D 분류 모델 3D Object Classification PointNet Accuracy 71.38 % 85.86 %
※ 데이터 성능 지표가 여러 개일 경우 각 항목을 클릭하면 해당 지표의 값이 그래프에 표기됩니다.
※ AI모델 평가 지표에 따라 측정값의 범위, 판단 기준이 달라질 수 있습니다. (ex. 오류율의 경우, 낮을수록 좋은 성능을 내는 것으로 평가됩니다)
-
설명서 및 활용가이드 다운로드
데이터 설명서 다운로드 구축활용가이드 다운로드데이터 포맷
1) 2D 데이터 (전체, 일부, 주요부분 이미지로 작품 당 3장의 이미지로 구성)
- 서예 : 전통서예, 현대서예, 전각(도장), 서각(편지)
- 회화 : 한국화, 서양화, 판화2) 3D 데이터 (작품당 1개 이미지로 구성)
- 건축 : 궁전, 묘지, 성곽, 탑, 종교건물, 건축자재
- 조각 : 목조, 석조, 금동조, 점토
- 공예 : 도자공예, 금속공예, 보석공예, 폐류공예, 의복공예
- 악기 : 건반악기, 타악기, 현악기, 국악기3) 2D-3D 연계데이터 (3D와 매핑되는 2D 이미지이며, 작품당 전/후/좌/우로 구성됨)
- 건축 : 궁전, 묘지, 성곽, 탑, 종교건물, 건축자재
- 조각 : 목조, 석조, 금동조, 점토
- 공예 : 도자공예, 금속공예, 보석공예, 폐류공예, 의복공예
- 악기 : 건반악기, 타악기, 현악기, 국악기데이터 구성포맷
데이터 구성포맷 분류 항목 내용 타입 필수여부 Object_Info MainCategory 대분류 String Y MiddleCategory 중분류 String Y SubCategory 소분류 String Y Photo_Info PhotoDate 촬영날짜 String Y PhotoEquipment 촬영장비 String Y Image_Info Width 작품 가로 길이(2D/3D) Integer Y length 작품 세로 길이(2D/3D) Integer Y Height 작품 높이(3D) Integer N Camera Intrinsic parameters 카메라 내부 파라메터 array Y Fx 초점거리(focal length) double Y Fy double Y Data_Info DataSort 2D or 3D String Y ImageFileName 이미지 파일명 String Y SourceDataExtension 원천데이터 확장자 String Y Rangeofuse 사용범위 String Y (공공누리 1유형/ 공공누리 2유형) Description Class_kor 작품구분(한글) String Y Class_eng 작품구분(영어) String Y ArtTitle_kor 작품명(한글) String Y ArtTitle_eng 작품명(영어) String Y ArtistName_kor 작가명(한글) String Y ArtistName_eng 작가명(영어) String Y Location_kor 소장처(한글) String Y Location_eng 소장처(영어) String Y Material_kor 재질(한글) String Y Material_eng 재질(영어) String Y Annotation polygon 2D 드로잉 정보 Array Y (2D) cuboid 3D cuboid (포인트 정보) Array Y (3D) 어노테이션 포맷 (2D)
어노테이션 포맷 (2D) No 항목(한글) 항목(영문) 타입 필수 범위 1 객체 정보 Object_Info object Y 1-1 작품 시대(대분류) MainCategory string Y '고대', '현대', '근대' 1-2 클래스명(중분류) MiddleCategory string Y '건축', '공예/장식미술', '서예', '악기', '조각', ‘회화’ 1-3 클래스 세부명(소분류) SubCategory string Y '한국화', '현대서예', '석조', '국악기', ‘도자공예’ 2 촬영 정보 Photo_Info object Y 2-1 작품 촬영 일자 PhotoDate string Y ‘2022-06-09’ 2-2 작품 촬영 도구 PhotoEquipment string Y 'Canon EOS 200D II' 3 이미지 정보 Image_Info object Y 3-1 이미지 가로 길이 Width number Y 72.7 3-2 이미지 세로 길이 Length number Y 53 3-3 이미지 높이(3D) Height number N (2D는 예외) 3-4 카메라 내부 파라미터 Camera Intrinsic parameter object Y 3-4-1 초점거리 x fx number Y 12,396.12 3-4-2 초점거리 y fy number Y 12,396.12 4 Data_Info object Y 4-1 이미지 유형 DataSort string Y ‘2D’ 4-2 이미지 파일명 ImageFileName string Y ‘kart_3d00001’ ‘kart_2d129884-C-8-82-1’ 4-3 원천데이터 확장자명 SourceDataExtension string Y ‘JPG’ 4-4 사용범위 Rangeofuse string Y ‘공공누리 1’, ‘공공누리 2’ 5 작품 설명 정보 Description object Y 5-1 한글 클래스명 Class_kor string Y 중분류명 5-2 영문 클래스명 Class_eng string Y ‘Painting’ 5-3 한글 작품명 ArtTitle_kor string Y ‘파도’ 5-4 영문 작품명 ArtTitle_eng string Y ‘Wave’ 5-5 한글 작가명 ArtistName_kor string Y '정경훈' 5-6 영문 작가명 ArtistName_eng string Y ‘Jung Kyunghoon’ 5-7 한글 작품 위치명 Location_kor string Y '개인' 5-8 영문 작품 위치명 Location_eng string Y ‘Private’ 5-9 한글 작품 재료명 Material_kor string Y '종이' 5-10 영문 작품 재료명 Material_eng string Y ‘paper’ 6 객체 라벨링 정보 Annotation_Info object Y 6-1 라벨링 값 Polygon array Y 6-2 좌표값(배열) [x,y] array Y [0,0], [4165,0], [4165,3009], [0,3009] 실제예시 (2D)
{
"Object_Info": {
"MainCategory": "현대",
"MiddleCategory": "회화",
"SubCategory": "현대회화"
},
"Photo_Info": {
"PhotoDate": "2022-11-07",
"PhotoEquipment": "Cannon EOS 200D II"
},
"Image_Info": {
"Width": 53,
"Length": 43,
"Height": "N/A",
"Camera Intrinsic parameter": {
"fx": "12,396.12",
"fy": "12,396.12"
}
},
"Data_Info": {
"DataSort": "2D",
"ImageFileName": "kart_2d129895-C-8-82-3",
"SourceDataExtension": "JPG",
"Rangeofuse": "공공누리 2"
},
"Description": {
"Class_kor": "회화",
"Class_eng": "Painting",
"ArtTitle_kor": " 항아리의 나들이 ",
"ArtTitle_eng": "Outing",
"ArtistName_kor": "정낙희",
"ArtistName_eng": "Jung Nakhee",
"Location_kor": "개인",
"Location_eng": "Private",
"Material_kor": "종이",
"Material_eng": "Paper"
},
"Annotation_Info": {
"Polygon": [
[
0,
0,
545,
0,
545,
480,
0,
480
]
]
}
}어노테이션 포맷 (3D)
어노테이션 포맷 (3D) No 항목(한글) 항목(영문) 타입 필수 범위 1 객체 정보 Object_Info object Y 1-1 작품 시대(대분류) MainCategory string Y '고대', '현대', '근대' 1-2 클래스명(중분류) MiddleCategory string Y '건축', '공예/장식미술', '악기', '조각', 1-3 클래스 세부명(소분류) SubCategory string Y '궁전', '목조', '석조', '석탑' 2 촬영 정보 Photo_Info object Y 2-1 작품 촬영 일자 PhotoDate string Y ‘2022-06-09’ 2-2 작품 촬영 도구 PhotoEquipment string Y 'Canon EOS 200D II' 3 이미지 정보 Image_Info object Y 3-1 이미지 가로 길이 Width number Y 22 3-2 이미지 세로 길이 Length number Y 7.3 3-3 이미지 높이(3D) Height number Y 45 3-4 카메라 내부 파라미터 Camera Intrinsic parameter object Y 3-4-1 초점거리 x fx number Y 12,396.12 3-4-2 초점거리 y fy number Y 12,396.12 4 Data_Info object Y 4-1 이미지 유형 DataSort string Y ‘3D’ 4-2 이미지 파일명 ImageFileName string Y ‘kart_3d00729’ 4-3 원천데이터 확장자명 SourceDataExtension string Y ‘OBJ’ 4-4 사용범위 Rangeofuse string Y ‘공공누리 2’ 5 작품 설명 정보 Description object Y 5-1 한글 클래스명 Class_kor string Y ‘악기’ 5-2 영문 클래스명 Class_eng string Y ‘instrument’ 5-3 한글 작품명 ArtTitle_kor string Y ‘꽹과리1’ 5-4 영문 작품명 ArtTitle_eng string Y ‘kkwaenggwari’ 5-5 한글 작가명 ArtistName_kor string Y '미상' 5-6 영문 작가명 ArtistName_eng string Y ‘unknown’ 5-7 한글 작품 위치명 Location_kor string Y '한국민속극박물관' 5-8 영문 작품 위치명 Location_eng string Y ‘Korea Folk Drama Museum’ 5-9 한글 작품 재료명 Material_kor string Y '구리' 5-10 영문 작품 재료명 Material_eng string Y ‘copper’ 6 객체 라벨링 정보 Annotation_Info object Y 6-1 라벨링 값 Cuboid array Y 6-1-1 좌표값(배열) [x,y] array Y [0,21,7.3], [22.21,7.3], [0,21,0], [22,21,0], [0,0,7.3], [22,0,7.3], [0,0,0], [22,0,0] 실제예시 (3D)
{
"Object_Info": {
"MainCategory": "고대",
"MiddleCategory": "악기",
"SubCategory": "국악기"
},
"Photo_Info": {
"PhotoDate": "2022-10-26",
"PhotoEquipment": "Canon EOS 200D II"
},
"Image_Info": {
"Width": 42.3,
"Length": 10.3,
"Height": 53,
"Camera Intrinsic parameter": {
"fx": "12,396.12",
"fy": "12,396.12"
}
},
"Data_Info": {
"DataSort": "3D",
"ImageFileName": "kart_3d04044",
"SourceDataExtension": "obj",
"Rangeofuse": "공공누리 2"
},
"Description": {
"Class_kor": "악기",
"Class_eng": "instrument",
"ArtTitle_kor": "징2",
"ArtTitle_eng": "Jing",
"ArtistName_kor": "미상",
"ArtistName_eng": "unknown",
"Location_kor": "김천민속박물관",
"Location_eng": "Gimcheon Folk Museum",
"Material_kor": "황동",
"Material_eng": "Brass"
},
"Annotation_Info": {
"cuboid": [
[0, 53,10.2956],
[42.2741,53,10.2956],
[0,53,0],
[42.2741,53,0],
[0,0,10.2956],
[42.2741,0,10.2956],
[0,0,0],
[42.2741,0,0]
]
}
} -
데이터셋 구축 담당자
수행기관(주관) : 비큐에이아이
수행기관(주관) 책임자명 전화번호 대표이메일 담당업무 이상규 070-7091-8072 sglee@becuai.com 실무 담당(사업관리, 품질관리) 수행기관(참여)
수행기관(참여) 기관명 담당업무 위프코 2D 이미지 수집/정제, 3D 이미지 수집/정제 굿게이트 2D 이미지 수집/정제, 3D 이미지 수집/정제 미디어그룹사람과숲 2D/3D 가공(라벨링) 지티원 품질관리 충남대학교 산학협력단 인공지능 학습모델 개발 및 검증 데이터 관련 문의처
데이터 관련 문의처 담당자명 전화번호 이메일 이상규 070-7091-8072 sglee@becuai.com
-
인터넷과 물리적으로 분리된 온라인·오프라인 공간으로 의료 데이터를 포함하여 보안 조치가 요구되는 데이터를 다운로드 없이 접근하고 분석 가능
* 온라인 안심존 : 보안이 보장된 온라인 네트워크를 통해 집, 연구실, 사무실 등 어디서나 접속하여 데이터에 접근하고 분석
* 오프라인 안심존 : 추가적인 보안이 필요한 데이터를 대상으로 지정된 물리적 공간에서만 접속하여 데이터에 접근하고 분석 -
- AI 허브 접속
신청자 - 안심존
사용신청신청자신청서류 제출* - 심사구축기관
- 승인구축기관
- 데이터 분석 활용신청자
- 분석모델반출신청자
- AI 허브 접속
-
1. 기관생명윤리위원회(IRB) 심의 결과 통지서 [IRB 알아보기] [공용IRB 심의신청 가이드라인]
2. 기관생명윤리위원회(IRB) 승인된 연구계획서
3. 신청자 소속 증빙 서류 (재직증명서, 재학증명서, 근로계약서 등 택1)
4. 안심존 이용 신청서 [다운로드]
5. 보안서약서 [다운로드]
※ 상기 신청서 및 첨부 서류를 완비한 후 신청을 진행하셔야 정상적으로 절차가 이루어집니다. -
신청 및 이용관련 문의는 safezone1@aihub.kr 또는 02-525-7708, 7709로 문의
데이터셋 다운로드 승인이 완료 된 후 API 다운로드 서비스를 이용하실 수 있습니다.
API 다운로드 파일은 분할 압축되어 다운로드 됩니다. 분할 압축 해제를 위해서는 분할 압축 파일들의 병합이 필요하며 리눅스 명령어 사용이 필요합니다.
리눅스 OS 계열에서 다운로드 받으시길 권장하며 윈도우에서 파일 다운로드 시 wsl(리눅스용 윈도우 하위 시스템) 설치가 필요합니다.
※ 파일 병합 리눅스 명령어
find "폴더경로" -name "파일명.zip.part*" -print0 | sort -zt'.' -k2V | xargs -0 cat > "파일명.zip"
- 해당 명령어 실행 시, 실행 경로 위치에 병합 압축 파일이 생성됩니다.
- 병합된 파일 용량이 0일 경우, 제대로 병합이 되지 않은 상태이니 "폴더경로"가 제대로 입력되었는지 확인 부탁드립니다.
※ 데이터셋 소개 페이지에서 다운로드 버튼 클릭하여 승인이 필요합니다.