-
데이터 변경이력
데이터 변경이력 버전 일자 변경내용 비고 1.2 2024-12-04 서브라벨링 추가 개방 1.1 2024-10-30 데이터 최종 개방 1.0 2024-06-28 데이터 개방 Beta Version 데이터 히스토리
데이터 히스토리 일자 변경내용 비고 2024-06-28 산출물 공개 Beta Version 소개
- 전통 한복 및 장신구의 디자인, 색상, 문양 등 형태적 특징과 시대, 신분, 착장상황 등 복식사적 정보를 추출하여 전통 한복 및 장신구 2D, 3D 이미지 데이터셋
구축목적
- 전통 한복 및 장신구의 디자인, 색상, 문양 등 형태적 특징과 시대, 신분, 착장상황 등 복식사적 정보를 추출하여 전통 한복 및 장신구 2D, 3D 이미지 데이터셋 구축
-
메타데이터 구조표 데이터 영역 문화관광 데이터 유형 3D , 이미지 데이터 형식 PNG, FBX 데이터 출처 자체수집 라벨링 유형 세그멘테이션(이미지) 라벨링 형식 JSON 데이터 활용 서비스 디자인 분석 및 자동화 시스템 구축, 가상 한복 착용 서비스 데이터 구축년도/
데이터 구축량2023년/1,264,797장 -
- 데이터 통계
• 데이터 구축 규모
- 원천데이터 이미지 1,264,797장(PNG), 3D데이터 1,135개(FBX+PNG)
- 이미지 데이터 및 레이블링 데이터가 1쌍으로 구성
- 이미지 캡션 데이터 및 착복 이미지가 1쌍으로 구성데이터 구축 규모 구분 종류 구축 규모 이미지 데이터 PNG 이미지 파일 1,264,797 레이블링 데이터 JSON 파일(어노테이션정보 및 메타 데이터 정보 1,264,797 3D 데이터 FBX 3D 파일, PNG 3D 맵 파일 1,135 서브 레이블링 데이터 JSON 파일 (이미지 캡션 정보) 63,226 • 데이터 분포
데이터 분포 구성 데이터 분류 상세 분류 수량 분포 2D 한복 미착복 웃옷 101,507 107.8% 아래옷 52,904 111.5% 겉옷 101,660 108.0% 덧옷 26,601 112.7% 장신구 미착장 쓰개 35,351 124.6% 몸장식 57,316 101.4% 머리장식 58,549 103.6% 띠 36,346 105.2% 신발 31,730 100.9% 부속품 15,068 120.2% 한복 착복 웃옷 94,022 103.0% 아래옷 54,864 119.2% 겉옷 90,842 99.5% 덧옷 24,224 105.9% 한복 장신구 착복 착장 쓰개 32,728 100.9% 몸장식 64,071 99.2% 머리장식 63,834 98.8% 띠 40,039 101.4% 신발 36,074 100.3% 부속품 14,894 103.9% 3D 한복 착복 웃옷 43,881 106.8% 아래옷 21,912 105.8% 겉옷 40,143 97.7% 덧옷 10,704 104.0% 한복 장신구 착복 착장 쓰개 15,027 103.0% 몸장식 29,417 101.2% 머리장식 29,308 100.8% 띠 18,384 103.5% 신발 16,563 102.4% 부속품 6,834 106.0% -
-
AI 모델 상세 설명서 다운로드
AI 모델 상세 설명서 다운로드 AI 모델 다운로드- 활용모델
- 모델학습
1. Mask R-CNN
• Instance Segmentation은 Semantic Segmentation과 Object Detection의 기능을 결합한 모델이므로 Instance Segmentation 모델을 학습시키기 위해 Mask R-CNN 모델을 활용하여 접근하는 것이 적합
• 수집/가공한 데이터를 전처리하고 증강하는 과정을 거쳐 과적합을 방지하고 모델의 성능을 향상시킴
• Mask R-CNN의 경우 학습 모델의 Backbone과 학습할 대상 데이터의 형식을 정의한 후, 모델 구축 시행
• 모델 구축 후 전처리한 데이터와 증강을 수행한 데이터를 학습시킴
• 학습 중 학습 손실과 검증 손실을 계산하여 모델링 모니터링
• 학습 완료 후 생성된 모델로 테스트 셋에 대해 객체 식별 결과 확인 후 파라미터 조정Mask R-CNN Mask R-CNN Faster R-CNN(Baseline) Backbone ResNet(101, 50) VGG(16) / ResNet(101, 50) RPN Yes Yes Detection Branch Yes Yes Segmentation Branch Yes No characteristic ⦁Instance Segmentation 성능 좋음 ⦁일반 Object Detection에서 높은 정확도, 빠른 속도 ⦁객체 검출과 분할을 동시에 수행 ⦁Segmentation 지원안함 ⦁Faster R-CNN 기반 ⦁백본 성능에 크게 의지 ⦁느린 추론 속도 ⦁메모리 사용량 많음 < Mask R-CNN, Faster R-CNN 비교 표 >
NeRF
• 3D point의 sampled set 생성
• 생성한 sampled set과 sampled set에 해당하는 2D viewing direction을 MLP에 넣어 해당 위치에서 바라본 객체의 color와 density 얻음
• classical volume rendering techniques으로 획득한 color와 density를 2D 이미지에 축적함
NeRF 아키텍처
2. 서비스 활용 시나리오
• 올바른 한복 컨텐츠 확산을 통해 한국만의 독창적인 아름다움을 보존하고 대중화하여 한국전통문화와 한복의 정체성을 널리 알리고 확고히 함
• 한복 디자인 통계 데이터를 구축하고 AI 학습을 통해 생성된 데이터를 기반으로, 이용자들이 선호하는 디자인 요소를 활용한 시대적 흐름이 반영된 한복 디자인 개발이 가능
• 한복 의상을 생산하고 제공하는 의류업계 및 사회 전반에 걸쳐 활용 가능하고, 이를 통해 한복의 전통과 아름다움이 현대적으로 재해석되어 새로운 가치를 창출 가능
• 보다 객관적이고 효율화된 한복 디자인으로 학계의 의류 디자인 전문가들의 의사결정 시간의 단축 및 정당성 확보를 도모하여 경제적 이익을 부여 -
설명서 및 활용가이드 다운로드
데이터 설명서 다운로드 구축활용가이드 다운로드- 데이터 구성
데이터 구성 구성 데이터 분류 형식 2D 한복 미착복 PNG, JSON 장신구 미착장 PNG, JSON 한복 착복 PNG, JSON 한복 장신구 착복 착장 PNG, JSON 3D 한복 착복 PNG, JSON 한복 장신구 착복 착장 PNG, JSON 3D 데이터 한복 착복 FBX, PNG 한복 장신구 착복 착장 FBX, PNG 서브 레이블링 이미지 캡션 JSON - 어노테이션 포맷
어노테이션 포맷/caption> NO. 항목 타입 필수 여부 한글명 영문명 1 데이터셋 정보 info object 필수 1.1 데이터셋 명 name string 필수 1.2 데이터셋 생성 일자 date_created date 필수 2 이미지 정보 images object 필수 2.1 이미지 아이디 id number 필수 2.2 이미지 넓이 width number 필수 2.3 이미지 높이 height number 필수 2.4 이미지 파일 이름 file_name string 필수 3 어노테이션 annotations JsonArray 필수 3.1 어노테이션 아이디 id number 필수 3.2 이미지 아이디 image_id number 필수 3.3 폴리곤 segmentation array 필수 3.4 카테고리 아이디 category_id number 필수 3.5 전통복식 분류 traditional_class string 선택 3.6 다중 iscrowd number 필수 3.7 메타 아이디 meta_id number 필수 4 메타 meta JsonArray 필수 4.1 메타 아이디 id number 선택 4.2 전통복식 타입 traditional_type string 선택 4.3 전통복식 분류 traditional_class string 선택 4.4 전통복식 정보 traditional_info string 선택 4.5 시대 period string 선택 4.6 시대 구분 period_group string 선택 4.7 성별 gender string 선택 4.8 연령대 age_group string 선택 4.9 한복 구분 cloth_group string 선택 4.1 소재 cloth string 선택 4.11 패턴 pattern string 선택 4.12 디자인 design string 선택 4.13 신분 station string 선택 4.14 색상 color string 선택 4.15 착용 여부 wear boolean 선택 5 카테고리 categories JsonArray 필수 5.1 카테고리 아이디 id number 필수 5.2 카테고리 명칭 name string 필수 6 라이센스 정보 licenses JsonArray 필수 6.1 라이센스 식별 id number 필수 6.2 라이센스 명 name string 필수 6.3 라이센스 url url string 필수 - 이미지 캡션 포맷
이미지 캡션 포맷 NO. 항목 타입 필수 여부 한글명 영문명 1 캡션 captions JsonArray 필수 1.1 캡션 아이디 id number 필수 1.2 이미지 아이디 image_id number 필수 1.3 캡션 내용 caption string 필수 - 데이터 포맷
- 기본 포맷 : PNG+JSON, FBX+PNG File로 구성된 한 쌍
- 이미지 데이터 및 레이블링 데이터가 1쌍으로 구성
- 이미지 캡션 데이터 및 착복 이미지가 1쌍으로 구성
- 데이터 가공(라벨링) 내용데이터 포맷 구분 No 속성명 속성 및 내용 필수 1 info 데이터셋 정보 필수 2 name 데이터셋 명 필수 3 date_created 데이터셋 생성 일자 필수 4 images 이미지 정보 필수 5 id 이미지 아이디 필수 6 width 이미지 넓이 필수 7 height 이미지 높이 필수 8 file_name 이미지 파일 이름 필수 9 annotations 어노테이션 필수 10 id 어노테이션 아이디 필수 11 image_id 이미지 아이디 필수 12 segmentation 폴리곤 필수 13 category_id 카테고리 아이디 선택 14 traditional_class 전통복식 분류 필수 15 iscrowd 다중 필수 16 meta_id 메타 아이디 필수 17 meta 메타 선택 18 id 메타 아이디 선택 19 traditional_type 전통복식 타입 선택 20 traditional_class 전통복식 분류 선택 21 traditional_info 전통복식 정보 선택 22 period 시대 선택 23 period_group 시대 구분 선택 24 gender 성별 선택 25 age_group 연령대 선택 26 cloth_group 한복 구분 선택 27 cloth 소재 선택 28 pattern 패턴 선택 29 design 디자인 선택 30 station 신분 선택 31 color 색상 선택 32 wear 착용 여부 필수 33 categories 카테고리 필수 34 id 카테고리 아이디 필수 35 name 카테고리 명칭 필수 36 licenses 라이센스 정보 필수 37 id 라이센스 식별 필수 38 name 라이센스 명 - 이미지 작성(예시)
이미지 작성(예시) 구분 예시 JSON 형식(예시) 전통 한복 3D 데이터 -
데이터셋 구축 담당자
수행기관(주관) : 스마트쿱㈜
수행기관(주관) 책임자명 전화번호 대표이메일 담당업무 최진욱 02-548-6969 jefferson@smartcoop.kr 총괄 및 수집, 가공, 품질검증 수행기관(참여)
수행기관(참여) 기관명 담당업무 ㈜아이티에스노아 정제 및 검수 이화여자대학 산학협력단 데이터 기획, 메타데이터 검증 한국문화재재단 데이터 기획, 메타데이터 검증 데이터 관련 문의처
데이터 관련 문의처 담당자명 전화번호 이메일 이역수 02-548-6969 ceo@smartcoop.kr 최진욱 02-548-6969 jefferson@smartcoop.kr AI모델 관련 문의처
AI모델 관련 문의처 담당자명 전화번호 이메일 이역수 02-548-6969 ceo@smartcoop.kr 최진욱 02-548-6969 jefferson@smartcoop.kr 저작도구 관련 문의처
저작도구 관련 문의처 담당자명 전화번호 이메일 이역수 02-548-6969 ceo@smartcoop.kr 최진욱 02-548-6969 jefferson@smartcoop.kr
-
인터넷과 물리적으로 분리된 온라인·오프라인 공간으로 의료 데이터를 포함하여 보안 조치가 요구되는 데이터를 다운로드 없이 접근하고 분석 가능
* 온라인 안심존 : 보안이 보장된 온라인 네트워크를 통해 집, 연구실, 사무실 등 어디서나 접속하여 데이터에 접근하고 분석
* 오프라인 안심존 : 추가적인 보안이 필요한 데이터를 대상으로 지정된 물리적 공간에서만 접속하여 데이터에 접근하고 분석 -
- AI 허브 접속
신청자 - 안심존
사용신청신청자신청서류 제출* - 심사구축기관
- 승인구축기관
- 데이터 분석 활용신청자
- 분석모델반출신청자
- AI 허브 접속
-
1. 기관생명윤리위원회(IRB) 심의 결과 통지서 [IRB 알아보기] [공용IRB 심의신청 가이드라인]
2. 기관생명윤리위원회(IRB) 승인된 연구계획서
3. 신청자 소속 증빙 서류 (재직증명서, 재학증명서, 근로계약서 등 택1)
4. 안심존 이용 신청서 [다운로드]
5. 보안서약서 [다운로드]
※ 상기 신청서 및 첨부 서류를 완비한 후 신청을 진행하셔야 정상적으로 절차가 이루어집니다. -
신청 및 이용관련 문의는 safezone1@aihub.kr 또는 02-525-7708, 7709로 문의
데이터셋 다운로드 승인이 완료 된 후 API 다운로드 서비스를 이용하실 수 있습니다.
API 다운로드 파일은 분할 압축되어 다운로드 됩니다. 분할 압축 해제를 위해서는 분할 압축 파일들의 병합이 필요하며 리눅스 명령어 사용이 필요합니다.
리눅스 OS 계열에서 다운로드 받으시길 권장하며 윈도우에서 파일 다운로드 시 wsl(리눅스용 윈도우 하위 시스템) 설치가 필요합니다.
※ 파일 병합 리눅스 명령어
find "폴더경로" -name "파일명.zip.part*" -print0 | sort -zt'.' -k2V | xargs -0 cat > "파일명.zip"
- 해당 명령어 실행 시, 실행 경로 위치에 병합 압축 파일이 생성됩니다.
- 병합된 파일 용량이 0일 경우, 제대로 병합이 되지 않은 상태이니 "폴더경로"가 제대로 입력되었는지 확인 부탁드립니다.
※ 데이터셋 소개 페이지에서 다운로드 버튼 클릭하여 승인이 필요합니다.