-
데이터 변경이력
데이터 변경이력 버전 일자 변경내용 비고 1.1 2023-12-29 데이터 최종 개방 1.0 2023-05-04 데이터 개방(Beta Version) 데이터 히스토리
데이터 히스토리 일자 변경내용 비고 2023-12-29 산출물 전체 공개 소개
인공지능 기술을 활용한 다양한 서비스 개발이 가능하도록 CMF이미지를 189,450장을 수집
구축목적
CMF 제품 이미지를 통해 다양한 CMF 표현을 분류하기 위한 인공지능 학습용 데이터를 구축하여 인공지능 기술 학습 시 필요한 비용과 시간, 노력 등을 획기적으로 절약하기 위함
-
메타데이터 구조표 데이터 영역 제조 데이터 유형 이미지 데이터 형식 jpg, jpeg 데이터 출처 크라우드 워커를 활용하여 수집 라벨링 유형 바운딩박스(이미지) 라벨링 형식 json 데이터 활용 서비스 CMF이미지 데이터를 활용한 AI 서비스 데이터 구축년도/
데이터 구축량2022년/189,450장 -
ㅇ 데이터 구축 규모 : 189,450장ㅇ 데이터 분포
- 품목군 분포ㅇ 데이터 분포- 품목군 분포 번호 품목군 분류 아이템 수 비율(%) 이미지 수량 (jpg, jpeg) 1 사무학습용가구 70 5.54% 10,500 2 계절가전 118 9.34% 17,700 3 주방가전 155 12.27% 23,250 4 생활가전 69 5.46% 10,350 5 영상가전 34 2.69% 5,100 6 디지털기기 111 8.79% 16,650 7 미용헬스케어 37 2.93% 5,550 8 음향가전 54 4.28% 8,100 9 주방용품 46 3.64% 6,900 10 욕실용품 44 3.48% 6,600 11 의료헬스케어용품 36 2.85% 5,400 12 사무필기용품 62 4.91% 9,300 13 기호미용용품 36 2.85% 5,400 14 스포츠레저용품 96 7.60% 14,400 15 잡화가방 149 11.80% 22,350 16 액세서리 83 6.57% 12,450 17 화장품 63 4.99% 9,450 합계 1,263 100% 189,450 - 재질별 분포
ㅇ 데이터 분포- 재질별 분포 번호 CMF 명 수량 비율(%) 1 거울광택이 있는 금속느낌 10,633 5.61% 2 스핀헤어라인느낌 3,740 1.97% 3 금속 헤어라인느낌 4,854 2.56% 4 샌딩마감이 된 금속느낌 10,240 5.41% 5 메탈릭페인트 코팅느낌 5,836 3.08% 6 저광택 소프트한 질감느낌 24,712 13.04% 7 고광택 플라스틱느낌 24,919 13.15% 8 텍스쳐가 있는 플라스틱느낌 3,902 2.06% 9 고운 샌딩 플라스틱느낌 26,113 13.78% 11 도트/마이크로 패턴느낌 2,787 1.47% 12 플라스틱 헤어라인느낌 2,041 1.08% 13 기하학 패턴느낌 3,453 1.82% 14 스트라이프 패턴느낌 3,071 1.62% 15 카본 패턴느낌 2,062 1.09% 16 투명느낌 6,099 3.22% 17 스모그 느낌의 반투명느낌 2,863 1.51% 18 텍스처가 있는 투명느낌 2,445 1.29% 19 광택이 없는 패브릭느낌 5,205 2.75% 20 메쉬느낌 5,273 2.78% 21 광택이 있는 패브릭느낌 3,034 1.60% 22 가죽느낌 5,841 3.08% 23 스웨이드느낌 2,018 1.07% 24 펠트느낌 2,413 1.27% 25 그라데이션느낌 2,119 1.12% 26 콘크리트느낌 2,180 1.15% 28 무지개빛느낌 2,244 1.18% 29 발포 플라스틱느낌 2,948 1.56% 30 글리터느낌 2,601 1.37% 31 원목무늬느낌 4,997 2.64% 32 집성목무늬느낌 2,087 1.10% 33 흐름무늬 대리석느낌 2,169 1.14% 34 칩무늬대리석/테라조느낌 2,260 1.19% 35 엮은 목재느낌 2,291 1.21% 합계 189,450 100% - 광택 분포
ㅇ 데이터 분포- 광택 분포 번호 광택도 수량 비율(%) 1 무광 59,517 31% 2 반광 82,855 44% 3 유광 47,078 25% 합계 189,450 100% - 투명 분포
ㅇ 데이터 분포- 투명 분포 번호 투명도 수량 비율(%) 1 불투명 173,082 91% 2 반투명 6,863 4% 3 투명 9,505 5% 합계 189,450 100% - 표면조도 분포
ㅇ 데이터 분포- 표면조도 분포 번호 표면조도 수량 비율(%) 1 거친부식 12,507 7% 2 중간부식 37,827 20% 3 고운부식 139,116 73% 합계 189,450 100% - 실내외 분포
ㅇ 데이터 분포- 실내외 분포 번호 위치 수량 비율(%) 1 실내 148,901 79% 2 실외 40,549 21% 합계 189,450 100% -
-
AI 모델 상세 설명서 다운로드
AI 모델 상세 설명서 다운로드 AI 모델 다운로드ㅇ 활용방안 : CMF 이미지 데이터를 분석하여 소재, 색상 등을 구분하는 AI 분야에 활용
ㅇ 활용서비스 예시
- 디자이너를 위한 CMF 감성 요소 분석 프로그램 : 감성어를 입력하면 AI가 분석
· 디자이너가 구상한 제품에 담고 싶은 감성어를 입력하면, AI가 분석한 결과를 CMF Data와 MoodBoard 형태로 제공
- CMF 분석 및 학습 서비스 플랫폼 : CMF 분석과 제조사 매칭
· CMF식별 AI서비스를 활용해 CMF 분석 및 학습(제조방법, 가공방식 등)을 도와주며, 제조사를 매칭해 주는 모바일 앱(App) 서비스 플랫폼
- 소재와 상품을 이미지로 검색하는 서비스 : 이미지로 CMF 정보 검색
· 검색어를 몰라서 못 찾는 CMF 정보, CMF를 인식하지 못하는 기존 이미지 검색 서비스의 단점을 보완하는 원하는 소재와 상품을 이미지로 검색하는 서비스
- 디자인 CMF요소 재구성 서비스 : 디자인 법적 이정표 제시 서비스
· CMF식별데이터를 기반으로 제품의 색채, 재질, 마감에 초점을 맞춘 [검색: 색채 히스토그램, 단위패턴 분할 후 템플릿 매칭, 반사도에 중점을 둔 마감처리 분석]을 통해 사용자의 디자인에 법적 이정표를 제시하는 서비스
- CMF 빅데이터를 활용한 추천 AI 기반 AR 문해력 교육서비스 : CMF 인지교육 서비스
· 아이들 언어로 CMF표현 데이터셋 구축과 음성 인터페이스를 사용한 이미지 검색 및 추천 시스템을 활용한 CMF인지 교육 서비스
- 시각장애 사용자를 위한 CMF AI서비스 : 사회적 약자 대상 일상 편의성 및 안전성 제공 서비스
· 스마트 글라스 디바이스를 사용하여 촬영된 이미지 가공(라벨링) 후 시각장애인에게 정보를 제공함으로써 일상의 편의성과 안정성을 제공하는 서비스
- 인공지능이 음성 안내를 해주는 서비스로서 시각장애인과 노년층 온라인 쇼핑을 도와주는 서비스 : 온라인 도움 서비스
· 여러 e-commerce 플랫폼에서 시각장애인이 손쉽게 상품 정보를 인공지능이 음성 안내를 해주는 서비스로서 시각장애인과 노년층 온라인 쇼핑을 도와주는 서비스
- 일상 속에서 포착된 소재들을 저장하고 검색, 소장한 소재를 3D 모델에 적용 : 소재 보관과 디자인 작업 도움 서비스
· 일상 속에서 포착된 소재들을 저장하고 다양한 소재를 검색할 수 있으며, 본인이 소장한 3D 모델에 적용해 아이디어를 구현해 볼 수 있는 서비스
-
데이터 성능 점수
측정값 (%)기준값 (%)데이터 성능 지표
데이터 성능 지표 번호 측정항목 AI TASK 학습모델 지표명 기준값 점수 측정값 점수 1 이미지 분류(CMF 표현 분류) 정확성 Image Classification SwinTransformer AccuracyTop-1 65 % 75.86 % 2 이미지 분류(CMF 표현 분류) 정확성 Image Classification SwinTransformer AccuracyTop-5 70 % 97.21 %
※ 데이터 성능 지표가 여러 개일 경우 각 항목을 클릭하면 해당 지표의 값이 그래프에 표기됩니다.
※ AI모델 평가 지표에 따라 측정값의 범위, 판단 기준이 달라질 수 있습니다. (ex. 오류율의 경우, 낮을수록 좋은 성능을 내는 것으로 평가됩니다)
-
설명서 및 활용가이드 다운로드
데이터 설명서 다운로드 구축활용가이드 다운로드ㅇ 데이터 설계
- 인공지능 기술을 활용한 다양한 서비스 개발이 가능하도록 분류 체계 구성
· CMF식별데이터(재질기준)를 9개 대분류, 33개 중분류로 분류하여 각 최소 2,000장 이상 확보
· CMF식별데이터(제품군 기준)를 4개 대분류, 17개 중분류로 분류하여 총 100개의 제품군을 대상으로 데이터를 수집ㅇ 데이터 구성
ㅇ 데이터 구성 항목 형식 데이터 분류 설명 형식 소재 및 마감 데이터
(메타 데이터)json material_finishing 소재 및 마감 종류 material_finishing= {0: {category: mirror polished metal, super_category: metal}, 1: {category: spin hair line, super_category: metal}, ...} 라벨링 데이터 json product 제품정보 {product: {category: beauty, super_category: lipstick}, part:{super_category: outside, category: guide}} img_path 원천 데이터 파일 경로 img_path = ‘CMF/CMF_image/beauty/lipstick/beauty_lipstick_20220303150330.jpg’ label bndbox 바운딩 박스 bndbox = [x, y, w, h] color 색깔 color = (255, 255, 255) material_finishing 소재 및 마감 종류 material = 1 shine 광택도(1~3) shine = 1 alpha 투명도(1~3) alpha = 1 roughness 표면조도(1~3) roughjness = 1 attribute date 날짜 date = '2020.11.20.17:08:15' format 파일 형식 format = jpg camera_info 카메라 정보 camera_info = digital imgW 이미지 너비 imgW = 3340 imgH 이미지 높이 imgH = 2140 resolution 해상도 resolution = FHD ㅇ 어노테이션 포맷
- 라벨 구성요소
ㅇ 어노테이션 포맷- 라벨 구성요소 구분 속성명 타입 필수여부 설명 범위 비고 1 material_finishing Object Y material_finishing 정보 0~32 0 거울광택이 있는 금속 느낌 1 스핀헤어라인 느낌 2 금속 헤어라인느낌 3 샌딩마감이 된 금속느낌 4 메탈릭페인트 코팅느낌 5 저광택 소프트한 질감 느낌 6 고광택 플라스틱 느낌 7 텍스쳐가 있는 플라스틱 느낌 8 고운 샌딩 플라스틱 느낌 9 발포 플라스틱 느낌 10 도트/마이크로 패턴 느낌 11 플라스틱 헤어라인 느낌 12 기하학 패턴느낌 13 스트라이프 패턴느낌 14 카본 패턴 느낌 15 투명 느낌 16 스모그 느낌의 반투명 느낌 17 텍스처가 있는 투명 느낌 18: 광택이 없는 패브릭 느낌 19 메쉬 느낌 20 광택이 있는 패브릭 느낌 21 가죽 느낌 22 스웨이드 느낌 23 펠트 느낌 24 칩무늬 대리석/테라조 느낌 25 콘크리트 느낌 26 흐름무늬 대리석 느낌 27 무지개빛 느낌 28 그라데이션 느낌 29 글리터느낌 30 원목무늬느낌 31 엮은 목재느낌 32 집성목무늬느낌 2 annotations Object Y 라벨링 정보 2-1 annotations.img_path String Y 라벨 이미지 경로 2-2 annotations.whole_img String Y 전체 이미지 경로 2-3 annotations.label Object Y 라벨링 세부 정보 annotations.label.bndbox String Y 바운딩박스 정보 annotations.label.color String Y 색깔 정보 annotations.label.material_finishing String Y material_finishing 정보 0~32 0 거울광택이 있는 금속 느낌 1 스핀헤어라인 느낌 2 금속 헤어라인느낌 3 샌딩마감이 된 금속느낌 4 메탈릭페인트 코팅느낌 5 저광택 소프트한 질감 느낌 6 고광택 플라스틱 느낌 7 텍스쳐가 있는 플라스틱 느낌 8 고운 샌딩 플라스틱 느낌 9 발포 플라스틱 느낌 10 도트/마이크로 패턴 느낌 11 플라스틱 헤어라인 느낌 12 기하학 패턴느낌 13 스트라이프 패턴느낌 14 카본 패턴 느낌 15 투명 느낌 16 스모그 느낌의 반투명 느낌 17 텍스처가 있는 투명 느낌 18: 광택이 없는 패브릭 느낌 19 메쉬 느낌 20 광택이 있는 패브릭 느낌 21 가죽 느낌 22 스웨이드 느낌 23 펠트 느낌 24 칩무늬 대리석/테라조 느낌 25 콘크리트 느낌 26 흐름무늬 대리석 느낌 27 무지개빛 느낌 28 그라데이션 느낌 29 글리터느낌 30 원목무늬느낌 31 엮은 목재느낌 32 집성목무늬느낌 annotations.label.shine String Y 광택도 정보 무광 반광 유광 annotations.label.alpha String Y 투명도 정보 불투명 반투명 투명 annotations.label.roughness String Y 표면조도 정보 고운부식 중간부식 거친부식 2-4 annotations.attributes Object Y 속성 정보 annotations.attributes.date String Y 날짜 정보 annotations.attributes.format String Y 파일 형식 정보 annotations.attributes.camera_info String Y 카메라 정보 annotations.attributes.imgW String Y 이미지 너비 정보 annotations.attributes.imgH String Y 이미지 높이 정보 annotations.attributes.resolution String Y 해상도 정보 annotations.attributes.locations String Y 장소 정보 - 라벨링 데이터 예시
{ "material_finishing": { "0": "거울광택이 있는 금속", "1": "스핀헤어라인", "2": "금속 헤어라인", "3": "샌딩마감이 된 금속", "4": "메탈릭페인트 코팅", "5": "저광택 소프트한 질감", "6": "고광택 플라스틱", "7": "텍스쳐가 있는 플라스틱", "8": "고운 샌딩 플라스틱", "9": "발포 플라스틱", "10": "도트/마이크로 패턴", "11": "플라스틱 헤어라인", "12": "기하학 패턴", "13": "스트라이프 패턴", "14": "카본 패턴", "15": "투명", "16": "스모그 느낌의 반투명", "17": "텍스처가 있는 투명", "18": "광택이 없는 패브릭", "19": "메쉬", "20": "광택이 있는 패브릭", "21": "가죽", "22": "스웨이드", "23": "펠트", "24": "칩무늬 대리석/테라조", "25": "콘크리트", "26": "흐름무늬 대리석", "27": "무지개빛", "28": "그라데이션", "29": "글리터", "30": "원목무늬", "31": "엮은 목재", "32": "집성목무늬" }, "annotations": { "img_path": "Data/8_음향가전/스피커/R01/001.jpg", "whole_img": "Data/8_음향가전/스피커/R01/000.jpg", "label": { "bndbox": "[0,1542.144,3338.496,1886.208]", "color": "(143, 143, 143)", "material_finishing": "21", "shine": "무광", "alpha": "불투명", "roughness": "고운부식" }, "attributes": { "date": "2022.07.04 00:31:17", "format": "jpg", "camera_info": "Canon EOS-1D X", "imgW": "5184", "imgH": "3456", "resolution": "FHD", "location": "실외" } }}
-
데이터셋 구축 담당자
수행기관(주관) : 한국디자인진흥원
수행기관(주관) 책임자명 전화번호 대표이메일 담당업무 강억모 031-780-2289 kem7925@kidp.or.kr CMF식별데이터 수집·정제·가공·검수 수행기관(참여)
수행기관(참여) 기관명 담당업무 ㈜스위트케이 CMF식별데이터 수집·정제·가공·검수, D.CAMP(어노테이션툴) 개발CMF식별데이터 수집·정제·가공·검수, D.CAMP(어노테이션툴) 개발 로템 CMF식별데이터 수집·정제·가공·검수 데이터 관련 문의처
데이터 관련 문의처 담당자명 전화번호 이메일 강억모 031-780-2289 kem7925@kidp.or.kr
-
인터넷과 물리적으로 분리된 온라인·오프라인 공간으로 의료 데이터를 포함하여 보안 조치가 요구되는 데이터를 다운로드 없이 접근하고 분석 가능
* 온라인 안심존 : 보안이 보장된 온라인 네트워크를 통해 집, 연구실, 사무실 등 어디서나 접속하여 데이터에 접근하고 분석
* 오프라인 안심존 : 추가적인 보안이 필요한 데이터를 대상으로 지정된 물리적 공간에서만 접속하여 데이터에 접근하고 분석 -
- AI 허브 접속
신청자 - 안심존
사용신청신청자신청서류 제출* - 심사구축기관
- 승인구축기관
- 데이터 분석 활용신청자
- 분석모델반출신청자
- AI 허브 접속
-
1. 기관생명윤리위원회(IRB) 심의 결과 통지서 [IRB 알아보기] [공용IRB 심의신청 가이드라인]
2. 기관생명윤리위원회(IRB) 승인된 연구계획서
3. 신청자 소속 증빙 서류 (재직증명서, 재학증명서, 근로계약서 등 택1)
4. 안심존 이용 신청서 [다운로드]
5. 보안서약서 [다운로드]
※ 상기 신청서 및 첨부 서류를 완비한 후 신청을 진행하셔야 정상적으로 절차가 이루어집니다. -
신청 및 이용관련 문의는 safezone1@aihub.kr 또는 02-525-7708, 7709로 문의
데이터셋 다운로드 승인이 완료 된 후 API 다운로드 서비스를 이용하실 수 있습니다.
API 다운로드 파일은 분할 압축되어 다운로드 됩니다. 분할 압축 해제를 위해서는 분할 압축 파일들의 병합이 필요하며 리눅스 명령어 사용이 필요합니다.
리눅스 OS 계열에서 다운로드 받으시길 권장하며 윈도우에서 파일 다운로드 시 wsl(리눅스용 윈도우 하위 시스템) 설치가 필요합니다.
※ 파일 병합 리눅스 명령어
find "폴더경로" -name "파일명.zip.part*" -print0 | sort -zt'.' -k2V | xargs -0 cat > "파일명.zip"
- 해당 명령어 실행 시, 실행 경로 위치에 병합 압축 파일이 생성됩니다.
- 병합된 파일 용량이 0일 경우, 제대로 병합이 되지 않은 상태이니 "폴더경로"가 제대로 입력되었는지 확인 부탁드립니다.
※ 데이터셋 소개 페이지에서 다운로드 버튼 클릭하여 승인이 필요합니다.
오프라인 데이터 이용 안내
본 데이터는 K-ICT 빅데이터센터에서도 이용하실 수 있습니다.
다양한 데이터(미개방 데이터 포함)를 분석할 수 있는 오프라인 분석공간을 제공하고 있습니다.
데이터 안심구역 이용절차 및 신청은 K-ICT빅데이터센터 홈페이지를 참고하시기 바랍니다.