-
데이터 변경이력
데이터 변경이력 버전 일자 변경내용 비고 1.1 2023-10-30 데이터 최종 개방 1.0 2023-07-05 데이터 개방(Beta Version) 데이터 히스토리
데이터 히스토리 일자 변경내용 비고 2023-12-08 산출물 전체 공개 2023-08-21 메타데이터-데이터구축량 수정 소개
연도별 대표 패션 이미지와 사람들의 선호도를 매칭한 데이터 ● 본 학습용 데이터의 데이터 가공은 선호도 설문조사로, 별도의 저작도구가 없음
구축목적
추후 e-commerce 등 추천 시스템, 패션 트렌드 사이클 파악에 활용
-
메타데이터 구조표 데이터 영역 영상이미지 데이터 유형 이미지 데이터 형식 txt 데이터 출처 직접촬영, 아카이브 수집 라벨링 유형 선호도 설문조사 라벨링 형식 JSON 데이터 활용 서비스 e-commerce 등 데이터 구축년도/
데이터 구축량2022년/총 112,062장 이미지, 284,839건 선호도 응답 데이터 -
1) 원천데이터(시대별 패션 스타일 이미지) 구축 수량
1) 원천데이터(시대별 패션 스타일 이미지) 구축 수량 1차 경로 2차 경로 3차 경로 파일 포맷 구축수량(장) (성별) (대표 연도) Man 1950 - .jpg 2714 1960 - .jpg 3867 1970 - .jpg 2346 1980 - .jpg 4437 1990 - .jpg 3493 2000 - .jpg 3601 2010 - .jpg 6530 2019 - .jpg 13880 Woman 1950 - .jpg 9230 1960 - .jpg 7607 1970 - .jpg 9196 1980 - .jpg 7378 1990 - .jpg 7636 2000 - .jpg 7706 2010 - .jpg 5669 2019 - .jpg 16772 총 수량 112,062 2) 라벨링데이터(선호도 조사 응답) 구축 수량
2) 라벨링데이터(선호도 조사 응답) 구축 수량 1차 경로 2차 경로 3차 경로 파일 포맷 구축수량(건) (성별) (대표 연도) Man 1950 - .json 13,735 1960 - .json 12,396 1970 - .json 12,122 1980 - .json 13,318 1990 - .json 11,757 2000 - .json 11,999 2010 - .json 14,627 2019 - .json 16,698 Woman 1950 - .json 24,835 1960 - .json 23,575 1970 - .json 24,083 1980 - .json 24,005 1990 - .json 18,553 2000 - .json 20,034 2010 - .json 20,657 2019 - .json 22,445 총 수량 284,839 -
-
AI 모델 상세 설명서 다운로드
AI 모델 상세 설명서 다운로드 AI 모델 다운로드(Pinsage 알고리즘을 활용한 패션 아이템 추천 모델로 변경
- 기존 transductive한 특징을 가지는 GCN기반에서 inductive한 특징을 추가되면서 학습되지 않은 Graph Node도 임베딩이 가능해지면서 product 측면에서 합리적인 추론이 가능
1차 모델 선정 후 적합한 모델 보완을 위한 전문가 자문회의 진행하여 2차 보완 모델(pinsage) 선정 -
데이터 성능 점수
측정값 (%)기준값 (%)데이터 성능 지표
데이터 성능 지표 번호 측정항목 AI TASK 학습모델 지표명 기준값 점수 측정값 점수 1 의류 추천 성능 Estimation Pinsage HR@500 72 % 80.67 %
※ 데이터 성능 지표가 여러 개일 경우 각 항목을 클릭하면 해당 지표의 값이 그래프에 표기됩니다.
※ AI모델 평가 지표에 따라 측정값의 범위, 판단 기준이 달라질 수 있습니다. (ex. 오류율의 경우, 낮을수록 좋은 성능을 내는 것으로 평가됩니다)
-
설명서 및 활용가이드 다운로드
데이터 설명서 다운로드 구축활용가이드 다운로드1950년대부터 현재까지 시대별 대표 스타일을 정의하고 해당 이미지를 수집하여, 이에 대한 선호도 설문조사를 실시함
<시대별 스타일 분류>
하기 시대에 따라 남성 8종, 여성 23종으로 대표 스타일을 정의함<설문조사 지표>
- 선호도조사 지표는 전문가, 실무자 좌담회를 거쳐 설계하였으며, 상세 지표는 하기와 같음어노테이션 포맷
어노테이션 포맷 구분 속성명 타입 필수여부 설명 범위 비고 1 E_id numeric Y 평가 data ID 2 imgName string Y 이미지 filename 3 item string Y 이미지 정보 3-1 imgName string Y 이미지 filename 3-2 era string Y 시대별 [1950~2019] 1950, 1960, 1970, 1980, 1990, 2000, 2010, 2019 3-3 style string Y 스타일별 "ivy","feminine","classic","mods","minimal","popart","space","hippie","disco","military","punk","bold","powersuit","bodyconscious","hiphop","kitsch","lingerie","grunge","metrosexual","cityglam","oriental","ecology","sportivecasual","athleisure","lounge","normcore","genderless" 3-4 gender string Y 이미지 성별 M, W M:남성, W:여성 3-5 survey string Y 설문 3-5-1 Q1 numeric Y 선호여부 1~4 1 : 전혀그렇지 않다, 2 : 그렇지 않다 3 : 그렇다 4 : 매우그렇다 3-5-2 Q2 numeric Y 어울리는 계절 1~3 1:봄/가을 2:여름 3:겨울 3-5-3 Q3 numeric N 적합한 착용 상황 1~8 1:출근 2:데이트 3:행사(결혼식 등 공식모임) 4:사교모임(약속, 파티 등) 5:일상생활 6:레저 스포츠 7:여행/휴가 8:기타 3-5-4 Q411 numeric Y (핏) 평가 1~3 1:헐렁해 보인다 2:적당해 보인다 3:타이트해 보인다 3-5-5 Q412 numeric Y (색깔) 어두움-밝음 1,2 1:어두워 보인다 2:밝아 보인다 Q413 numeric Y (색감)차가움-따뜻함 1,2 1:차가워 보인다 2:따뜻해 보인다 Q414 numeric Y (분위기)무거움-가벼움 1,2 1:무거워보인다 2:가벼워 보인다 Q4201 numeric Y (이미지단어)멋있다 0,1 0:아니다 1:멋잇다 Q4202 numeric Y (이미지단어)도시적이다 0,2 0:아니다 2:도시적이다 Q4203 numeric Y (이미지단어)트랜디하다 0,3 0:아니다 3:트랜디하다 Q4204 numeric Y (이미지단어)세련되다 0,4 0:아니다 4:세련되다 Q4205 numeric Y (이미지단어)깔끔하다 0,5 0:아니다 5:깔끔하다 Q4206 numeric Y (이미지단어)화려하다 0,6 0:아니다 6:화려하다 Q4207 numeric Y (이미지단어)독특하다 0,7 0:아니다 7:독특하다 Q4208 numeric Y (이미지단어)무난하다 0,8 0:아니다 8:무난하다 Q4209 numeric Y (이미지단어)개방적이다 0,9 0:아니다 9:개방적이다 Q4210 numeric Y (이미지단어)실용적이다 0,10 0:아니다 10:실용적이다 Q4211 numeric Y (이미지단어)활동적이다 0,11 0:아니다 11:활동적이다 Q4212 numeric Y (이미지단어)편안하다 0,12 0:아니다 12:편안하다 Q4213 numeric Y (이미지단어)발랄하다 0,13 0:아니다 13:발랄하다 Q4214 numeric Y (이미지단어)여성적이다 0,14 0:아니다 14:여성적이다 Q4215 numeric Y (이미지단어)남성적이다 0,15 0:아니다 15:남성적이다 Q4216 numeric Y (이미지단어)부드럽다 0,16 0:아니다 16:부드럽다 Q5 numeric Y 스타일 선호도(재질문) 1,2 1:그렇지 않다 2:그렇다 4 user string Y 응답자 정보 4-1 R_id numeric Y 응답자ID 4-2 r_gender numeric Y 응답자 성별 1,2 1:남성 2:여성 4-3 age numeric Y 연령 1~4 1:20~29세 2:30~39세 3:40~49세 4:50~60세 4-4 mar numeric Y 결혼상태 1,2 1:미혼 2:기혼 4-5 job numeric Y 직업 1~8 1:전업주부 2:기술/전문직 3:판매/서비스직 4:사무/관리직 5:학생 6:기타 4-6 income numeric Y 월소득액 1~11 1:200만원 미만 2:200~300만원 미만 3:300~400만원 미만 4:400~500만원 미만 5:500~600만원 미만 6:600만원 이상 4-7 r_style1 numeric Y 패션스타일1 1:화려하고 독특한 2:무난하고 평범한 4-8 r_style2 numeric Y 패션스타일2 1:남성적/여성적인 2:중성적인 4-9 r_style3 numeric Y 패션스타일3 1:전통적인 2:트랜디한 4-10 r_style4 numeric Y 패션스타일4 1:포멀한 2:캐주얼한 4-11 r_style5 numeric Y 패션스타일5 1:활발한 2:점잖은 Json 파일(실제 예시)
{"E_id": 519,
"imgName": "W_14894_50_feminine_W.jpg",
"item": {
"imgName": "W_14894_50_feminine_W.jpg",
"era": 1950,
"style": "feminine",
"gender": "W",
"survey": {
"Q1": 2,
"Q2": 1,
"Q3": 5,
"Q411": 1,
"Q412": 2,
"Q413": 2,
"Q414": 2,
"Q4201": 0,
"Q4202": 2,
"Q4203": 0,
"Q4204": 0,
"Q4205": 5,
"Q4206": 6,
"Q4207": 0,
"Q4208": 0,
"Q4209": 0,
"Q4210": 0,
"Q4211": 0,
"Q4212": 0,
"Q4213": 0,
"Q4214": 0,
"Q4215": 0,
"Q4216": 0,
"Q5": 1
}
},
"user": {
"R_id": 681,
"r_gender": 2,
"age": 1,
"mar": 1,
"job": 4,
"income": 2,
"r_style1": 2,
"r_style2": 1,
"r_style3": 2,
"r_style4": 2,
"r_style5": 1
}
} -
데이터셋 구축 담당자
수행기관(주관) : ㈜메트릭스
수행기관(주관) 책임자명 전화번호 대표이메일 담당업무 서라벌 02-6244-0773 seorb@metrix.co.kr 업무총괄 수행기관(참여)
수행기관(참여) 기관명 담당업무 현대리서치 이미지 가공 더블유더블유디 원천데이터 수집 더바이럴 원천데이터 수집 오피니언라이브 품질관리 데이터 관련 문의처
데이터 관련 문의처 담당자명 전화번호 이메일 서라벌 02-6244-0773 seorb@metrix.co.kr
-
인터넷과 물리적으로 분리된 온라인·오프라인 공간으로 의료 데이터를 포함하여 보안 조치가 요구되는 데이터를 다운로드 없이 접근하고 분석 가능
* 온라인 안심존 : 보안이 보장된 온라인 네트워크를 통해 집, 연구실, 사무실 등 어디서나 접속하여 데이터에 접근하고 분석
* 오프라인 안심존 : 추가적인 보안이 필요한 데이터를 대상으로 지정된 물리적 공간에서만 접속하여 데이터에 접근하고 분석 -
- AI 허브 접속
신청자 - 안심존
사용신청신청자신청서류 제출* - 심사구축기관
- 승인구축기관
- 데이터 분석 활용신청자
- 분석모델반출신청자
- AI 허브 접속
-
1. 기관생명윤리위원회(IRB) 심의 결과 통지서 [IRB 알아보기] [공용IRB 심의신청 가이드라인]
2. 기관생명윤리위원회(IRB) 승인된 연구계획서
3. 신청자 소속 증빙 서류 (재직증명서, 재학증명서, 근로계약서 등 택1)
4. 안심존 이용 신청서 [다운로드]
5. 보안서약서 [다운로드]
※ 상기 신청서 및 첨부 서류를 완비한 후 신청을 진행하셔야 정상적으로 절차가 이루어집니다. -
신청 및 이용관련 문의는 safezone1@aihub.kr 또는 02-525-7708, 7709로 문의
데이터셋 다운로드 승인이 완료 된 후 API 다운로드 서비스를 이용하실 수 있습니다.
API 다운로드 파일은 분할 압축되어 다운로드 됩니다. 분할 압축 해제를 위해서는 분할 압축 파일들의 병합이 필요하며 리눅스 명령어 사용이 필요합니다.
리눅스 OS 계열에서 다운로드 받으시길 권장하며 윈도우에서 파일 다운로드 시 wsl(리눅스용 윈도우 하위 시스템) 설치가 필요합니다.
※ 파일 병합 리눅스 명령어
find "폴더경로" -name "파일명.zip.part*" -print0 | sort -zt'.' -k2V | xargs -0 cat > "파일명.zip"
- 해당 명령어 실행 시, 실행 경로 위치에 병합 압축 파일이 생성됩니다.
- 병합된 파일 용량이 0일 경우, 제대로 병합이 되지 않은 상태이니 "폴더경로"가 제대로 입력되었는지 확인 부탁드립니다.
※ 데이터셋 소개 페이지에서 다운로드 버튼 클릭하여 승인이 필요합니다.
오프라인 데이터 이용 안내
본 데이터는 K-ICT 빅데이터센터에서도 이용하실 수 있습니다.
다양한 데이터(미개방 데이터 포함)를 분석할 수 있는 오프라인 분석공간을 제공하고 있습니다.
데이터 안심구역 이용절차 및 신청은 K-ICT빅데이터센터 홈페이지를 참고하시기 바랍니다.