AI-Hub

#컴퓨터 그래픽스

NEW 한국 전통 수묵화 화풍별 제작 데이터

분야영상이미지
유형 이미지

구축년도 : 2022 갱신년월 : 2024-01 조회수 : 3,980 다운로드 : 140 용량 :

샘플 데이터

※샘플데이터는 데이터의 이해를 돕기 위해 별도로 가공하여 제공하는 정보로써 원본 데이터와 차이가 있을 수 있으며,
데이터에 따라서 민감한 정보는 일부 마스킹(*) 처리가 되어 있을 수 있습니다.

소개 파일 목록 (API 다운로드)

※ 내국인만 데이터 신청이 가능합니다.

데이터 토론 문의하기 목록

데이터 변경이력

데이터 변경이력
버전	일자	변경내용
1.2	2024-01-31	최종데이터 수정 개방
1.1	2023-11-17	데이터 최종 개방
1.0	2023-05-04	데이터 개방 (Beta Version)

데이터 히스토리

데이터 히스토리
일자	변경내용	비고
2023-12-20	산출물 전체 공개

소개

● 이미지 스타일 변환모델 및 생성모델을 적용한 수묵화 화풍별 제작 이미지 데이터셋
● 사극, 뮤직드라마, 광고, 애니메이션 등 콘텐츠 제작에 본 데이터셋 및 유효성 검증모델 활용 가능

구축목적

● 한국 전통수묵화 디지털콘텐츠 제작 활성화 및 인공지능 미술시장 확대

메타데이터 구조표
데이터 영역	영상이미지	데이터 유형	이미지
데이터 형식	jpg, mp4	데이터 출처	크라우드소싱(직접제작)
라벨링 유형	분류태그	라벨링 형식	JSON
데이터 활용 서비스	수묵화 이미지 스타일 변환/생성 서비스	데이터 구축년도/ 데이터 구축량	2022년/7,525건

데이터 구축 규모
수묵화 이미지 총 7,325건, 제작영상 총 200건

구분		세부내역	성과목표
데이터셋	수집	이미지 데이터	7,325건
	수집	영상 데이터	200건
	가공/검수	클래스 대상별 분포	풍경 2,228 건
			인물 2,414 건
			사물 2,683 건
		클래스 유형별 분포	실사 사진 3220 건
			애니메이션 이미지 3,174 건
			유명 서양화 931 건
		표현기법 분포	백묘법-건필 782 건
			백묘법-중필 903 건
			백묘법-습필 785건
			구륵법-철선-운염 612건
			구륵법-철선-적묵 558건
			구륵법-난염-운염 613건
			구륵법-난염-적묵 598건
			몰골법-발묵 1,176 건
			몰골법-파묵 1,298 건
		클래스별 작품 난이도 분포	A 560 건
			B 1,902 건
			C 3,662 건
			D 1,201 건
		종이 재질에 따른 분포	화선지 3,801 건
		종이 재질에 따른 분포	순지 3,524 건

*백묘법 : 붓이 머금은 수분 함유량에 따라 달리 표현되는 선의 물 번짐을 이용한 기법
*구륵법 : 일필휘지 단필 또는 중첩으로 채색하여 표현하는 기법
*몰골법 : 농묵과 담묵이 중첩되어 표현하거나 붓자국 없이 번짐 활용한 기법


클래스 대상별 분포	클래스 유형별 분포	표현기법 분포

항목명	지표		결과
클래스 대상별분포	목표 구성비		구분	수량	비중
	풍경	28.60%	풍경	246	23.77%
	인물	32.86%	인물	342	33.04%
	사물	38.57%	사물	447	43.19%
			합계	1,035	100%
클래스 유형별 분포	목표 구성비		구분	수량	비중
	실사 사진	43.93%	실사 사진	384	37.10%
	애니메이션	43.21%	애니메이션	315	30.43%
	이미지	43.21%	이미지	315	30.43%
	유명 서양화	12.86%	유명 서양화	336	32.46%
			합계	1,035	100%
표현기법 분포	목표 구성비		구분	수량	비중
	백묘법-갈필	11.07%	백묘법-갈필	61	5.89%
	백묘법-중필	11.07%	백묘법-중필	239	23.09%
	백묘법-윤필	11.07%	백묘법-윤필	45	4.35%
	구륵법-철선-운염	8.30%	구륵법-철선-운염	35	3.38%
	구륵법-철선-적묵	8.30%	구륵법-철선-적묵	141	13.62%
	구륵법-난엽-운염	8.30%	구륵법-난엽-운염	72	6.96%
	구륵법-난염-적묵	8.31%	구륵법-난염-적묵	97	9.37%
	몰골법-발묵	16.79%	몰골법-발묵	135	13.04%
	몰골법-파묵	16.79%	몰골법-파묵	210	20.29%
			합계	1,035	100%
클래스별 작품 난이도 분포	목표 구성비		구분	수량	비중
	A	7.84%	A	65	6.28%
	B	27.14%	B	168	16.23%
	C	52.16%	C	420	40.58%
	D	12.86%	D	382	36.91%
			합계	1,035	100%
종이 재질에 따른 분포	목표 구성비		구분	수량	비중
	화선지	50%	화선지	482	46.57%
	순지	50%	순지	553	53.43%
			합계	1,035	100%

저작도구 설명서 및 저작도구 다운로드
저작도구 설명서 다운로드 저작도구 다운로드

AI 모델 상세 설명서 다운로드

AI 모델 상세 설명서 다운로드 AI 모델 다운로드

ㅇ 활용 AI 모델
- 인공지능 수묵화 이미지 변환모델(DCGAN) 1개
- 수묵화 이미지 생성모델(CycleGAN) 1개

학습모델	내용	지표	목표치
DCGAN	이미지 생성(Image Generation Model IS 2 이상) AI 기술을 활용하여 수묵화 이미지에서 새로운 수묵화 이미지 생성	Inception Score	2
CycleGAN	이미지 스타일 변환(Style Transfer Model AMT Score 20% 이상) 수묵화 이미지의 특성(feature)을 CNN 및 GAN 신경망을 통하여 새로운 이미지를 학습된 스타일을 변경하는 모델	AMT Score, Loss	20, 3.5

구분	고려 사항	설명
1	적합성	화풍별 제작 데이터셋 구축 목적에 적합한 학습모델인가
1	적합성	(재료, 기법 등을 달리하여 동일 원본에 대한 상이 컨텐츠 제작)
2	활용성	사용자의 수묵화 컨텐츠에 대한 접근성이 높은 학습 모델인가
3	실현가능성	구축된 학습데이터셋을 활용하여 실제 컨텐츠 제작에 적용하고 실현가능성이 높은 모델인가
4	선정 절차	1) 선정기준에 적합한 후보 리스트업
		2) 각 학습모델 후보군 테스트 1-Cycle 학습모델 개발 및 진행
		3) 성능평가
		4) 모델 관련 코드 작성 및 최종 학습모델 선정

① 인공지능을 통한 수묵화 이미지 스타일 변환 모델 - Style Transfer (CycleGan)
- (개발 목표) 수묵화 이미지의 특성(feature)을 CNN 및 GAN 신경망을 통하여 새로운 이미지를 학습된 스타일을 변경하는 Style Transfer 모델 제시
- (개발 내용) CycleGAN에서는 각각 2개의 discriminator와 generator가 존재하며, G는 X → Y의 mapping을 수행하고 F는 Y → X의 mapping을 수행. Dx와 Dy는 각각 domain X와 Y의 이미지를 판별함. 이때 생성된 이미지와 실제 이미지 간의 loss를 Adversarial loss로 G와 F의 Matching을 학습시키는 Cycle Consistency loss를 구하는 방식으로 모델 개발

② 인공지능을 통한 수묵화 이미지 생성 모델 - Image Generator (DCGAN)
- (개발 목표) 인공지능 기술을 활용하여 수묵화 이미지 데이터셋 집합에서 새로운 수묵화 그림을 생성하는 GAN 기반의 이미지 생성모델 제시
- (개발 내용) DCGAN은 CNN 구조로 판별자 D와 생성자 G를 구성하는 GAN임. 판별지는 이미지를 입력받아 이진분류를 수행하므로 CNN구조를, 생성자는 random vector z를 입력자로 받아 이미지를 생성해야하므로 deconvolutional network 구조를 갖는 방식으로 모델 개발

데이터 성능 점수

측정값 (%)

기준값 (%)

데이터 성능 지표

데이터 성능 지표
번호	측정항목	AI TASK	학습모델	지표명	기준값 점수	측정값 점수
1	스타일 변환 성능	Image Generation	CycleGAN	AMT Score	20 %	46.93 %
2	이미지 생성 성능	Image Generation	DCGAN	IS	2 단위없음	2.21 단위없음

※ 데이터 성능 지표가 여러 개일 경우 각 항목을 클릭하면 해당 지표의 값이 그래프에 표기됩니다.

※ AI모델 평가 지표에 따라 측정값의 범위, 판단 기준이 달라질 수 있습니다. (ex. 오류율의 경우, 낮을수록 좋은 성능을 내는 것으로 평가됩니다)

설명서 및 활용가이드 다운로드

데이터 설명서 다운로드 구축활용가이드 다운로드

1. 데이터 포맷

구분	획득(수집) 단계	정제 단계	가공(라벨링) 단계
데이터 구분	원시데이터	원시데이터	원천데이터
데이터 형태	작품 → 동영상 작품 → 이미지 파일	동영상 → 불필요 영상 삭제 및 떨림 보정 이미지 파일 → 스캔 과정에서의 노이즈 이미지 정제	디지털 파일 형태로 산출
데이터 포멧	＊ 영상 : MP4파일 / 해상도 (Full HD, 1920*1080) 이미지 : JPG (300DPI 이상)	＊ 영상 : MP4파일 / 해상도 (Full HD, 1920*1080) 이미지 : JPG (300DPI 이상)	＊ 이미지: JPG 메타데이터: JSON *영상 데이터는 라벨링 과정을 진행하지 않음 영상 : MP4

No	구분	필수여부	항목명	속성 및 내용
1	원시데이터	필수	Dataset.identifier	데이터셋 식별자
2		필수	Dataset.name	데이터셋 이름
3		필수	Dataset.src_path	데이터셋 폴더 위치
4		필수	Dataset.label_path	데이터셋 레이블
4		필수	Dataset.label_path	폴더 위치
5		필수	Dataset.category	데이터셋 대상 카테고리
6		필수	Images.identifier	이미지 식별자(파일명)
7		필수	Images.type	이미지(영상)
7		필수	Images.type	파일 확장자
8		필수	Images.width	이미지 가로 크기(픽셀)
9		필수	Images.height	이미지 세로 크기(픽셀)
10		필수	data.captured	이미지 생성 일자
11		필수	Image.category	이미지 유형
12		필수	Image.target	이미지 대상
13		선택	camera_model	촬영 기기 모델명
14	원천데이터	필수	annotations[].paint.method	수묵화 표현기법
15		필수	annotations[].paint.size	작품 사이즈
16		필수	annotations[].pair	원본 데이터 대상
17		필수	annotations[].paper	종이 유형
18		필수	annotations[].diff	작품 난이도

2. 어노테이션 포맷

구 분			항목명	타입	필수	설명
1			dataset_info[]			라벨링 메타정보 공통참조항목
	1-1		identifier	string	y	데이터셋 식별자
	1-2		name	string	y	데이터셋 이름
	1-3		src_path	string	y	데이터셋 폴더 위치
	1-4		label_path	string	y	데이터셋 레이블 폴더위치
	1-5		category	num	y	데이터셋 대상 카테고리
2			images[]			라벨링 이미지 파일 공통참조항목
	2-1		identifier	string	y	이미지 식별자
	2-2		type	string	y	이미지(영사) 파일 확장자
	2-3		width	num	y	이미지 가로 크기(픽셀)
	2-4		height	num	y	이미지 세로 크기(픽셀)
	2-5		captured	string	y	이미지 생성일자 및 시간
	2-6		category	num	y	이미지 유형 (구문규칙 참조)
	2-7		target	num	y	이미지 대상 (구문규칙 참조)
	2-8		camera_model	string	n	카메라 모델
3			annotations[]			원천데이터(수묵화) 어노테이션 방식 ‘pair’ 데이터
	3-1		paint[]	array	y	원시데이터
		3-1-1	method	num	y	대화 주제
		3-1-2	Width	num	y	가로 사이즈
		3-1-3	Height	num	y	세로 사이즈
	3-2		Paire	string	y	원본데이터 대상
	3-3		PaperType	num	y	종이유형
	3-4		Difficulty	num	y	작품 난이도

3. 데이터 구성

No	Field name	Length	Meaning
1	대상별 구분	1	풍경 (1), 인물 (2), 사물 (3)
2	유형별 구분	1	실사 사진 (1), 애니메이션 이미지 (2), 유명 서양화 (3)
3	표현기법 구분	1	백묘법-건필 (1), 백묘법-중필 (2), 백묘법-습필(3)
			구륵법-철선-운염 (4), 구륵법-철선-적묵(5), 구륵법-난엽-운염 (6), 구륵법-남염-적묵 (7)
			몰골법-발묵 (8), 몰골법-파묵 (9)
4	종이 종류	1	화선지 (1), 순지 (2)
5	등급별 구분	1	A (1), B (2), C (3), D (4)

디렉터리 구조	Depth-1	Depth-2	Depth-3
디렉토리 이름	원천데이터	01.풍경	01. 실사사진
			02. 애니메이션 이미지
			03. 유명 서양화
		02.인물	01. 실사사진
			02. 애니메이션 이미지
			03. 유명 서양화
		03.사물	01. 실사사진
			02. 애니메이션 이미지
			03. 유명 서양화
	라벨링데이터	01.풍경	01. 실사사진
			02. 애니메이션 이미지
			03. 유명 서양화
		02.인물	01. 실사사진
			02. 애니메이션 이미지
			03. 유명 서양화
		03.사물	01. 실사사진
			02. 애니메이션 이미지
			03. 유명 서양화

분류	내용
이미지
	원본데이터	원시데이터 –1 (인물-유명서양화-백묘법-중필-순지-B등급)

	원시데이터 –2	원시데이터 –3
	(인물-유명서양화-몰골법-발묵-순지-B등급)	(인물-유명서양화-구륵법-(철선-운염)-순지-B등급)
라벨	<그림> 라벨 예시

데이터셋 구축 담당자

수행기관(주관) : 경희대학교 산학협력단

수행기관(주관)
책임자명	전화번호	대표이메일	담당업무
나형민	02-961-0641	leesan@khu.ackr	데이터 수집, 데이터 검수

수행기관(참여)

수행기관(참여)
기관명	담당업무
서울대학교 산학협력단	데이터 수집, 데이터 검수
올빅뎃(주)	데이터 수집, 데이터 가공, 데이터 검수, AI모델 개발
한국딥러닝(주)	데이터 수집, 데이터 가공, 데이터 검수, AI모델 개발

데이터 관련 문의처

데이터 관련 문의처
담당자명	전화번호	이메일
나형민	02-961-0641	leesan@khu.ackr

보건의료 데이터 개방 안내

보건의료 데이터는 온라인 및 오프라인 안심존을 통해 개방됩니다.

안심존이란 안심존 이용메뉴얼 안심존 이용신청

인터넷과 물리적으로 분리된 온라인·오프라인 공간으로 의료 데이터를 포함하여 보안 조치가 요구되는 데이터를 다운로드 없이 접근하고 분석 가능
* 온라인 안심존 : 보안이 보장된 온라인 네트워크를 통해 집, 연구실, 사무실 등 어디서나 접속하여 데이터에 접근하고 분석
* 오프라인 안심존 : 추가적인 보안이 필요한 데이터를 대상으로 지정된 물리적 공간에서만 접속하여 데이터에 접근하고 분석
1. AI 허브 접속
  신청자
2. 안심존
  사용신청신청자신청서류 제출*
3. 심사구축기관
4. 승인구축기관
5. 데이터 분석 활용신청자
6. 분석모델반출신청자
1. 기관생명윤리위원회(IRB) 심의 결과 통지서 [IRB 알아보기]
2. 기관생명윤리위원회(IRB) 승인된 연구계획서
3. 신청자 소속 증빙 서류 (재직증명서, 재학증명서, 근로계약서 등 택1)
4. 안심존 이용 신청서 [다운로드]
5. 보안서약서 [다운로드]
※ 상기 신청서 및 첨부 서류를 완비한 후 신청을 진행하셔야 정상적으로 절차가 이루어집니다.
신청 및 이용관련 문의는 safezone1@aihub.kr 또는 02-525-7708, 7709로 문의