콘텐츠로 건너뛰기 메뉴로 건너뛰기 푸터로 건너뛰기
데이터를 불러오고 있습니다
데이터를 저장하고 있습니다
#신체형상 및 치수 데이터 # 신체 부위 및 동작 추정

한국인 전신 형상 및 치수 측정 데이터(성인)

한국인 전신 형상 및 치수 측정 데이터(성인)
  • 분야영상이미지
  • 유형 이미지
구축년도 : 2021 갱신년월 : 2023-07 조회수 : 13,185 다운로드 : 550 용량 :
샘플 데이터 ?

샘플데이터는 데이터의 이해를 돕기 위해 별도로 가공하여 제공하는 정보로써 원본 데이터와 차이가 있을 수 있으며,
데이터에 따라서 민감한 정보는 일부 마스킹(*) 처리가 되어 있을 수 있습니다.

※ 내국인만 데이터 신청이 가능합니다.

  • 데이터 변경이력

    데이터 변경이력
    버전 일자 변경내용 비고
    1.2 2023-07-06 라벨링데이터 추가 개방
    1.1 2023-06-28 원천데이터, 라벨링데이터 추가 개방
    1.0 2022-07-28 데이터 최초 개방

    데이터 히스토리

    데이터 히스토리
    일자 변경내용 비고
    2024-01-10 활용 AI 모델 및 코드 내용 수정
    2022-10-20 신규 샘플데이터 개방
    2022-07-28 콘텐츠 최초 등록

    소개

    인공지능 학습용 데이터 구축을 위한 ‘한국인 전신 형상의 2D, 3D 데이터 취득 및 치수 측정’ 데이터의 원천데이터를 획득하여 AI 학습용 데이터로 정제, 가공하여 공개하는 것을 목표로 함

    구축목적

    국내 데이터 모델 부재에 따른 구축 필요, 한국인 인체형상 특성을 고려한 제품 및 서비스 분석을 위한 인공지능 기반 치수 자동 추정을 위해 한국인 표준 규격에 부합하여 산업 표준에 활용될 수 있는 형태로 구축
  • 1. 데이터 구축 규모

    1. 데이터 구축 규모
    원천데이터 2D Data
    - 데이터 포맷 : jpg
    해상도 : 1960 X 2940
    총수량 : 1,000,000장 이상

    3D Data
    - 데이터 포맷 및 획득 수량
    . mesh (obj / mtl / jpg) : 각 1,000개
    . point cloud (ply) : 1,000개
    총 획득 수량
    . 3D 파일 : 1,000세트

    신체 치수 실측 데이터
    - 데이터 포맷 : CSV
    모델 유형(성별, 연령 등)
    신체 정보 기록(키, 몸무게 포함 36개 항목)
    - 총수량 : 1,000개 (36,000개의 치수 정보)
    가공 및
    정제 데이터
    가공 결과 데이터
    - 데이터 포맷 : JSON
    - 총수량 : 1,000,000개 이상

     

     

    2. 데이터 구축 분포

    2. 데이터 구축 분포
    남자 20~29세 30~39세 40~49세 50~59세 60세 이상 총계
    중앙값 신장(cm) 173.5 172.1 169.1 165.95 164.4 -
    하한 166.8 164.9 161.9 159 157.8
    상한 180.5 179.5 176.6 174.2 170.6
    중앙값 몸무게(kg) 69.4 72.7 70.6 68.8 67.1
    하한 59.4 61.2 58.9 57.8 55.5
    상한 84.4 87.1 84.6 79.8 76
    조사인원(명) 95 95 110 114 86 500
    비중 19% 19% 22% 22.80% 17.20%  
    1) 2개 적합 80% (명) 68 68 80 83 101 400
    2) 1개 적합 15% (명) 13 13 15 15 19 75
    3) 그 외 5% (명) 4 5 5 5 6 25
    여자 20~29세 30~39세 40~49세 50~59세 60세 이상 총계
    중앙값 신장(cm) 160.5 159.5 156.6 154.7 152.3 -
    하한 153.5 152.8 150.5 148.1 146.1
    상한 167 166.5 163 161 159
    중앙값 몸무게(kg) 52.2 54.9 56.7 58.3 57.3
    하한 45.6 47.4 47.5 50 48.7
    상한 61.7 66.1 66.4 68.3 69
    조사인원(명) 88 90 111 117 94 500
    비중 17.60% 18% 22.20% 23.40% 18.80% 100
    1) 2개 적합 80% (명) 60 64 76 80 120 400
    2) 1개 적합 15% (명) 11 12 14 15 23 75
    3) 그 외 5% (명) 3 4 6 5 7 25

     

    2. 데이터 구축 분포
    레벨 분류 비중
    대분류 성별 남자 500명 (50%)
    여자 500명 (50%)
    중분류 연령 20 ~ 29 세 (18.3%)
    30 ~ 39 세 (18.5%)
    40 ~ 49 세 (22.1%)
    50 ~ 59 세 (23.1%)
    60세 이상 (18.0%)
    소분류 복장 측정복 (17%)
    춘추복 (33%)
    하복 (33%)
    동복 (17%)

     

  • 저작도구 설명서 및 저작도구 다운로드

    저작도구 설명서 다운로드 저작도구 다운로드
  • AI 모델 상세 설명서 다운로드

    AI 모델 상세 설명서 다운로드 AI 모델 다운로드

    모델학습

    1. 신체 부위 세그멘테이션

    • 한국인 전신 형상을 촬영한 이미지에 사람의 신체 부위에 대한 세그멘테이션을 수행하는 인공지능 학습 모델 개발
    • 데이터를 학습(train), 검증(validation), 시험(test)용으로 8:1:1 비율로 나누고, 데이터 분포 특성을 확인하여, 데이터셋의 편향이 없는 학습 및 검증 수행
    • 구축된 데이터를 이용한 학습 수행 및 추론 기능 개발
    • 학습 및 추론 수행에 대한 지표(metric) 및 정확도 출력 기능 개발
    • 상기 명시한 인공지능 학습 모델로 본사업에서 구축한 데이터들을 대상으로 학습 과정 수행
    • 모델 성능 지표 mloU(mean lntersection over Union) 50% 달성할 수 있도록 유효성 검증 및 성능 개선 수행
      • 인공지능 학습 모델 선정
        신체 부위 세그멘테이션을 위한 인공지능 학습 모델은 ResNet과 Edge-detection을 결합한 CE2P(Context Embedding with Edge Perceiving) 알고리즘(Tao Ruan et.al, 2019)을 적용
        한국인 전신 형상 및 치수 측정 데이터(성인)-신체 부위 세그멘테이션_1_CE2P 모델 네트워크 구성도
        [CE2P 모델 네트워크 구성도] 
      • 모델 학습 수행
        CE2P 모델 학습은 라벨링 수준에 따라 2단계로 구분하여 수행. 1단계 학습은 전체 신체 부위에 대한 라벨링이 수행된 자료를 사용하였으며, 2단계 학습은 카메라의 위치에 따라 부분적으로 라벨링을 수행한 이미지를 적용. 2단계 학습은 1단계 학습을 통해 도출된 학습 결과 weight를 pre-trained model로 적용하는 전이 학습 기법을 적용.
        한국인 전신 형상 및 치수 측정 데이터(성인)-신체 부위 세그멘테이션_2_학습 진행 과정 예시
        [학습 진행 과정 예시]

    2. 인체 3D 골격추정

    모델학습
    연구개발 내용 연구개발 범위
    인체 골격 추정 방법론  2D 영상에 획득된 사람의 골격을 3D로 추론하는 기술 
    리깅 및 리타겟팅 기술  리깅된 인체 모델에 획득된 모션으로 리타겟팅하는 기술 
    응용 시나리오 탐색  메타버스 응용을 위한 선행 기술 조사 및 데모 시연 
    • 딥러닝 기반 인체 자세 / 골격 추정 방법론 조사
      • 딥러닝 기반 3D 골격 추정 및 리타겟팅 응용 연구 
        • OpenPose 기반 2D 관절점으로 3D Adam 골격 모델 추정 
        • 추정된 골격 모델을 복원된 외형 템플릿에 적용. 리타겟팅 코드를 공개함. 
        • 다양한 응용 시나리오 적용을 위해 본 연구의 오픈 소스를 활용함 
    • 딥러닝 기반 인체자세/골격추정 기술 분석
      • 딥러닝 기반 2D 관절점 추정 기술 (OpenPose) 
        • 인체의 2D 관절점과 관절점 간의 친화도를 학습하는 네트워크 설계 제안 
        • 다중 인체 객체를 동시에 검출하여 처리 속도가 빠름. 실시간 수행 가능. 
      • 딥러닝 기반 3D 관절점 추정으로 확장 (Monocular Total Capture)
        • 2D 영상에서 3D 골격 좌표를 추정하는 방법론이 성공적으로 제시됨. 
        • Part Affinity Fields (PAFs) 모듈 성능 확인. 3D 에 대해서도 적용. 
        • 데이터 부족으로 인한 성능 저하를 극복하기 위해 모델 정합 및 추적 기술 활용. 
        • 추정된 골격 좌표를 Adam 모델에 적용하여 인체 외형을 변형. 
    • 골격좌표를 적용하여 아바타를 변형하는 기술
      • Monocular Total Capture 의 오픈 소스를 개발하여 응용 시나리오별 테스트 진행

    한국인 전신 형상 및 치수 측정 데이터(성인)-인체 3D 골격추정_1_인체 3D 골격 추정 및 리타겟팅 결과 예시

    • 모델 학습은 학습 과정 확인을 위해 개발된 python codejupyter notebookimport하여 적용하였으며, jupyter notebook 파일은 성과품에 포함하여 별도로 제출

  • 데이터 성능 점수

    측정값 (%)
    기준값 (%)

    데이터 성능 지표

    데이터 성능 지표
    번호 측정항목 AI TASK 학습모델 지표명 기준값 점수 측정값 점수
    1 신체 치수 예측 Image Classification ConvMath_ViT MAPE 80 % 99.96 %
    2 신체 주요부위 추정(Human Parsing) Image Classification CE2P mIoU 50 % 66.84 %

    ※ 데이터 성능 지표가 여러 개일 경우 각 항목을 클릭하면 해당 지표의 값이 그래프에 표기됩니다.

    ※ AI모델 평가 지표에 따라 측정값의 범위, 판단 기준이 달라질 수 있습니다. (ex. 오류율의 경우, 낮을수록 좋은 성능을 내는 것으로 평가됩니다)

  • 설명서 및 활용가이드 다운로드

    데이터 설명서 다운로드 구축활용가이드 다운로드

    1. 데이터 포맷

    1. 데이터 포맷
    2D 이미지 데이터 JPG 어노테이션 파일 JSON
    한국인 전신 형상 및 치수 측정 데이터(성인)-데이터 포맷_1_2D 이미지 데이터 JPG 한국인 전신 형상 및 치수 측정 데이터(성인)-데이터 포맷_2_어노테이션 파일 JSON

     

    1. 데이터 포맷
    데이터 종류 3D 메쉬 텍스처 포인트 클라우드
    (Mesh) (Texture) (PointCloud)
    예시 한국인 전신 형상 및 치수 측정 데이터(성인)-데이터 포맷_3_3D 메쉬(Mesh) 한국인 전신 형상 및 치수 측정 데이터(성인)-데이터 포맷_4_텍스처(Texture) 한국인 전신 형상 및 치수 측정 데이터(성인)-데이터 포맷_5_포인트 클라우드(PointCloud)
    데이터 포맷 .obj .jpg .ply
    데이터 사양 3M Polygon 이상 4,096 * 4,096 pixel 50K point 이상

     

     

    2. 데이터 구성

    • 데이터 -- 1.Training -- ┌ [라벨링데이터]
             │        │    ├[Model]
             │        │    │   └ [json]
             │        │     .       ├ [Action_Cloth_CameraNumber.json]
             │        │     .       ├ [Action_Cloth_CameraNumber.json]
             │        │                .
             │        └ [원천데이터]
             │            ├ [Model]
             │            │  ├ [csv]
             │             .  │  └ [Model.csv] 
             │             .  └ [Image]
             │                    ├ [Action_Cloth_CameraNumber.jpg]
             │                    ├ [Action_Cloth_CameraNumber.jpg]
             │                        .
           2.Validation -- ┌ [라벨링데이터]
             │         │    ├[Model]
             │         │    │   └ [json]
             │         │     .       ├ [Action_Cloth_CameraNumber.json]
             │         │     .       ├ [Action_Cloth_CameraNumber.json]
             │         │                .
             │         └ [원천데이터]
             │            ├ [Model]
             │            │  ├ [csv]
             │             .  │  └ [Model.csv] 
             │             .  └ [Image]
             │                    ├ [Action_Cloth_CameraNumber.jpg]
             │                    ├ [Action_Cloth_CameraNumber.jpg]
             │                        .
           3.Test ------ ┌ [라벨링데이터]
             │        │    ├[Model]
             │        │    │   └ [json]
             │        │     .       ├ [Action_Cloth_CameraNumber.json]
             │        │     .       ├ [Action_Cloth_CameraNumber.json]
             │        │                .
             │        └ [원천데이터]
             │            ├ [Model]
             │            │  ├ [csv]
             │             .  │  └ [Model.csv] 
             │             .  └ [Image]
             │                    ├ [Action_Cloth_CameraNumber.jpg]
             │                    ├ [Action_Cloth_CameraNumber.jpg]
             │                        .
           4.Sample  ---- ┌ [라벨링데이터]
                    │    ├[Model]
                   │    │   └ [json]
                   │     .       ├ [Action_Cloth_CameraNumber.json]
                   │     .       ├ [Action_Cloth_CameraNumber.json]
                   │                .
                   └ [원천데이터]
                      ├ [Model]
                      │  ├ [csv]
                       .  │  └ [Model.csv] 
                       .  └ [Image]
                              ├ [Action_Cloth_CameraNumber.jpg]
                              ├ [Action_Cloth_CameraNumber.jpg]

       
      2. 데이터 구성
      항목 설명
      [name] · 폴더이름
      Action_Cloth_CameraNumber.json · 어노테이션 정보가 있는 json 파일
      · Action : 01~06 총 6가지 자세
      01(차렷), 02(A자), 03(T자),
      04(손 펴서 팔 직각 들기), 05(앞으로 나란히), 06(걷기),
      · Cloth : 측정복, 춘추복, 하복, 동복 총 4개의 복장
      01(측정복), 02(춘추복1), 03(춘추복2)
      04(하복1), 05(하복2), 06(동복)
      · CameraNumber : 01 ~ 32까지의 카메라 넘버
      Action_Cloth_CameraNumber.jpg · 정제처리가 된 image 파일
      · Action : 01~06 총 6가지 자세
      01(차렷), 02(A자), 03(T자),
      04(손 펴서 팔 직각 들기), 05(앞으로 나란히), 06(걷기),
      · Cloth : 측정복, 춘추복, 하복, 동복 총 4개의 복장
      01(측정복), 02(춘추복1), 03(춘추복2)
      04(하복1), 05(하복2), 06(동복)
      · CameraNumber : 01 ~ 32까지의 카메라 넘버
      Model.csv · 모델의 신체치수 측정 데이터
      F : 여자
      M : 남자
      번호 : 모델의 고유번호

    3. 어노테이션 포맷

    3. 어노테이션 포맷
    구분 항목명 타입 필수여부 설명 범위 비고
    1 inspRejectYn String N 검수현황값    
    2 labelingInfo Object Y 객체별 어노테이션 데이터   비고정 키값
      02월 01일 labelingInfo[].color String Y 객체 표시 색    
    02월 02일 labelingInfo[].location String Y 폴리곤 위치 값    
    02월 03일 labelingInfo[].label String Y 객체 이름    
    02월 04일 labelingInfo[].type String Y 라벨링 타입 ‘polygon’  
    3 images Object        
      03월 01일 identifier String Y 파일명    
    03월 02일 dateTime String Y 촬영일자    
    03월 03일 fileFormat String Y 파일 형식(포맷)    
    03월 04일 imgSize String Y 이미지 파일 크기    
    03월 05일 imgPhotographer String   촬영자    
    03월 06일 device String   카메라 장비정보    
    03월 07일 imgLocation String   촬영위치    
    03월 08일 copyRight String   저작권 정보    
    03월 09일 resolution String Y 해상도    
    03월 10일 colorDepth Number   컬러깊이    
    03월 11일 ISO Number   ISO감도    
    03월 12일 definition String   선명도    
    03월 13일 whiteBalance Number   화이트 밸런스    
    03월 14일 exposureTime Number   노출시간    
    03월 15일 exposureMode String   노출모드    
    03월 16일 F-Stop Number   조리개 값    
    03월 17일 flash String   플래시 사용여부    
    03월 18일 filter String   필터    
    03월 19일 focalLength Number   초점거리    
    03월 20일 fieldOfView Number   시야각(화각)    
    03월 21일 angle Number   촬영각도    
    03월 22일 GPS Object   GPS정보    
    03월 23일 weather String   날씨    
    4 bodyinfo Object   모델 정보    
      04월 01일 bodyinfo.sex String Y 성별    
    04월 02일 bodyinfo.age Number Y 나이    
    5 position String Y 모델 자세    
    6 cloth String Y 복장    
    7 camera_number Number Y 카메라 넘버    

     

     

    4. 실제 예시

    한국인 전신 형상 및 치수 측정 데이터(성인)-실제 예시_1

  • 데이터셋 구축 담당자

    수행기관(주관) : ㈜위지윅스튜디오
    수행기관(주관)
    책임자명 전화번호 대표이메일 담당업무
    고태윤 02-749-0507 ktaey@wswgstudios.com · 사업총괄 및 데이터 정제
    수행기관(참여)
    수행기관(참여)
    기관명 담당업무
    ㈜이오이스 · 데이터 수집
    ㈜메트릭스 · 데이터 가공
    ㈜미소정보기술 · 저작도구
    ㈜에어패스 · 데이터 활용
보건의료 데이터 개방 안내

보건의료 데이터는 온라인 및 오프라인 안심존을 통해 개방됩니다.

안심존이란 안심존 이용메뉴얼 안심존 이용신청 데이터 열람신청
  • 인터넷과 물리적으로 분리된 온라인·오프라인 공간으로 의료 데이터를 포함하여 보안 조치가 요구되는 데이터를 다운로드 없이 접근하고 분석 가능
    * 온라인 안심존 : 보안이 보장된 온라인 네트워크를 통해 집, 연구실, 사무실 등 어디서나 접속하여 데이터에 접근하고 분석
    * 오프라인 안심존 : 추가적인 보안이 필요한 데이터를 대상으로 지정된 물리적 공간에서만 접속하여 데이터에 접근하고 분석

    1. AI 허브 접속
      신청자
    2. 안심존
      사용신청
      신청자신청서류 제출*
    3. 심사구축기관
    4. 승인구축기관
    5. 데이터 분석 활용신청자
    6. 분석모델반출신청자
  • 1. 기관생명윤리위원회(IRB) 심의 결과 통지서 [IRB 알아보기] [공용IRB 심의신청 가이드라인]
    2. 기관생명윤리위원회(IRB) 승인된 연구계획서
    3. 신청자 소속 증빙 서류 (재직증명서, 재학증명서, 근로계약서 등 택1)
    4. 안심존 이용 신청서 [다운로드]
    5. 보안서약서 [다운로드]
    ※ 상기 신청서 및 첨부 서류를 완비한 후 신청을 진행하셔야 정상적으로 절차가 이루어집니다.

  • 신청 및 이용관련 문의는 safezone1@aihub.kr 또는 02-525-7708, 7709로 문의

데이터셋 다운로드 승인이 완료 된 후 API 다운로드 서비스를 이용하실 수 있습니다.

API 다운로드 파일은 분할 압축되어 다운로드 됩니다. 분할 압축 해제를 위해서는 분할 압축 파일들의 병합이 필요하며 리눅스 명령어 사용이 필요합니다.

리눅스 OS 계열에서 다운로드 받으시길 권장하며 윈도우에서 파일 다운로드 시 wsl(리눅스용 윈도우 하위 시스템) 설치가 필요합니다.

※ 파일 병합 리눅스 명령어

find "폴더경로" -name "파일명.zip.part*" -print0 | sort -zt'.' -k2V | xargs -0 cat > "파일명.zip"

- 해당 명령어 실행 시, 실행 경로 위치에 병합 압축 파일이 생성됩니다.

- 병합된 파일 용량이 0일 경우, 제대로 병합이 되지 않은 상태이니 "폴더경로"가 제대로 입력되었는지 확인 부탁드립니다.

※ 데이터셋 소개 페이지에서 다운로드 버튼 클릭하여 승인이 필요합니다.

오프라인 데이터 이용 안내

본 데이터는 K-ICT 빅데이터센터에서도 이용하실 수 있습니다.

K-ICT 빅데이터센터는 데이터 안심구역으로 지정되어
다양한 데이터(미개방 데이터 포함)를 분석할 수 있는 오프라인 분석공간을 제공하고 있습니다.

데이터 안심구역 이용절차 및 신청은 K-ICT빅데이터센터 홈페이지를 참고하시기 바랍니다.