콘텐츠로 건너뛰기 메뉴로 건너뛰기 푸터로 건너뛰기
데이터를 불러오고 있습니다
데이터를 저장하고 있습니다
본 데이터는
온라인 안심존 데이터 ?

온라인 안심존 : 보안이 보장된 온라인 네트워크를 통해 집, 연구실, 사무실 등 어디서나 접속하여 데이터에 접근하고 분석

입니다.
#음성 #헬스케어 건강서비스 #헬스케어 의료

NEW 노인 정신건강 영상 데이터

노인 정신건강 영상 데이터 아이콘 이미지
  • 분야헬스케어
  • 구분 안심존(온라인)
  • 유형 비디오 , 이미지
구축년도 : 2023 갱신년월 : 2024-10 조회수 : 5,406 다운로드 : 38

※ 내국인만 데이터 신청이 가능합니다.

  • 데이터 변경이력

    데이터 변경이력
    버전 일자 변경내용 비고
    1.1 2024-10-30 데이터 최종 개방
    1.0 2024-06-28 데이터 개방 Beta Version

    데이터 히스토리

    데이터 히스토리
    일자 변경내용 비고
    2025-01-06 메타데이터 정보 수정 데이터 구축량
    2024-06-28 산출물 공개 Beta Version

    소개

    - 의료기관에서 인지기능검사를 수행하면서 얻어지는 영상과 음성, 이미지 데이터를 기반으로 치매사전진단을 지원하는 AI 모델 개발에 필요한 학습용 데이터셋

    구축목적

    - 대상자의 음성, 발화, 행동적 특성 등을 AI 기술을 통해 분석하여 영상 및 음성데이터 등의 디지털 바이오마커들을 포함한 치매조기진단 모델을 개발하고자 함
  • - 데이터 구축 규모

    데이터 구축 규모
    데이터 종류 데이터 형태 데이터 규모 어노테이션 규모
    메타 데이터 csv 3,420건 1,140건 1,140건
    1,140건
    1,140건
    원천데이터 jpg 29,640건 1,140건
    png 5,700건 1,140건
    mp4 4,562건 1,140건
    라벨링데이터 json 7,982건 1,140건 1,140건
    1,140건 1,140건
    1,140건 1,140건
    pkl 4,562건 4,562건

     

    - 데이터 분포


    o 다양성
    의료기관에서 인지기능검사를 수행하는 피검자의 인지기능상태 분포

     - 성별: 남:여 비율은 가급적 1:1로 데이터를 수집함
    총 피험자 (수집된 원시데이터 기준) 1,203명 중 여성 765명(63.59%), 남성 438명(36.41%)

     - 연령은 50대, 60대, 70대, 80대이상, 4개의 클래스로 분류함
    총 피험자 (수집된 원시데이터 기준) 1,203명 중 50대 피험자 149명(12.39%), 60대 피험자 264명(21.95%), 70대 피험자 451명(37.49%), 80대 이상 피험자 339명(28.18%)

    - 질병 클래스별 분포
    총 피험자 (수집된 원시데이터 기준) 1,203명 중 정상 518명(43.06%), 비정상인지(경도인지+치매) 685명(56.94%) 

  • 저작도구 설명서 및 저작도구 다운로드

    저작도구 설명서 다운로드 저작도구 다운로드
  • AI 모델 상세 설명서 다운로드

    AI 모델 상세 설명서 다운로드 AI 모델 다운로드

    - 음성 정보 기반 치매 여부 분류 모델 성능
    학습 알고리즘: DenseNet121 
    학습 조건 
    train batch size = 16
    epoch = 100
    optimizer = ADAM
    initial ir = 1e-4

     

    - 오각형 이미지 기반 정상/이상 분류 모델 성능
    학습 알고리즘: DenseNet121 
    학습 조건 
    train batch size = 16
    epoch = 100
    optimizer = ADAM
    initial ir = 1e-4

    DenseNet 구조 이미지 1

    DenseNet 구조 이미지 2

    [그림] DenseNet

     

    - 구간 영상 정보 기반 눈깜박임 정상/이상 분류 모델 성능
    학습 알고리즘: CTR-GCN
    학습 조건 
    batch_size=32
    earning_rate = 0.01
    weight_decay=0.001
    num_epochs=64
    max_frames=90
    ramdom_rot=False

     

    - 구간 영상 정보 기반 입술떨림 정상/이상 분류 모델 성능
    학습 알고리즘: CTR-GCN
    학습 조건 
    batch_size=32
    learning_rate = 0.0001
    weight_decay=0.0005
    num_epochs=64
    max_frames=90
    ramdom_rot=True

     

    - 구간 영상 정보 기반 머리 기울기 정상/이상 분류 모델 성능
    학습 알고리즘: CTR-GCN
    학습 조건 
    batch_size=64
    learning_rate = 0.01
    weight_decay=0.001
    num_epochs=128
    max_frames=90
    ramdom_rot=False
    CTR-GCN 구조 이미지

    [그림] CTR-GCN

  • 설명서 및 활용가이드 다운로드

    데이터 설명서 다운로드 구축활용가이드 다운로드

    - 데이터 설명

     

    □ 노인 정신건강 영상 데이터 설명

    • 치매 환자의 경우 언어능력의 변화가 크기 때문에 이를 활용하여 치매 환자의 조기 발견을 시도할 수 있음.
    • 치매 환자는 머뭇거림, 잦은 멈춤, 흐릿한 발음, 떨림, 가벼운 말더듬, 불규칙한 단어 사용, 언어 유창성 감소, 말의 리듬 변화, 단순한 문법 및 어휘 규칙에서 벗어나는 것과 같은 언어 관련 증상을 보일 수 있음.
    • 따라서 정상, 치매 환자의 2그룹에 대하여 진단 검사를 시행하고, 동시에 동영상을 촬영하여 진단 중에 나타나는 피험자 음성, 오각형 그린 형상과 얼굴의 특이한 표정을 찾아내고자 함.
    • 이때 진단 중 특이한 사항은 임상 전문가들이 Check sheet에 기록하여, 라벨링 시 반영할 예정임.
    • 결론적으로 사전 정의된 AI 시스템 질의에 대한 일반인 답변의 음성특징과 일반인이 그린 특정 도형의 이미지 특징을 활용하여 치매 사전 진단을 준실시간 판별하는 서비스가 제공되어야 하며, 이를 위한 학습 데이터를 구축하였음.

     

    □  노인 정신건강 영상 데이터 가공 주요 요소

    • 본 사업에서 데이터는 동영상 분류 이외에 Label Studio 저작도구를 통해서 이루어지며, 오토라벨링 기법을 사용하지 않고 음성데이터의 구간 라벨링, 오각형 이미지의 이미지 분류, 그리고 얼굴 표현 영상 데이터에서 구간 라벨링을 수행함

    노인 정신건강 영상 데이터 가공 주요 요소
    데이터명 어노테이션 방법 저작도구 오토라벨링 여부 오토라벨링 기법
    음성데이터 구간 라벨링 Label Studio X  
    이미지 분류
    오각형 이미지 구간 라벨링  Label Studio X  
    이미지 분류
    얼굴표현 영상 데이터 구간 라벨링  Label Studio X  
    동영상 분류 자체제작 O Unidocs Faceer

     

    □ 데이터 정보 및 항목

    1) 음성 데이터 
     노인 정신건강 영상 데이터를 토대로, MMSE 질문에 대한 답변의 음성 특성 분석을 위한 응답 구간을 라벨링 하여, 음성 특성을 분석하고 라벨링 하도록 한다.

    2) 오각형 데이터 
     피험자에게 겹친 오각형 형상을 그리게 하여, png 파일을 추출하여, 그린 결과에 대한 이상 여부를 분석하고 라벨링 하도록 한다.

    3) 얼굴표현 데이터
     진단 검사 중 임상 전문가가 특이한 표정을 기록하여 라벨링하고, 별도 제작한 프로그램을 활용하여 face landmark 분석을 시행, 인공 진단 학습 데이터로 사용할 수 있도록 한다.

     

    □ 데이터구성

    • 음성 데이터 (voice)

    음성 데이터 (voice)
    Key Description Type Child Type
    dataset 원천데이터 JsonArray  
    { 파일 정보 JsonObject  
    id 파일 id String  
    name 데이터셋 이름 String  
    src_path 원천데이터 경로 String  
    label_path 라벨링데이터 경로 String  
    }      
    meta 메타데이터 JsonArray  
    { 환자 메타 정보 JsonObject  
    patient 환자 정보 JsonArray  
    { 환자 정보 JsonObject  
    id 환자 id String  
    gender 환자 성별 Int  
    age 환자 나이 Int  
    diagnosis 환자 진단코드 Int  
    }      
    }      

     

    • 오각형 데이터 (pentagon)

    오각형 데이터
    Key Description Type Child Type
    dataset 원천데이터 JsonArray  
    { 파일 정보 JsonObject  
    id 파일 id String  
    name 데이터셋 이름 String  
    src_path 원천데이터 경로 String  
    label_path 라벨링데이터 경로 String  
    }      
    meta 메타데이터 JsonArray  
    { 환자 메타 정보 JsonObject  
    patient 환자 정보 JsonArray  
    { 환자 정보 JsonObject  
    id 환자 id String  
    gender 환자 성별 Int  
    age 환자 나이 Int  
    diagnosis 환자 진단코드 Int  
    }      
    }      

     

    • 얼굴표현 데이터 (face)

    얼굴표현 데이터 (face)
    Key Description Type Child Type
    dataset 원천데이터 JsonArray  
    { 파일 정보 JsonObject  
    id 파일 id String  
    name 데이터셋 이름 String  
    src_path 원천데이터 경로 String  
    label_path 라벨링데이터 경로 String  
    }      
    meta 메타데이터 JsonArray  
    { 환자 메타 정보 JsonObject  
    patient 환자 정보 JsonArray  
    { 환자 정보 JsonObject  
    id 환자 id String  
    gender 환자 성별 Int  
    age 환자 나이 Int  
    diagnosis 환자 진단코드 Int  
    }      
    v_file 비디오 JsonArray  
    {   JsonObject  
    format 영상파일포맷 String  
    fps 영상 초당 프레임 수 Int  
    width 영상 넓이 Int  
    height 영상 높이 Int  
    }      
    }      


     

    2. 어노테이션 방식과 포맷 설명

     

    □ 어노테이션 방식

    어노테이션 방식
    데이터명 가공 타입 원천데이터 수량
    음성 데이터 • (구간 라벨링) 영상에서 추출한 음성파일에 질의 별 응답 각각에 대해 시작/끝점을 라벨링 음성파일 특징 이미지
    1140명 x 26개
    29,640개
    • (이미지 분류) 음성정보에서 특징을 추출한 후 피검자에 대해 통합된 이미지를 생성한 후 분류
    • 25개 응답에 대한 각 mfcc 이미지 및 AI모델 학습용인 누적 mfcc 이미지
    오각형 이미지 • (이미지 분류) 오각형 그리기 구간에서 마지막에 보여주는 오각형 이미지에서 가장 선명한 5장의 이미지를 선정한 후 분류 1140명 x 5개
    5,700 장 이상
    얼굴표현 영상 데이터 • (구간 라벨링) 동영상에서 정상/이상 얼굴표현이 존재하는 구간 라벨링  4,562개 영상
    • (동영상 분류) 정상/이상 얼굴표현이 존재하는 구간을 별도 영상클립으로 추출한 후 분류
    • (키포인트 라벨링) 추출된 동영상클립에서 모든 프레임에 존재하는 얼굴에 대한 14 landmark를 자동으로 추출

     

    □ 어노테이션 포맷
    • 음성 데이터 (voice)

    음성 데이터 (voice)
    구분 속성명 타입 필수여부 설명 범위 비고
    1       dataset obj Y 데이터셋 객체    
    1 1     dataset.id str Y 데이터셋 식별자    
    1 2     dataset.name str Y 데이터셋 이름    
    1 3     dataset.src_path str Y 데이터셋 폴더 위치    
    1 4     dataset.label_path str Y 데이터셋 레이블 폴더 위치    
    2       meta obj Y 메타데이터 객체    
    2 1     meta.patient obj Y 피검자 메타정보    
    2 1 1   meta.patient.id str Y 아이디    
    2 1 2   meta.patient.gender int Y 성별 0, 1 0:여성, 1:남성
    2 1 3   meta.patient.age int Y 나이 1~4 번호 유형
    1 50대
    2 60대
    3 70대
    4 80대 이상
    2 1 4   meta.patient.diagnosis int Y 인지기능상태 0, 1 번호 유형
    0 정상인지
    1 비정상인지
    (경도인지+치매)
    2 2     meta.wfs obj Y 음성 파일 메타정보    
    2 2 1   meta.wfs.root_path str Y 음성파일 루트경로    
    2 2 2   meta.wfs.format  str Y 음성파일 포맷    
    2 2 3   meta.wfs.fnames list Y 음성파일명 리스트    
    2 2 3 1 meta.wfs.fnames.no str Y 응답번호    
    2 2 3 2 meta.wfs.fnames.name str Y 음성 파일명    
    2 3     meta.mfs obj Y mfcc 파일 메타정보    
    2 3 1   meta.mfs.root_path  str Y mfcc 파일 루트경로    
    2 3 2   meta.mfs.format  str Y mfcc 파일 포맷    
    2 3 3   meta.mfs.fnames arr Y mfcc 파일명 리스트    
    2 3 3 1 meta.mfs.fnames.no str Y 응답번호    
    2 3 3 2 meta.mfs.fnames.name str Y mfcc 파일명     
    3       labels obj Y 라벨 객체    
    3 1     labels.qas arr Y 통합 mfcc 파일 정보    
    3 1 1   labels.qas.id str Y 통합 mfcc 파일 id    
    3 1 2   labels.qas.name str Y 통합 mfcc 파일명    

     

    • 오각형 데이터 (pentagon)

    오각형 데이터 (pentagon)
    구분 속성명 타입 필수여부 설명 범위 비고
    1       dataset obj Y 데이터셋 객체    
    1 1     dataset.id str Y 데이터셋 식별자    
    1 2     dataset.name str Y 데이터셋 이름    
    1 3     dataset.src_path str Y 데이터셋 폴더 위치    
    1 4     dataset.label_path str Y 데이터셋 레이블 폴더 위치    
    2       meta obj Y 메타데이터 객체    
    2 1     meta.patient obj Y 피검자 메타정보    
    2 1 1   meta.patient.id str Y 아이디    
    2 1 2   meta.patient.gender int Y 성별 0, 1 0:여성, 1:남성
    2 1 3   meta.patient.age int Y 나이 1~4 번호 유형
    1 50대
    2 60대
    3 70대
    4 80대 이상
    2 1 4   meta.patient.diagnosis int Y 인지기능상태 0, 1 번호 유형
    0 정상인지
    1 비정상인지
    (경도인지+치매)
    3       labels obj Y 라벨 객체    
    3 1     labels.ptgs obj Y 오각형 이미지 통합 정보     
    3 1 1   labels.ptgs.id str Y 오각형이미지 id    
    3 1 2   labels.ptgs.ptg_status int Y 오각형 이미지 이상여부 1, 2 1:정상, 2:비정상
    3 1 3   labels.ptgs.files arr Y 오각형 이미지 리스트    
    3 1 3 1 labels.ptgs.files.id str Y 오각형 파일 id    
    3 1 3 2 labels.ptgs.files.name str Y 오각형 파일 이름    

     

    • 얼굴 데이터 (face)

    얼굴 데이터 (face)
    구분 속성명 타입 필수여부 설명 범위 비고
    1               dataset obj Y 데이터셋 객체    
    1 1             dataset.id str Y 데이터셋 식별자    
    1 2             dataset.name str Y 데이터셋 이름    
    1 3             dataset.src_path str Y 데이터셋 폴더 위치    
    1 4             dataset.label_path str Y 데이터셋 레이블 폴더 위치    
    2               meta obj Y 메타데이터 객체    
    2 1             meta.patient obj Y 피검자 메타정보    
    2 1 1           meta.patient.id str Y 아이디    
    2 1 2           meta.patient.gender int Y 성별 0, 1 0:여성, 1:남성
    2 1 3           meta.patient.age int Y 나이 1~4 번호 유형
    1 50대
    2 60대
    3 70대
    4 80대 이상
    2 1 4           meta.patient.diagnosis int Y 인지기능상태 0, 1 번호 유형
    0 정상인지
    1 비정상인지
    (경도인지+치매)
    2 2             meta.v_file obj Y 동영상 파일 메타정보    
    2 2 1           meta.v_file.format str Y 파일 포맷    
    2 2 2           meta.v_file.fps int Y 초당 프레임 재생속도    
    2 2 3           meta.v_file.width int Y 영상 넓이    
    2 2 4           meta.v_file.height int Y 영상 높이    
    3               labels obj Y 라벨 객체    
    3 1             labels.fes obj Y 얼굴표현 통합 라벨링 정보    
    3 1 1           labels.fes.detail obj Y 얼굴표현 상세 라벨링 정보    
    3 1 1 1         labels.fes.detail.face_index obj Y 얼굴표현 개수 정보    
    3 1 1 1 1       labels.fes.detail.face_index.Total_num int Y 얼굴표현 총 개수    
    3 1 1 1 2       labels.fes.detail.face_index.Tilt_num int Y 얼굴 기울기 개수    
    3 1 1 1 3       labels.fes.detail.face_index.Eye_num int Y 눈 깜박임, 눈 떨림 개수    
    3 1 1 1 4       labels.fes.detail.face_index.Lip_num int Y 입술 떨림 개수    
    3 1 1 2         labels.fes.detail.id obj Y 얼굴표현 등의 id    
    3 1 1 2 1       labels.fes.detail.id.Tilt obj N 얼굴 기울기 통합 정보    
    3 1 1 2 1 1     labels.fes.detail.id.Tilt.type int N 얼굴 기울기 표현 정보 3, 4 번호 유형
    1 눈깜박임
    정상
    2 눈깜박임
    이상
    3 머리 기울기
    정상 
    4 머리 기울기
    이상 
    5 입술 떨림
    정상
    6 입술 떨림
    이상
    3 1 1 2 1 2     labels.fes.detail.id.Tilt.number arr N 얼굴 기울기 상세 정보    
    3 1 1 2 1 2 1   labels.fes.detail.id.Tilt.number_id int N 얼굴 기울기 라벨    
    3 1 1 2 1 2 2   labels.fes.detail.id.Tilt.number.trim_v_name str N 파일 이름    
    3 1 1 2 1 2 3   labels.fes.detail.id.Tilt.number.trim_start int N 얼굴 기울기 시작(초)    
    3 1 1 2 1 2 4   labels.fes.detail.id.Tilt.number.trim_end int N 얼굴 기울기 종료(초)    
    3 1 1 2 1 2 5   labels.fes.detail.id.Tilt.number.keypoints list N 해당구간 내 프레임단위 keypoints 정보리스트    
    3 1 1 2 1 2 5 1 labels.fes.detail.id.Tilt.number.keypoints.id int N 해당구간 내 프레임 id    
    3 1 1 2 1 2 5 2 labels.fes.detail.id.Tilt.number.keypoints.xys arr N 해당구간 프레임 내 기울기 landmark 좌표    
    3 1 1 2 2       labels.fes.detail.id.Eye obj N 눈깜박임 통합 정보    
    3 1 1 2 2 1     labels.fes.detail.id.Eye.type int N 눈깜박임 표현 정보 1, 2 번호 유형
    1 눈깜박임
    정상
    2 눈깜박임
    이상
    3 머리 기울기
    정상 
    4 머리 기울기
    이상 
    5 입술 떨림
    정상
    6 입술 떨림
    이상
    3 1 1 2 2 2     labels.fes.detail.id.Eye.number arr N 눈깜박임 상세 정보    
    3 1 1 2 2 2 1   labels.fes.detail.id.Eye.number_id int N 눈깜박임 라벨    
    3 1 1 2 2 2 2   labels.fes.detail.id.Eye.number.trim_v_name str N 파일 이름    
    3 1 1 2 2 2 3   labels.fes.detail.id.Eye.number.trim_start int N 눈깜박임 시작(초)    
    3 1 1 2 2 2 4   labels.fes.detail.id.Eye.number.trim_end int N 눈깜박임 종료(초)    
    3 1 1 2 2 2 5   labels.fes.detail.id.Eye.number.keypoints list N 해당구간 내 프레임단위 keypoints 정보리스트    
    3 1 1 2 2 2 5 1 labels.fes.detail.id.Eye.number.keypoints.id int N 해당구간 내 프레임 id    
    3 1 1 2 2 2 5 2 labels.fes.detail.id.Eye.number.keypoints.xys arr N 해당구간 프레임 내 눈깜박임 landmark 좌표    
    3 1 1 2 3       labels.fes.detail.id.Lip obj N 입술 떨림 통합 정보    
    3 1 1 2 3 1     labels.fes.detail.id.Lip.type int N 입술 떨림 표현 정보 5, 6 번호 유형
    1 눈깜박임
    정상
    2 눈깜박임
    이상
    3 머리 기울기
    정상 
    4 머리 기울기
    이상 
    5 입술 떨림
    정상
    6 입술 떨림
    이상
    3 1 1 2 3 2     labels.fes.detail.id.Lip.number arr N 입술 떨림 상세 정보    
    3 1 1 2 3 2 1   labels.fes.detail.id.Lip.number_id int N 입술 떨림 라벨    
    3 1 1 2 3 2 2   labels.fes.detail.id.Lip.number.trim_v_name str N 파일 이름    
    3 1 1 2 3 2 3   labels.fes.detail.id.Lip.number.trim_start int N 입술 떨림 시작(초)    
    3 1 1 2 3 2 4   labels.fes.detail.id.Lip.number.trim_end int N 입술 떨림 종료(초)    
    3 1 1 2 3 2 5   labels.fes.detail.id.Lip.number.keypoints list N 해당구간 내 프레임단위 keypoints 정보리스트    
    3 1 1 2 3 2 5 1 labels.fes.detail.id.Lip.number.keypoints.id int N 해당구간 내 프레임 id    
    3 1 1 2 3 2 5 2 labels.fes.detail.id.Lip.number.keypoints.xys arr N 해당구간 프레임 내 입술 떨림 landmark 좌표    

     

    □ 실제 예시

    • 음성 데이터 (voice)

    실제예시 음성데이터

     

    • 오각형 데이터 (pentagon)

    실제예시 오각형데이터

     

    • 얼굴표현 데이터 (face)

    실제예시 얼굴표현데이터

  • 데이터셋 구축 담당자

    수행기관(주관) : 충남대학교병원
    수행기관(주관)
    책임자명 전화번호 대표이메일 담당업무
    양희원 010-7559-5673 yhw0140@hanmail.net 임상정보, 데이터 수집, 원시데이터 구축 데이터 구축 및 품질 관련 총괄
    수행기관(참여)
    수행기관(참여)
    기관명 담당업무
    강원대학교병원 데이터 구축
    건국대 충주병원 데이터 구축
    제주대학교병원 데이터 구축
    동국대학교경주병원 데이터 구축
    유니닥스 AI 모델 개발 및 유효성 검사
    데이터 관련 문의처
    데이터 관련 문의처
    담당자명 전화번호 이메일
    양희원 010-7559-5673 yhw0140@hanmail.net
    조민우 010-3915-6666 binu6666@naver.com
    AI모델 관련 문의처
    AI모델 관련 문의처
    담당자명 전화번호 이메일
    유석 010-4132-3941 tobewiseys@unidocs.co.kr
    조민우 010-3915-6666 binu6666@naver.com
    저작도구 관련 문의처
    저작도구 관련 문의처
    담당자명 전화번호 이메일
    고지연 010-9808-2611 kojiyuon@gmail.com
    최승재 010-5201-6192 khuce15@naver.com
보건의료 데이터 개방 안내

보건의료 데이터는 온라인 및 오프라인 안심존을 통해 개방됩니다.

안심존이란 안심존 이용메뉴얼 안심존 이용신청 데이터 열람신청
  • 인터넷과 물리적으로 분리된 온라인·오프라인 공간으로 의료 데이터를 포함하여 보안 조치가 요구되는 데이터를 다운로드 없이 접근하고 분석 가능
    * 온라인 안심존 : 보안이 보장된 온라인 네트워크를 통해 집, 연구실, 사무실 등 어디서나 접속하여 데이터에 접근하고 분석
    * 오프라인 안심존 : 추가적인 보안이 필요한 데이터를 대상으로 지정된 물리적 공간에서만 접속하여 데이터에 접근하고 분석

    1. AI 허브 접속
      신청자
    2. 안심존
      사용신청
      신청자신청서류 제출*
    3. 심사구축기관
    4. 승인구축기관
    5. 데이터 분석 활용신청자
    6. 분석모델반출신청자
  • 1. 기관생명윤리위원회(IRB) 심의 결과 통지서 [IRB 알아보기] [공용IRB 심의신청 가이드라인]
    2. 기관생명윤리위원회(IRB) 승인된 연구계획서
    3. 신청자 소속 증빙 서류 (재직증명서, 재학증명서, 근로계약서 등 택1)
    4. 안심존 이용 신청서 [다운로드]
    5. 보안서약서 [다운로드]
    ※ 상기 신청서 및 첨부 서류를 완비한 후 신청을 진행하셔야 정상적으로 절차가 이루어집니다.

  • 신청 및 이용관련 문의는 safezone1@aihub.kr 또는 02-525-7708, 7709로 문의

데이터셋 다운로드 승인이 완료 된 후 API 다운로드 서비스를 이용하실 수 있습니다.

API 다운로드 파일은 분할 압축되어 다운로드 됩니다. 분할 압축 해제를 위해서는 분할 압축 파일들의 병합이 필요하며 리눅스 명령어 사용이 필요합니다.

리눅스 OS 계열에서 다운로드 받으시길 권장하며 윈도우에서 파일 다운로드 시 wsl(리눅스용 윈도우 하위 시스템) 설치가 필요합니다.

※ 파일 병합 리눅스 명령어

find "폴더경로" -name "파일명.zip.part*" -print0 | sort -zt'.' -k2V | xargs -0 cat > "파일명.zip"

- 해당 명령어 실행 시, 실행 경로 위치에 병합 압축 파일이 생성됩니다.

- 병합된 파일 용량이 0일 경우, 제대로 병합이 되지 않은 상태이니 "폴더경로"가 제대로 입력되었는지 확인 부탁드립니다.

※ 데이터셋 소개 페이지에서 다운로드 버튼 클릭하여 승인이 필요합니다.

오프라인 데이터 이용 안내

본 데이터는 K-ICT 빅데이터센터에서도 이용하실 수 있습니다.

K-ICT 빅데이터센터는 데이터 안심구역으로 지정되어
다양한 데이터(미개방 데이터 포함)를 분석할 수 있는 오프라인 분석공간을 제공하고 있습니다.

데이터 안심구역 이용절차 및 신청은 K-ICT빅데이터센터 홈페이지를 참고하시기 바랍니다.