콘텐츠로 건너뛰기 메뉴로 건너뛰기 푸터로 건너뛰기
데이터를 불러오고 있습니다
데이터를 저장하고 있습니다
#치매 고위험군 # 라이프로그 # 한국형 문서요약 데이터셋

치매 고위험군 웨어러블 라이프로그

치매 고위험군 웨어러블 라이프로그
  • 분야헬스케어
  • 유형 센서 , 텍스트
구축년도 : 2020 갱신년월 : 2021-06 조회수 : 18,427 다운로드 : 1,055 용량 :
샘플 데이터 ?

샘플데이터는 데이터의 이해를 돕기 위해 별도로 가공하여 제공하는 정보로써 원본 데이터와 차이가 있을 수 있으며,
데이터에 따라서 민감한 정보는 일부 마스킹(*) 처리가 되어 있을 수 있습니다.

※ 내국인만 데이터 신청이 가능합니다.

  • 데이터 변경이력

    데이터 변경이력
    버전 일자 변경내용 비고
    1.0 2021-06-30 데이터 최초 개방

    데이터 히스토리

    데이터 히스토리
    일자 변경내용 비고
    2023-01-09 자동승인 데이터로 변경 (기존 안심존)

    소개

    (광주광역시) 헬스케어 웨어러블 기반 치매 고위험군 병리진단으로 정의된 치매진행 단계별 라이프로그 학습용 데이터

    구축목적

    치매조기진단 예측 및 발병의 예방과 선제적 관리를 위한 AI 기술개발을 위하여 검증된 학습용 데이터를 구축하고자 함
  • 구축 내용 및 제공 데이터량

    • 라이프로그 데이터 (수면정보) - 15,000건 수집
    • 라이프로그 데이터 (걸음거리정보) - 15,000건 수집
    • 인지기능 데이터 (MMSE) - 9,000건 수집
    • 치매 고위험군 라벨링 – 300건
       
      구축 내용 및 제공 데이터량 표
      데이터 종류 데이터 형태 목표수량
      라이프로그 (수면정보) 텍스트 (.CSV) 15,000건
      라이프로그 (걸음거리 정보) 텍스트 (.CSV) 15,000건
      인지기능 (MMSE) 텍스트 (.CSV) 9,000건
      고위험군 라벨링 텍스트 (.CSV) 300건
      총계 39,300건
  • AI 모델 상세 설명서 다운로드

    AI 모델 다운로드
  • 데이터 성능 점수

    측정값 (%)
    기준값 (%)

    데이터 성능 지표

    데이터 성능 지표
    번호 측정항목 AI TASK 학습모델 지표명 기준값 점수 측정값 점수
    1 치매 질환 분류 성능 (정상/이상) Text Classification Hierarchical Bi-directional LSTM Accuracy 80 % 80.85 %
    2 치매 질환 분류 성능 (정상/이상) Text Classification Hierarchical Bi-directional LSTM AUC-ROC 0.85 단위없음 0.9 단위없음

    ※ 데이터 성능 지표가 여러 개일 경우 각 항목을 클릭하면 해당 지표의 값이 그래프에 표기됩니다.

    ※ AI모델 평가 지표에 따라 측정값의 범위, 판단 기준이 달라질 수 있습니다. (ex. 오류율의 경우, 낮을수록 좋은 성능을 내는 것으로 평가됩니다)

  • 설명서 및 활용가이드 다운로드

    데이터 설명서 다운로드 구축활용가이드 다운로드

    데이터 변경이력

    데이터 변경 이력
    버전 일자 변경내용 비고
    1.0 2021.06.30 데이터 최초 개방  

    구축 목적

    • 치매조기진단 예측 및 발병의 예방과 선제적 관리를 위한 AI 기술개발을 위하여 검증된 학습용 데이터를 구축하고자 함

    활용 분야

    • 웨어러블 디바이스 기계 활용한 일상생활의 라이프로그 데이터를 기반으로 치매확률을 예측 및 관리할 수 있는 AI 치매예측 시스템 개발

    소개

    • 헬스케어 웨어러블 디바이스를 통한 원천 데이터로부터 정제 및 라벨링을 통하여 치매 진행 단계별 라이프로그 빅데이터 구축 및 인공지능 치매조기 예측모델을 활용하여 치매 걸릴 확률정보를 제공함.
       

    치매 고위험군 웨어러블 라이프로그-소개 이미지

    구축 내용 및 제공 데이터량

    • 라이프로그 데이터 (수면정보) - 15,000건 수집
    • 라이프로그 데이터 (걸음거리정보) - 15,000건 수집
    • 인지기능 데이터 (MMSE) - 9,000건 수집
    • 치매 고위험군 라벨링 – 300건
       
      구축 내용 및 제공 데이터량 표
      데이터 종류 데이터 형태 목표수량
      라이프로그 (수면정보) 텍스트 (.CSV) 15,000건
      라이프로그 (걸음거리 정보) 텍스트 (.CSV) 15,000건
      인지기능 (MMSE) 텍스트 (.CSV) 9,000건
      고위험군 라벨링 텍스트 (.CSV) 300건
      총계 39,300건

    대표도면

    • 라이프로그 데이터를 분석하여 치매 걸릴 확률에 대한 정보 제공
      1) 웨어러블 링 홈페이지에서 제공하는 JSON 파일 업로드
      2) DB 전장 및 데이터 전처리 (자동)
      3) AI 분석 처리
      4) 분석결과 값 제공 (치매확률 제공)
       

    치매 고위험군 웨어러블 라이프로그-대표도면

    필요성

    • 고령화 사회로의 진입 및 치매 발병률 증가에 따른 의료비 부담 증가로 인해 치매 환자의 조기진단과 치료가 중요한 과제로 부상
    • 치매는 초기에 진단이 이루어지지 않으면 발병 후 치료 및 회복이 어려워 예방과 조기 검진을 통한 선제적 관리가 유일한 대한임.
    • 치매조기진단 예측 및 발병의 예방과 선제적 관리를 위한 AI 기술개을 위하여 검증된 학습용 데이터를 구축하고자 함

    데이터 구조

    • 어노테이션 포맷
      - 라이프로그 데이터
      어노테이션 포맷 표
      NO 항목 타입
      영문명 한글명
      1 email 이메일 varchar(200)
      2 date 요약 날짜 varchar(10)
      3 check 착용 여부 체크 varchar(20)
      4 nonwear 미착용 시간 체크 varchar(20)
      5 activity_average_met 하루간 평균 MET varchar(10)
      6 activity_cal_active 하루간 활동 칼로리 varchar(10)
      7 activity_cal_total 하루간 총 사용 칼로리 varchar(10)
      8 activity_class_5min 하루간 5분당 활동 로그 BLOB
      9 activity_daily_movement 매일 움직인 거리 varchar(10)
      10 activity_day_end 활동 종료 시간 varchar(30)
      11 activity_day_start 활동 시작 시간 varchar(30)
      12 activity_high 고강도 활동 시간 varchar(10)
      13 activity_inactive 비활동 시간 varchar(10)
      14 activity_inactivity_alerts 비활동 알람 횟수 varchar(10)
      15 active_low 저강도 활동 시간 varchar(10)
      16 activity_medium 중강도 활동 시간 varchar(10)
      17 activity_met_1min 하루간 1분 당 MET 로그 BLOB
      18 activity_met_min_high 하루간 고강도 활동 MET varchar(10)
      19 activity_met_min_inactive 하루간 비활동 MET varchar(10)
      20 activity_met_min_low 하루간 저강도 활동 MET varchar(10)
      21 activity_met_min_medium 하루간 중강도 활동 MET varchar(10)
      22 activity_non_wear 미착용 시간 varchar(10)
      23 activity_rest 휴식 시간 varchar(10)
      24 activity_score 활동 점수 varchar(10)
      25 activity_score_meet_daily_targets 활동 목표달성 점수 varchar(10)
      26 activity_score_move_every_hour 매 시간 당 활동유지 점수 varchar(10)
      27 activity_score_recovery_time 회복시간 점수 varchar(10)
      28 activity_score_stay_active 활동 유지 점수 varchar(10)
      29 activity_score_training_frequency 운동 빈도 점수 varchar(10)
      30 activity_score_training_volume 운동 빈도 점수 varchar(10)
      31 activity_steps 매일 걸음 수 varchar(10)
      32 activity_total 활동 총 시간(분) varchar(10)
      33 sleep_awake 깬 시간 varchar(10)
      34 sleep_bedtime_end 잠 종료시간 varchar(30)
      35 sleep_bedtime_start 잠 시작시간 varchar(30)
      36 sleep_breatj_average 분단 평균 호흡 수 varchar(10)
      37 sleep_deep 깊은 수면 시간 varchar(10)
      38 sleep_duration 잠 시간 varchar(10)
      39 sleep_efficiency 수면 효율 varchar(10)
      40 sleep_hr_5min 5분 당 심박동 로그 BLOB
      41 sleep_hr_average 분당 평균 심박동 수 varchar(10)
      42 sleep_hr_lowest 분당 낮은 심박동 수 varchar(10)
      43 sleep_hypnogram_5min 수면 상태 로그 BLOB
      44 sleep_is_longest 본 수면 여부 varchar(10)
      45 sleep_light 가벼운 수면 시간 varchar(10)
      46 sleep_midpoint_at_delta 수면 중간점 시간 델타 varchar(10)
      47 sleep_midpoint_time 수면 중간점 시간 varchar(10)
      48 sleep_onset_latency 수면 잠복 시간 varchar(10)
      49 sleep_period_id 수면 식별 아이디 varchar(10)
      50 sleep_rem 램수면 시간 varchar(10)
      51 sleep_restless 뒤척임 비율 varchar(10)
      52 sleep_rmssd 평균 심박동변동 varchar(10)
      53 sleep_rmssd_5min 5분 당 심박동변동 로그 BLOB
      54 sleep_score 수면 종합 점수 varchar(10)
      55 sleep_score_alignment 수면 시기 점수 varchar(10)
      56 sleep_score_deep 깊은 수면 점수 varchar(10)
      57 sleep_score_disturbances 수면 방해 점수 varchar(10)
      58 sleep_score_efficiency 수면 효율 점수 varchar(10)
      59 sleep_score_latency 수면 잠복 점수 varchar(10)
      60 sleep_score_rem 램수면 점수 varchar(10)
      61 sleep_score_total 수면 시간 기여 점수 varchar(10)
      62 sleep_temperature_delta 피부 온도 편차 varchar(10)
      63 sleep_temperature_deviation 피부 온도 편차 varchar(10)
      64 sleep_temperature_trend_deviation 피부 온도 경향 편차 varchar(10)
      65 timezone 시간 장소 정보 varchar(10)
      66 sleep_total 수면 시간 varchar(10)

     

    • - 인지기능 데이터 (MMSE)
       
      인지기능 데이터
      No 항목 Comment Type
      1 SAMPLE_EMAIL 연구대상자 이메일 VARCHAR(200)
      2 DIAG_SEQ 차수 INT(3)
      3 DIAG_NIM 진단명 VARCHAR(30)
      4 DOCTOR_NM 진단자 VARCHAR(50)
      5 MMSE_NUM 횟수 INT
      6 MMSE_KIND 친절도 VARCHAR(10)
      7 Q01 올해가 몇 년 이지요? VARCHAR(1)
      8 Q02 지금은 어떤 계절이지요? VARCHAR(1)
      9 Q03 오늘은 며칠입니까? VARCHAR(1)
      10 Q04 오늘은 무슨 요일인가요? VARCHAR(1)
      11 Q05 오늘이 몇 월입니까? VARCHAR(1)
      12 Q06 지금 우리가 있는 이곳은 어느 나라입니까? VARCHAR(1)
      13 Q07 우리가 지금 무슨 시(도)에 있습니까? VARCHAR(1)
      14 Q08 지금 우리가 있는 여기는 어디입니까?
      (지금 계시는 이곳을 무엇이라고 부릅니까?)
      VARCHAR(1)
      15 Q09 지금 우리가 있는 이곳은 몇 층입니까? VARCHAR(1)
      16 Q10 여기에서는 어떤 일을 하나요? VARCHAR(1)
      17 Q11_1 자, 잘 들으세요. 제가 지금부터 물건 이름 세 개를 불러드리겠습니다.
      세 가지를 다 들으시고 나서 그대로 외워서 저에게 말씀해주세요.
      준비되셨습니까?
      자, 제가 무어라고 했지요? 말씀해보세요.
      지금 불러드린 그 물건 이름들을 잘 기억하고 계세요.
      제가 조금 있다가 다시 외워보시라고 할겁니다. 비행기(1초감 멈춤)
      VARCHAR(1)
      18 Q11_2 연필(1초간 멈춤) VARCHAR(1)
      19 Q11_3 소나무 VARCHAR(1)
      20 Q12_1 100에서 7을 빼면 얼마가 됩니까? VARCHAR(2)
      21 Q12_2 거기에서 7을 빼면 얼마가 됩니까? VARCHAR(2)
      22 Q12_3 거기에서 7을 빼면 얼마가 됩니까? VARCHAR(2)
      23 Q12_4 거기에서 7을 빼면 얼마나 됩니까? VARCHAR(2)
      24 Q12_5 거기에서 7을 빼면 얼마가 됩니까? VARCHAR(2)
      25 Q12_TOTAL   INT
      26 Q13_1 좀 전에 제가 외우고 계시라고 했던 물건 이름 세가지 기억나세요?
      비행기
      VARCHAR(1)
      27 Q13_2 연필 VARCHAR(1)
      28 Q13_3 소나무 VARCHAR(1)
      29 Q14_1 이것이 무엇입니까?(시계) VARCHAR(1)
      30 Q14_2 이것이 무엇입니까? VARCHAR(1)
      31 Q15 이번에는 제가 하는 말을 그대로 따라서 말씀하시면 됩니다.
      (백문일 불여일견)
      VARCHAR(1)
      32 Q16_1 종이 뒤집기 VARCHAR(1)
      34 Q16_2 반으로 접기 VARCHAR(1)
      35 Q16_3 되돌려 주기 VARCHAR(1)
      35 Q17 이 그림과 똑같이 여기에 그려주세요. (별지의 오각형 그림) VARCHAR(1)
      36 Q18 지금 보여 드리는 이 문장을 큰 소리로 읽으시고 쓰인 대로 해보세요. VARCHAR(1)
      37 Q19 여기에 오늘 날씨(또는 기분)에 대해서 문장으로 써보세요. VARCHAR(1)
      38 TOTAL 총점 INT
      39 TEST_DAY 검사일 DATETIME
      40 FLAG FLAG VARCHAR(1)
      41 INSERT_DATE 입력일 DATETIME
      42 INSERT_USERID 입력한 ID_number INT
      43 UPDATE_DATE 입데이트일 DATETIME
      44 UPDATE_USERID 업데이트한 ID_number INT
  • 데이터셋 구축 담당자

    수행기관(주관) : 에코인사이트글로벌
    수행기관(주관)
    책임자명 전화번호 대표이메일 담당업무
    김일교 02-6412-2403 hun.oh@ecoinsight.co.kr · 데이터 구축 총괄. DB설계 및 구축. 데이터 정제
    수행기관(참여)
    수행기관(참여)
    기관명 담당업무
    조선대 산학협력단 · 데이터 수집. 품질검증
    (주)로완 · 데이터 수집 및 정제. 품질검증
    광주과학기술원 · 데이터 가공(전처리). AI 모델 개발
    (주)비온시이노베이터 · AI 활용 응용서비스 개발
    데이터 관련 문의처
    데이터 관련 문의처
    담당자명 전화번호 이메일
    오훈택(에코인사이트글로벌) 02-6412-2403 hun.oh@ecoinsight.co.kr
보건의료 데이터 개방 안내

보건의료 데이터는 온라인 및 오프라인 안심존을 통해 개방됩니다.

안심존이란 안심존 이용메뉴얼 안심존 이용신청
  • 인터넷과 물리적으로 분리된 온라인·오프라인 공간으로 의료 데이터를 포함하여 보안 조치가 요구되는 데이터를 다운로드 없이 접근하고 분석 가능
    * 온라인 안심존 : 보안이 보장된 온라인 네트워크를 통해 집, 연구실, 사무실 등 어디서나 접속하여 데이터에 접근하고 분석
    * 오프라인 안심존 : 추가적인 보안이 필요한 데이터를 대상으로 지정된 물리적 공간에서만 접속하여 데이터에 접근하고 분석

    1. AI 허브 접속
      신청자
    2. 안심존
      사용신청
      신청자신청서류 제출*
    3. 심사구축기관
    4. 승인구축기관
    5. 데이터 분석 활용신청자
    6. 분석모델반출신청자
  • 1. 기관생명윤리위원회(IRB) 심의 결과 통지서 [IRB 알아보기] [공용IRB 심의신청 가이드라인]
    2. 기관생명윤리위원회(IRB) 승인된 연구계획서
    3. 신청자 소속 증빙 서류 (재직증명서, 재학증명서, 근로계약서 등 택1)
    4. 안심존 이용 신청서 [다운로드]
    5. 보안서약서 [다운로드]
    ※ 상기 신청서 및 첨부 서류를 완비한 후 신청을 진행하셔야 정상적으로 절차가 이루어집니다.

  • 신청 및 이용관련 문의는 safezone1@aihub.kr 또는 02-525-7708, 7709로 문의

데이터셋 다운로드 승인이 완료 된 후 API 다운로드 서비스를 이용하실 수 있습니다.

API 다운로드 파일은 분할 압축되어 다운로드 됩니다. 분할 압축 해제를 위해서는 분할 압축 파일들의 병합이 필요하며 리눅스 명령어 사용이 필요합니다.

리눅스 OS 계열에서 다운로드 받으시길 권장하며 윈도우에서 파일 다운로드 시 wsl(리눅스용 윈도우 하위 시스템) 설치가 필요합니다.

※ 파일 병합 리눅스 명령어

find "폴더경로" -name "파일명.zip.part*" -print0 | sort -zt'.' -k2V | xargs -0 cat > "파일명.zip"

- 해당 명령어 실행 시, 실행 경로 위치에 병합 압축 파일이 생성됩니다.

- 병합된 파일 용량이 0일 경우, 제대로 병합이 되지 않은 상태이니 "폴더경로"가 제대로 입력되었는지 확인 부탁드립니다.

※ 데이터셋 소개 페이지에서 다운로드 버튼 클릭하여 승인이 필요합니다.