BETA 독거노인 돌봄용 위험감지 데이터
- 분야영상이미지
- 유형 이미지 , 텍스트 , 센서
※ 24년 신규 개방되는 데이터로, 데이터 활용성 검토, 이용자 관점의 개선의견 수렴 등을 통해 수정/보완될 수 있으며 최종데이터, 샘플데이터, 산출물 등은 변경될 수 있습니다
-
데이터 변경이력
데이터 변경이력 버전 일자 변경내용 비고 1.0 2024-12-20 데이터 개방 Beta Version 소개
온디바이스AI 기반의 독거노인 돌봄용 위험감지 서비스에 활용되기 위한 다양한 독거노인의 생활환경에서 생산되는 환경측정 및 동작 감지, 생체신호, 적외선 이미지, 응급요청, 상담기록의 멀티모달 데이터세트 임
구축목적
독거노인의 멀티모달 센서데이터를 온디바이스AI 모델에 학습하여 위험 상황 발생시 상태추정 및 근거제시를 바탕으로 돌봄담당자의 세부 대응 또는 자율적인 AI 후속조치를 가능하게 함
-
메타데이터 구조표 데이터 영역 영상이미지 데이터 유형 이미지 , 텍스트 , 센서 데이터 형식 환경측정 및 동작감지 데이터 : csv, 생체 신호 데이터 : csv, 적외선 이미지 데이터 : png, 응급요청 데이터 : csv, 상담기록정보(상담기록요청) 데이터 : csv 데이터 출처 ● 신규구축 ① 대상자 댁내에 설치된 SME20SD, MVPC10, Vital Ring 장비에서 센서, 이미지 데이터 수집 ② 돌봄수행기관*)의 대상자 상담 및 사례, 일정메모를 포함한 상담기록정보에서 텍스트 데이터 수집 ③ 고위험 대상 데이터 수집- ‘아미타 안성불교 요양병원’의 1인실 응급환자 2 개소- 돌봄 수행기관 대상자 선별시 고위험 대상자 선정 ● 기존구축 ① ㈜위즈베이스에서 확보한 독거노인 가구의 센서 데이터 ② ㈜위즈베이스에서 확보한 돌봄수행기관*)의 대상자 상담 및 사례, 일정메모를 포함한 상담기록정보의 텍스트 데이터 * 서울 은평어르신돌봄통합지원센터, 광주광역시사회서비스원, 원주밥상공동체종합사회복지관 라벨링 유형 ① 통합데이터 : 개별센서 조건 등을 고려하여 6종 라벨링 ② 환경측정 및 동작감지: Timeline 기준 상태코드 라벨링 ③ 생체신호 : Timeline 기준 응급상태코드, 주의, 일상 라벨링 ④ 적외선 이미지 : 적외선 영상의 장면묘사 텍스트 라벨링 ⑤ 응급요청센서 : 응급요청 이벤트 발생시점 응급상태코드, 일상 라벨링 ⑥ 상담기록정보 : Timeline 기준 대상자 정보, 상태정보에 대한 기록 라벨링 형식 ① 통합데이터 : JSON ② 환경측정 및 동작감지: JSON ③ 생체신호 : JSON ④ 적외선 이미지 : JSON ⑤ 응급요청센서 : JSON ⑥ 상담기록정보 : JSON 데이터 활용 서비스 응급돌봄 온디바이스 AI서비스 데이터 구축년도/
데이터 구축량2024년/<원천데이터> ㅇ 신규 가구 * 환경측정 센서 : 120,865 건 * 스마트링 센서 : 120,865 건 * 적외선 이미지 센서 : 120,865 건 * 응급요청센서 : 120,865 건 * 상담기록정보 : 120,865 건 ㅇ 기존 가구 * 환경측정 센서 : 55,765,929 건 * 상담기록정보 : 55,765,929 건 <라벨링데이터> ㅇ 신규 가구 * 환경측정 센서 : 120,865 건 * 스마트링 센서 : 120,865 건 * 적외선 이미지 센서 : 120,865 건 * 응급요청센서 : 120,865 건 * 상담기록정보 :120,865 건 ㅇ 기존 가구 * 환경측정 센서 : 55,765,929 건 * 상담기록정보 : 55,765,929 건 -
구분 데이터 종류 데이터 규모 용량 신규
가구
(30
가구)원천
데이터환경측정 및 동작감지 120,865 건 1.03GB 생체신호 120,865 건 적외선이미지 120,865 건 응급요청 120,865 건 상담기록정보 120,865 건 메타데이터 30 건 통합 라벨링 데이터 120,865 건 206.5MB 기존
가구
(1,000
가구)원천
데이터환경측정 및 55,765,929 건 6.99GB 동작감지 상담기록정보 55,765,929 건 메타데이터 1,000건 라벨링 데이터 55,765,929 건 36.22GB 합계 약 44.45GB -
ㅇ 멀티모달 온디바이스 AI
• 입력으로 센서데이터 및 적외선 이미지, 개인정보 텍스트가 제공될 때, 응급/일상행동 상태추정(6 ea)및 근거 제시
• Multimodal 센서데이터 활용으로 개별 센서 오류에 강건하며, LLM기반 추정으로 일상행동 인식과 더불어 돌발적인 응급행동 인식제공
• 상태추정 근거제시로, 후속적인 multimodal-LLM의 자율 응급대응 연계AI 모델 주요특징 Llama3.2-V-11B • Meta에서 공개한 모델로 8B, 11B 등이 있음 (2024.4.)
• Llama3와 이미지 임베딩을 결합한 다양한 multimodal-LLM이 공개되고 있음
- Llama3.2-V: Llama3.2-11B-Instruct + SigLip-300M
- Llava-Llama3.2: Llama3.2-11B-Instruct + CLIP-ViT-Large -
ㅇ 데이터 구성
ㅇ 데이터 구성 항목 데이터 구성 내용 데이터
구성• 신규 30가구에 독거노인 돌봄용 위험감지 멀티모달 데이터 구축을 위해 환경측정, 생체신호, 적외선 이미지, 응급요청, 상담기록정보의 멀티모달 데이터 구축
- 데이터 구성 : 환경측정 및 동작감지 데이터, 생체신호 데이터, 적외선 이미지 데이터, 응급요청 데이터, 상담기록정보 데이터, 통합 데이터
- 데이터 세부 구성
. 환경측정 및 동작감지 데이터: 온도,습도,조도,IR기반움직임,이산화탄소,TVOC
. 생체신호 데이터: 분당 심박수, 분당 호흡수, 혈중산소농도, 피부온도변화, 수면 단계, 수면 점수, 10분당 걸음수, 스트레스 지수, 활동강도, 소모칼로리
. 적외선이미지 데이터: 적외선영상
. 응급요청 데이터: 응급버튼, 응급음장
. 상담기록정보 데이터: 상담 및 사례문서, 개인일정메모
• 기존에 수집하여 보유하고 있는 독거노인 1,000 가구 데이터 구축
- 데이터 구성 : 환경측정 및 동작감지 데이터, 상담기록정보 데이터ㅇ 어노테이션 포맷
- 신규가구 데이터 라벨링 어노테이션 포맷ㅇ 어노테이션 포맷- 신규가구 데이터 라벨링 어노테이션 포맷 구분 속성명 타입 필수여부 속성 설명 예시 1 MetaData object - 메타데이터 정보
(독거노인/센서)- 1-1 ID string Y 기기ID “1001” 1-2 Age number Y 나이 “80” 1-3 Gender string Y 성별 “M” 1-4 Region string Y 지역 “서울특별시” 1-5 DiseaseYN string Y 질병여부 “Y” 1-6 ReceiptST string Y 수급여부 “Y” 1-7 Environment string Y 생활환경 “아파트형” 1-8 ModelList string Y 모델명 List “SME20SD,
MVPC10”1-9 RawUnit object Y 원시데이터 단위 - 1-9-1 Environmental string Y 환경측정 단위 “°C,RH,..” 1-9-2 VitalRing string Y 바이탈측정 단위 “bpm, br/min...” 2 TimeSeriesData array - 타임시리즈 데이터 정보 - 2-1 SeqNum number Y 순번 1000000 2-2 TimeStamp string Y 시간 “2024-06-21
T00:00“2-3 EM_Sensor object - 환경측정 정보 - 2-3-1 DataType string Y 환경측정센서 "EM_Sensor“ 2-3-2 Temperature number Y 온도 "25.8“ 2-3-3 Humidity number Y 습도 "78.1“ 2-3-4 Illuminance number Y 조도 "512.2“ 2-3-5 Activity_IR number Y 움직임 "88“ 2-3-6 CO2 number Y 이산화탄소 "12.3“ 2-3-7 TVOC number Y 휘발성유기
화합물"34.5“ 2-3-8 Label string Y 환경측정_상태 “수면” 2-4 SM_Sensor object - 바이탈링측정 정보 - 2-4-1 DataType string Y 바이탈링측정센서 "SM_Sensor“ 2-4-2 HeartRate number Y 분당 심박수 80 2-4-3 BreathRate number Y 분당 호흡수 15 2-4-4 SPO2 number Y 혈중산소농도 97 2-4-5 SkinTemperature number Y 피부온도변화 0.5 2-4-6 SleepPhase number Y 수면단계 2 2-4-7 SleepScore number Y 수면점수 20 2-4-8 WalkingSteps number Y 10분당 걸음수 70 2-4-9 StressIndex number Y 스트레스 걸음수 80 2-4-10 ActivityIntensity number Y 활동강도 70 2-4-11 CaloricExpenditure number Y 소모칼로리 4 2-4-12 Label string Y 스마트링측정_
상태"일상" 2-5 IR_Sensor object - IR 이미지 정보 - 2-5-1 DataType string Y IR 이미지 센서 "IR_Sensor“ 2-5-2 Image_IR string Y 적외선 영상 "IR_001_20240301T1020.PNG" 2-5-3 Caption string Y 장면묘사 텍스트 "객체가 1명 잇고, 누워있음." 2-6 ER_Sensor object - 응급요청 정보 - 2-6-1 DataType string Y 응급요청센서 "ER_Sensor“ 2-6-2 Button number Y 응급버튼 누름 "Button": "1" 2-6-3 Shout number Y 살려줘 외침 "Shout": "2" 2-6-4 Label string Y 응급요청_
상태"위험" 2-7 Counseling object - 상담기록정보 - 2-7-1 DataType string Y 상담기록정보 "Counseling“ 2-7-2 Counseling string Y 상담및사례문서 "특이사항없음" 2-7-3 Memo string Y 개인일정메모 "특이사항없음" 2-7-4 Information string Y 대상자 기록 "거동이 불편함" 2-8 Total_Labeling object - 통합라벨링 정보 - 2-8-1 DataType string Y 통합라벨링 정보 "Total_Labeling“ 2-8-2 Estimation string Y 통합_상태 “주의” 2-8-3 Reason string Y 근거 “분당심박 기준으로 주의상황으로 판단” - 기존가구 데이터 라벨링 어노테이션 포맷
ㅇ 어노테이션 포맷- 기존가구 데이터 라벨링 어노테이션 포맷 구분 속성명 타입 필수여부 속성 설명 예시 1 MetaData object - 메타데이터 정보
(독거노인/센서)- 1-1 ID string Y 기기ID “1001” 1-2 Age number Y 나이 “80” 1-3 Gender string Y 성별 “M” 1-4 Region string Y 지역 “서울특별시” 1-5 DiseaseYN string Y 질병여부 “Y” 1-6 ReceiptST string Y 수급여부 “Y” 1-7 Environment string Y 생활환경 “아파트형” 1-8 ModelList string Y 모델명 List “[‘SME20SD’,
None]”1-9 RawUnit object Y 원시데이터 단위 - 1-9-1 Environmental string Y 환경측정 단위 “°C,RH,..” 2 TimeSeriesData array - 타임시리즈 데이터 정보 - 2-1 SeqNum number Y 순번 1000000 2-2 TimeStamp string Y 시간 “2024-06-21
T00:00“2-3 EM_Sensor object - 환경측정 정보 - 2-3-1 DataType string Y 환경측정센서 "EM_Sensor“ 2-3-2 Temperature number Y 온도 "25.8“ 2-3-3 Humidity number Y 습도 "78.1“ 2-3-4 Illuminance number Y 조도 "512.2“ 2-3-5 Activity_IR number Y 움직임 "88“ 2-3-6 CO2 number Y 이산화탄소 "12.3“ 2-3-7 TVOC number Y 휘발성유기
화합물"34.5“ 2-3-8 Label string Y 환경측정_상태 “수면” 2-4 Counseling object - 상담기록정보 - 2-4-1 DataType string Y 상담기록정보 "Counseling“ 2-4-2 Counseling string Y 상담및사례문서 "특이사항없음" 2-4-3 Memo string Y 개인일정메모 "특이사항없음" 2-4-4 Information string Y 대상자 기록 "거동이 불편함" ㅇ 데이터 포맷
ㅇ 데이터 포맷 공정구분 구분 파일 포맷 라벨링 주요 속성 가공 통합데이터 라벨링 JSON 상태코드(Estimation) + 근거(Reason) 환경측정 및 동작감지 JSON 가구별 센서시계열 + 상태코드 데이터 라벨링 생체신호 데이터 라벨링 JSON 응급상태코드 적외선 이미지 데이터 라벨링 JSON/ 장면묘사 Caption PNG 응급요청 데이터 라벨링 JSON 응급상태코드 상담기록정보 데이터 라벨링 JSON 상담기록지 Caption ㅇ 실제 예시
1) 기존가구
JSON file format - 기존
{
"MetaData": {
"ID": "0001",
"Age": 80,
"Gender": "F",
"Region": "강원특별자치도",
"DiseaseYN": "Y",
"ReceiptST": "Y",
"Environment": "아파트형",
"ModelList": "['SME20SD', None]",
"RawUnit": {
"Environmental": "℃, RH, CdS%, au, ppm, ppb"
}
},
"TimeSeriesData": [
{
“SeqNum”: 1000000,
“TimeStamp”: ”2024-06-21T00:00",
“EM_Sensor”: {
"DataType": "EM_Sensor",
"Temperature": 22.2,
"Humidity": 67.0,
"Illuminance": 10.6,
"Activity_IR": 6,
"CO2": 405.0,
"TVOC": 0.0,
"Label":"기타"
},
“Counseling”: {
"DataType": "Counseling",
"Counseling": "잠을 설침",
"Memo": "특이사항없음",
"Information": "특이사항없음"
}
},
{
“SeqNum”: 1000001,
“TimeStamp”: "2024-06-21T00:10",
“EM_Sensor”: {
"DataType": "EM_Sensor",
"Temperature": 22.3,
"Humidity": 65.7,
"Illuminance": 12.4,
"Activity_IR": 50,
"CO2": 415.0,
"TVOC": 50.0,
"Label":"식사"
},
“Counseling”: {
"DataType": "Counseling",
"Counseling": "특이사항없음",
"Memo": "반나절 집을 비움",
"Information": "특이사항없음"
}
}
]
}
2) 신규가구
JSON file format – 신규
{
"MetaData": {
"ID": "0002",
"Age": 70,
"Gender": "F",
"Region": "강원특별자치도",
"DiseaseYN": "Y",
"ReceiptST": "Y",
"Environment": "아파트형",
"ModelList": "['SME20SD', '바이탈링', 'MVPC10']",
"RawUnit": {
"Environmental": "℃, RH, CdS%, au, ppm, ppb",
"VitalRing": "bpm, br/min, %, °C, level, score, steps/10min, au, au, Kcal/10min"
}
},
"TimeSeriesData": [
{
"SeqNum": 1000000,
"TimeStamp": "2024-10-04T14:30",
"EM_Sensor": {
"DataType": "EM_Sensor",
"Temperature": 26.2,
"Humidity": 37.0,
"Illuminance": 43.0,
"Activity_IR": 451,
"CO2": 442.0,
"TVOC": 43.0,
"Label": "기타"
},
"SM_Sensor": {
"DataType": "SM_Sensor",
"HeartRate": 74,
"BreathRate": 19,
"SPO2": 96,
"SkinTemperature": -0.2,
"SleepPhase": 9,
"SleepScore": 0,
"WalkingSteps": 0,
"StressIndex": 30,
"ActivityIntensity": 37,
"CaloricExpenditure": 0,
"Label": "일상"
},
"IR_Sensor": {
"DataType": "IR_Sensor",
"Image_IR": "IR_A00002_20241004_1430.png",
"Caption": "객체가 3명 있고, 앉아있음."
},
"ER_Sensor": {
"DataType": "ER_Sensor",
"Button": 0,
"Shout": 0,
"Label": "일상"
},
"Counseling": {
"DataType": "Counseling",
"Counseling": "특이사항없음",
"Memo": "특이사항없음",
"Information": "특이사항없음"
},
"Total_Labeling": {
"DataType": "Total_Labeling",
"Estimation": "기타",
"Reason": "특이사항 없음으로 일상으로 판단"
}
},
{
"SeqNum": 1000001,
"TimeStamp": "2024-10-04T14:40",
"EM_Sensor": {
"DataType": "EM_Sensor",
"Temperature": 25.8,
"Humidity": 36.0,
"Illuminance": 42.0,
"Activity_IR": 189,
"CO2": 418.0,
"TVOC": 31.0,
"Label": "기타"
},
"SM_Sensor": {
"DataType": "SM_Sensor",
"HeartRate": 76,
"BreathRate": 19,
"SPO2": 97,
"SkinTemperature": -0.3,
"SleepPhase": 9,
"SleepScore": 0,
"WalkingSteps": 0,
"StressIndex": 41,
"ActivityIntensity": 8,
"CaloricExpenditure": 0,
"Label": "일상"
},
"IR_Sensor": {
"DataType": "IR_Sensor",
"Image_IR": "IR_A00002_20241004_1440.png",
"Caption": "객체가 1명 있고, 서있음."
},
"ER_Sensor": {
"DataType": "ER_Sensor",
"Button": 0,
"Shout": 0,
"Label": "일상"
},
"Counseling": {
"DataType": "Counseling",
"Counseling": "특이사항없음",
"Memo": "특이사항없음",
"Information": "특이사항없음"
},
"Total_Labeling": {
"DataType": "Total_Labeling",
"Estimation": "기타",
"Reason": "특이사항 없음으로 일상으로 판단"
}
}
]
} -
데이터셋 구축 담당자
수행기관(주관) : ㈜위즈베이스
수행기관(주관) 책임자명 전화번호 대표이메일 담당업무 김병철 본부장 02-462-3737 bckim@wizbase.co.kr 데이터 구축 총괄 수행기관(참여)
수행기관(참여) 기관명 담당업무 ㈜뉴컨 정제/가공 주식회사 와이매틱스 AI모델 개발 ㈜하이젠 데이터 품질관리 데이터 관련 문의처
데이터 관련 문의처 담당자명 전화번호 이메일 이정준 02-462-3737 jjlee@wizbase.co.kr 김익현 070-4044-4257 dlrgus@newconnect.co.kr AI모델 관련 문의처
AI모델 관련 문의처 담당자명 전화번호 이메일 이병탁 02-2057-2023 bytelee.kr@gmail.com 저작도구 관련 문의처
저작도구 관련 문의처 담당자명 전화번호 이메일 김민기 02-462-3737 mkkim1@wizbase.co.kr 최지민 02-462-3737 jmchoi@wizbase.co.kr
-
인터넷과 물리적으로 분리된 온라인·오프라인 공간으로 의료 데이터를 포함하여 보안 조치가 요구되는 데이터를 다운로드 없이 접근하고 분석 가능
* 온라인 안심존 : 보안이 보장된 온라인 네트워크를 통해 집, 연구실, 사무실 등 어디서나 접속하여 데이터에 접근하고 분석
* 오프라인 안심존 : 추가적인 보안이 필요한 데이터를 대상으로 지정된 물리적 공간에서만 접속하여 데이터에 접근하고 분석 -
- AI 허브 접속
신청자 - 안심존
사용신청신청자신청서류 제출* - 심사구축기관
- 승인구축기관
- 데이터 분석 활용신청자
- 분석모델반출신청자
- AI 허브 접속
-
1. 기관생명윤리위원회(IRB) 심의 결과 통지서 [IRB 알아보기] [공용IRB 심의신청 가이드라인]
2. 기관생명윤리위원회(IRB) 승인된 연구계획서
3. 신청자 소속 증빙 서류 (재직증명서, 재학증명서, 근로계약서 등 택1)
4. 안심존 이용 신청서 [다운로드]
5. 보안서약서 [다운로드]
※ 상기 신청서 및 첨부 서류를 완비한 후 신청을 진행하셔야 정상적으로 절차가 이루어집니다. -
신청 및 이용관련 문의는 safezone1@aihub.kr 또는 02-525-7708, 7709로 문의
데이터셋 다운로드 승인이 완료 된 후 API 다운로드 서비스를 이용하실 수 있습니다.
API 다운로드 파일은 분할 압축되어 다운로드 됩니다. 분할 압축 해제를 위해서는 분할 압축 파일들의 병합이 필요하며 리눅스 명령어 사용이 필요합니다.
리눅스 OS 계열에서 다운로드 받으시길 권장하며 윈도우에서 파일 다운로드 시 wsl(리눅스용 윈도우 하위 시스템) 설치가 필요합니다.
※ 파일 병합 리눅스 명령어
find "폴더경로" -name "파일명.zip.part*" -print0 | sort -zt'.' -k2V | xargs -0 cat > "파일명.zip"
- 해당 명령어 실행 시, 실행 경로 위치에 병합 압축 파일이 생성됩니다.
- 병합된 파일 용량이 0일 경우, 제대로 병합이 되지 않은 상태이니 "폴더경로"가 제대로 입력되었는지 확인 부탁드립니다.
※ 데이터셋 소개 페이지에서 다운로드 버튼 클릭하여 승인이 필요합니다.
오프라인 데이터 이용 안내
본 데이터는 K-ICT 빅데이터센터에서도 이용하실 수 있습니다.
다양한 데이터(미개방 데이터 포함)를 분석할 수 있는 오프라인 분석공간을 제공하고 있습니다.
데이터 안심구역 이용절차 및 신청은 K-ICT빅데이터센터 홈페이지를 참고하시기 바랍니다.