동의보감 약초 이미지

동의보감 약초 이미지

데이터셋명 동의보감 약초 이미지
데이터 분야 농축수산 데이터 유형 이미지, 텍스트
구축기관 가천대학교 산학협력단 데이터 관련 문의처 담당자명 이영종
가공기관 빅스톤하우스 전화번호 031-750-5114
검수기관 동북아생물다양성연구소 이메일 garak11@naver.com
구축 데이터량 66.1만 구축년도 2020년
버전 1.0 최종수정일자 2021.06.25
소개 동의보감에 수록된 약초 457종(2020년도 50종 선정) 약초를 판별하기 위한 이미지 데이터
주요 키워드 동의보감 약초 이미지, 약초 텍스트 데이터, 약초 판별 서비스, 허브넷
저작권 및 이용정책 본 데이터는 과학기술정보통신부가 주관하고 한국지능정보사회진흥원이 지원하는 '인공지능 학습용 데이터 구축사업'으로 구축된 데이터입니다. [데이터 이용정책 상세보기]
데이터설명서 자료보기 구축활용가이드 자료보기
샘플데이터 다운로드 교육활용동영상 영상보기
저작도구 다운로드 AI모델 다운로드
데이터 변경이력
버전 일자 변경내용 비고
1.0 2021.06.25 데이터 최초 개방  
구축 목적
  • 약초 및 독초 판별을 위한 이미지 AI 데이터와 약초 사용법 제공을     위한 효능 데이터를 구축하고 약초 및 독초 판별 인공지능 알고리즘을     개발하여 약초 판별 인공지능 동의보감 애플리케이션 개발 및 배포
활용 분야
  • 교육, 농업, 환경, 문화 등 여러 분야에서 사용 가능한 식물 판별 기     초 데이터셋
소개
  • 독초·약초 오용으로 인한 중독사고 예방을 통한 생활·안전 문제 해결 기여
  • 동의보감 기반 정확한 약초 활용 AI 모델 제시, 국민건강 100세시대 기여
  • 약초 판별 인공지능 분야 국제 표준화 분류 코드 체계 수립 여건 마련
동의보감 약초 이미지 소개 이미지
구축 내용 및 제공 데이터량
  • 대상 약초 선정
    - 식물 및 한의학 전문가 자문을 통해 동의보감 수록 약초 457종 중 2020년 사업 대상으로 50종을 선정하고, 선정 약초와 형태, 모양 등이 매우 유사한 78종의 식물을 비교식물로 선정
  • 데이터 수집
    - 수행기관 및 참여기관인 ㈜동북아생물다양성연구소는 대상 약초 및 비교식물의 표준 가이드 라인를 제시하고, 참여기관인 ㈜믹스미디어, ㈜빅스톤하우스는 촬영 매뉴얼에 따라 직접 촬영하여 846,277(구축 계획 133% 달성)건의 데이터를 수집
  • 데이터 정제
    - 수행기관의 자문을 거쳐 만들어진 정제 매뉴얼에 따라 참여 기관인 ㈜빅스톤하우스는 수집된 데이터를 기술 검증(3단계)하고 전문가 검수를 통해 최종 정제를 완료함으로써 품질 높은 665,267건의 정제된 데이터를 확보
  • 데이터 가공 및 검수
    - 데이터 가공 매뉴얼에 따라 저작도구인 LableMe를 이용하여 바운딩 박싱, Crop, Annotation하여 661,369건의 학습용 데이터 구축
    구축 내용 및 제공 데이터량 표
    구 분 2020 년
    목표(A) 달성(B) 달성률(B/A)
    이미지
    데이터 구축
    수집 637,950장 846,277장 133%
    정제 637,950장 665,267장 104%
    가공 637,950장 661,369장 103%
    수집 플랫폼 1식 1식 100%
    약초 텍스트
    데이터 구축
    약초효능 12,000건 12,000건 100%
    네레이션 250건 250건 100%
    번역 200건 200건 100%
    러시아, 영어, 일어, 중국어
    녹음 250건 250건 100%
    한국, 러시아, 일어, 중국어, 영어
대표도면
  • 약초 판별 알고리즘과 3D 이미지를 활용하여 약초 판별 인공지능 동의보감 스마트폰 앱 개발
    - 운영체계: Android
    - 데이터셋: 약초 및 비교식물 128종, 660,000장
    - 방식: 카메라로 촬영한 사진을 AI 알고리즘을 통해 판별
    - 카테고리: 라이프 스타일
    - 앱명칭: 허브넷(약초 판별 인공지능 동의보감)
    - 지원언어: 한국어, 영어, 중국어, 러시아어, 일본어
동의보감 약초 이미지 대표도면 이미지

 

필요성
  • 자연 약초의 맹신에 따른 안전 불감증, 국민건강 위협
    - 한방 의료기관에서 진단·처방받아 복용하는 한약은 안전관리가 체계적이며 의료인의 지도·관리가 이루어지고 있으나, 민간에서 채취·복용하는 약초는 전적으로 개인의 책임
  • 자연 약초에 대한 부정확한 정보와 오용으로 인한 피해 증가 - 산과 들에 자생하는 약초는 일반인의 접근성이 높은 반면, 부정확한 정보로 인한 생명에 대한 안전 보장에 대한 우려가 높음
    ※ 식품의약품안전처 통계에 따르면, 최근 10년간(2009년~2018년) 자연 독에 의한 사망 251명
  • 생활 속 자연 약초 안전 이용 기준 및 정확한 판별에 대한 도움 제공 필요
    - 개인의 약초 채취·복용을 금지할 수 없는 실정으로 최소한의 안전장치로 약초 채취 전과 약초 음용 전에 약초에 대한 판별과 정확한 활용 방법에 대한, 확인 수단 필요
  • 파급효과
    - 유사 약초 구분과 판별에 도움을 줄 수 있는 인공지능을 개발하여 전문 지식 부족으로 독초를 약초로 오인·음용하여 발생되는 ‘독에 의한 사망과 중독사고’ 예방
    - 동의보감의 현대적 해석과 생활 속 활용 인공지능 모델 제시
    - 자연 약초의 정확한 사용 및 활용 방법 제공을 통한 국민 건강 생활 지원
    - 동의보감 약초의 방대한 비정형 데이터의 정형화 데이터셋 구축을 통해 다양한 AI 연구 견인
    - 약초를 이용한 개인맞춤형 건강관리 모델 발굴 등 고령화 사회 문제 해결 기여
데이터 구조
  • 데이터 구성
    동의보감 약초 이미지 데이터 구성 표
    Key Description Type
    width 연관 이미지 파일의 가로 픽셀수 int
    height 연관 이미지 파일의 세로 픽셀수 int
    filename 연관 이미지 파일의 식별자(이름) string
    kind 연관 이미지 파일에 촬영된 약초의 종류 string
    part 연관 이미지 파일에 촬영된 약초의 부위명 string
    gps_long 연관 이미지 파일에 촬영된 약초의 위도 좌표 float
    gps_lat 연관 이미지 파일에 촬영된 약초의 경도 좌표 float
    place 연관 이미지 파일에 촬영된 장소의 이름 string
    date 연관 이미지 파일에 촬영된 시점 string
    is_copyright 저작권자에게 사용 동의를 받았는지에 대한 여부 boolean
    is_compare 현재 식물이 비교식물에 해당하는 약초인지의 여부 boolean
    is_poisonous 현재 식물이 독성을 가지고 있는지 여부 boolean
    manufacture 촬영 장비의 제조사 명(ex:cannon) string
    model 촬영장비의 모델명 string
    flash 플래쉬 작동 여부 boolean
    focal_length 촬영시 초점 여부 string
    exposure_time 촬영시 셔터 거리 string
    ISO 촬영시 ISO 감도 string
    resolution 촬영시 I해상도 string
    f_number 촬영시 F값 string
    aperture_value 촬영시 조리개 값 string
    depth 연관 이미지 파일의 채널 수 int
    bit 연관 이미지 파일의 비트 수 int
    tag 연관 이미지 파일의 연관 정보 int

     

  • 어노테이션 포맷
    동의보감 약초 이미지 데이터 구성 표
    No 항목 필수여부 타입
    국문명 영문명
    1 1-1 이미지 길이 width Y Int
    1-2 이미지 높이 height Y Int
    1-3 식별자 filename Y String
    2 2-1 약초명 kind Y String
    2-2 부위명 part N String
    2-3 위도 gps_long N Float
    2-4 경도 gps_lat N Float
    2-5 촬영장소 place N String
    2-6 촬영일시 date Y String
    2-7 저작권 동의 여부 is_copyright Y Boolean
    2-8 비교식물 여부 is_compare Y Boolean
    2-9 독초 여부 is_poisonous Y Boolean
    2 3-1 제조사 manufacturer N String
    3-2 모델명 model N String
    3-3 플래시 flash N Boolean
    3-4 초점 거리 focal_length N String
    3-5 셔터 속도 exposure_time N String
    3-6 ISO 감도 ISO N String
    3-7 해상도 resolution N String
    3-8 F 값 f_number N String
    3-9 조리개값 aperture_value N String
    3-10 채널 depth N Int
    3-11 비트 bit N Int
    4 태그 tag N List
데이터셋 구축 담당자
수행기관(주관) : 가천대학교 산학협력단
수행기관(주관)
책임자 전화번호 대표이메일 담당업무
이영종 031-750-5114 garak11@naver.com · 약초 이미지 데이터 구축, 약초 텍스트 데이터 구축
· 원천데이터 정제 검수
· 데이터구축 총괄
수행기관(참여)
수행기관(참여)
기관명 담당업무 기관명 담당업무
빅스톤하우스 · 데이터 수집, 데이터 정제, 데이터 라벨링, 판별 알고리즘 설계
· 허브넷 플랫폼 개발, 응용 서비스(약초 판별 앱)개발
고백기술 · 수집 데이타 가공(라벨링 및 어노테이션)
· 학습용 데이터 검수 및 품질관리
· 크라우드소싱 인력 교육 진행 및 관리
· AI 학습 알고리즘 선정 및 AI 학습 모델 구축(신경망 모델 학습)
· 약초판별 알고리즘 개발
믹스미디어 · 원시 데이터 구축
· 텍스트데이터 5개 국어 번역
나인펄스 · 약초 3D 모델링 제작(50종)
· 나래이션 녹음(300건-한국어, 영어, 러시아어, 중국어, 일어)
동북아생물다양성연구소 · 원시 데이터 수집
· 원천 데이터 전문가 검수