콘텐츠로 건너뛰기 메뉴로 건너뛰기 푸터로 건너뛰기
데이터를 불러오고 있습니다
데이터를 저장하고 있습니다
#과학기술표준분류 # 특허 # 기술문서 # 6T분류

NEW 과학기술표준분류 대응 특허 데이터

과학기술표준분류 대응 특허 데이터 아이콘 이미지
  • 분야지식재산
  • 유형 텍스트
구축년도 : 2022 갱신년월 : 2024-04 조회수 : 12,055 다운로드 : 138 용량 :
샘플 데이터 ?

샘플데이터는 데이터의 이해를 돕기 위해 별도로 가공하여 제공하는 정보로써 원본 데이터와 차이가 있을 수 있으며,
데이터에 따라서 민감한 정보는 일부 마스킹(*) 처리가 되어 있을 수 있습니다.

※ 내국인만 데이터 신청이 가능합니다.

  • 데이터 변경이력

    데이터 변경이력
    버전 일자 변경내용 비고
    1.2 2024-04-25 데이터 추가 개방 Validation/라벨링데이터
    1.1 2023-12-27 데이터 최종 개방
    1.0 2023-07-31 데이터 개방(Beta Version)

    데이터 히스토리

    데이터 히스토리
    일자 변경내용 비고
    2024-04-12 AI모델 수정 소스코드 파일 추가
    2024-01-24 산출물 전체 공개

    소개

    기술문서(특허)-국가과학기술표준분류는 연구기관/기업체, 정부부처/공공기관 등에서 R&D 정책 자료, 다각도 데이터 분석, 데이터 연계성, 다양한 통계 분석에 활용함으로써 다양한 수요자들이 활용할 수 있는 기술문서의 신규 가치 창출이 가능

    구축목적

    특허와 같은 기술 문서를 표준화되고, 법제화된 국가과학기술표준분류에 대응하여 매핑하고, 이를 통해 AI 모델을 학습함으로써 서로 다른 종류의 기술문서도 통일된 국가과학기술표준분류로 매핑하여 서로 연동시킴으로써 새로운 관점의 분석 결과를 도출하거나, 국가 R&D 관련 다양한 활동에 활용할 수 있음
  • 1. 데이터 구축 규모

    구분 구축실적
    데이터셋 과학기술표준분류  188개
    (중분류)
    라벨링 특허건수 300,240건
    어노테이션 (중점과학기술분류) 300,240건
    어노테이션 (6T 분류) 300,240건

    -라벨링 데이터: 과학기술표준분류 17개 대분류, 188개 중분류에 대해 총 300,240건 구축
    -각 건별로 중점과학기술분류 대분류 11개, 6T 분류의 6개 분류로 어노테이션 설정

     

    2. 데이터 분포 (과학기술표준분류의 중분류별 구축 건수)

    대분류 중분류 구축건수
    EA_기계 EA01_측정표준/시험평가기술 1548
    EA02_생산기반기술 1593
    EA03_요소부품 1512
    EA04_정밀생산기계 1520
    EA05_로봇/자동화기계 1728
    EA06_나노/마이크로기계시스템 2238
    EA07_에너지/환경기계시스템 1928
    EA08_산업/일반기계 1508
    EA09_자동차/철도차량 1708
    EA10_조선/해양시스템 1720
    EA11_항공시스템 1620
    EA12_우주발사체 1958
    EA13_인공위성 1980
    EA14_재난안전장비 1965
    EA15_국방플랫폼 1394
    EB_재료 EB01_금속재료 1457
    EB02_세라믹재료 1581
    EB03_고분자재료 1628
    EB04_주조/용접/접합 1626
    EB05_소성가공/분말 1671
    EB06_열/표면처리 1667
    EB07_분석/물성평가기술 1409
    EB08_국방소재 1487
    EC_화공 EC01_화학공정 1551
    EC02_나노 화학공정기술 1664
    EC03_고분자 공정기술 1627
    EC04_생물화학 공정기술 1564
    EC05_정밀화학 1541
    EC06_화학제품 1621
    EC07_섬유제조 1683
    EC08_염색가공 1519
    EC09_섬유제품 1660
    EC10_화학공정 안전기술 1438
    EC11_무기화생방/화력탄약 1616
    ED_전기/전자 ED01_광응용기기 1569
    ED02_반도체장비 1755
    ED03_중전기기 1520
    ED04_반도체소자 및 시스템 1686
    ED05_전기전자부품 1581
    ED06_가정용기기 및 전자응용기기 1735
    ED07_계측기기 1614
    ED08_영상/음향기기 1391
    ED09_전지 1586
    ED10_디스플레이 1933
    ED11_무기센서 및 제어 1622
    EE_정보/통신 EE01_정보 이론 1645
    EE02_소프트웨어 1469
    EE03_정보보호 1661
    EE04_광대역 통합망 1531
    EE05_위성/전파 1692
    EE06_이동통신 2590
    EE07_디지털방송 1672
    EE08_홈네트워크 1513
    EE09_RFID/USN 1583
    EE10_U-컴퓨팅 1544
    EE11_정보통신 모듈 및 부품 1665
    EE12_ITS/텔레매틱스 1633
    EE13_재난정보관리 1868
    EE14_국방정보통신 1649
    EF_에너지/자원 EF01_온실가스 처리 1548
    EF02_자원탐사/개발/활용 1609
    EF03_수화력발전 1660
    EF04_송-배전계통 1754
    EF05_전력IT 1429
    EF06_신재생에너지 1927
    EF07_가스에너지 1520
    EG_원자력 EG01_원자로 노심 기술 1718
    EG02_원자로계통/핵심기기술 1548
    EG03_원자력 계측/제어기술 1457
    EG04_원자력안전기술 1671
    EG05_핵연료/원자력소재 1527
    EG06_핵연료주기/방사성 폐기물 관리기술 1494
    EG07_방사선기술 1805
    EG08_원자력기반/첨단기술 1568
    EG09_원전 건설/운영기술 1326
    EG10_핵융합 1385
    EH_환경 EH01_대기질 관리 1980
    EH02_물관리 1906
    EH03_토양/지하수 복원/관리 1527
    EH04_생태계 복원/관리 1266
    EH05_소음/진동 관리 1513
    EH06_해양환경 1828
    EH07_폐기물 관리 및 자원순환 1571
    EH08_위해성 평가 및 관리 1623
    EH09_환경보건 1377
    EH10_환경예측/감시/평가 1315
    EH11_친환경 소재/제품 1644
    EH12_친환경 공정 1301
    EH13_측정분석장비/장치 1542
    EH14_청정생산 및 설비 1784
    EH15_작업환경기술 1372
    EI_건설/교통 EI01_국토정책 및 계획 1389
    EI02_국토공간개발기술 1268
    EI03_시설물 설계 및 해석기술 1316
    EI04_건설시공 및 재료 1758
    EI05_도로교통기술 1697
    EI06_철도교통기술 1775
    EI07_항공교통기술 1734
    EI08_해양안전 및 교통기술 1628
    EI09_수공시스템기술 1430
    EI10_물류기술 1722
    EI11_시설물 안전 및 유지관리 기술 1590
    EI12_건설 환경설비 기술 1492
    NB_물리학 NB01_입자/장물리 1517
    NB02_통계물리 1607
    NB03_원자핵 물리 1068
    NB04_유체/플라즈마 1676
    NB05_광학 1870
    NB06_응집 물질 물리 1476
    NB07_원자/분자물리 1959
    NB08_천체물리 882
    NB09_복합물리 1722
    NC_화학 NC01_물리화학 1502
    NC02_유기화학 1605
    NC03_무기화학 1432
    NC04_분석화학 1458
    NC05_고분자화학 1643
    NC06_생화학 1581
    NC07_광화학 1710
    NC08_전기화학 1515
    NC09_나노화학 1619
    NC10_융합화학 1488
    ND_지구과학(지구/대기/해양/천문) ND01_지질과학 1505
    ND02_지구물리학 1929
    ND03_지구화학 1959
    ND04_대기과학 1900
    ND05_기상과학 1942
    ND06_기후학 1822
    ND07_자연재해분석/예측 1676
    ND08_해양과학 1434
    ND09_해양자원 1463
    ND10_해양생명 1675
    ND11_극지과학 1301
    ND12_천문학 507
    ND13_우주과학 1001
    ND14_천문우주관측기술 1078
    LA_생명과학 LA01_분자세포생물학 1518
    LA02_유전학/유전공학 1697
    LA03_발생/신경생물학 1546
    LA04_면역학 및 생리학 1527
    LA05_분류/생태/환경생물학 1383
    LA06_생화학 및 구조생물학 1653
    LA07_융합바이오 1717
    LA08_생물공학 1610
    LA09_산업바이오 1747
    LA10_바이오공정/기기 1767
    LA11_생물위해성 1394
    LB_농림수산식품 LB01_식량작물과학 1392
    LB02_원예특용작물과학 1525
    LB03_농생물학/작물보호 1763
    LB04_농화학 1609
    LB05_농업환경생태 1658
    LB06_동물자원과학 1457
    LB07_수의과학 1748
    LB08_농업기계/설비 1743
    LB09_농업인프라 공학 1448
    LB10_산림자원학 1761
    LB11_조경학 1542
    LB12_임산공학 1724
    LB13_수산양식 1581
    LB14_수산자원/어장환경 1634
    LB15_어업생산/이용가공 1500
    LB16_농수축산물 안전 1516
    LB17_식품과학 1538
    LB18_식품영양과학 1565
    LB19_식품조리/외식/식생활 개선 1779
    LB20_농림수산식품 경영/정보 등 1286
    LC_보건의료 LC01_의생명과학 1417
    LC02_임상의학 1524
    LC03_의약품/의약품개발기술 1707
    LC04_치료/진단기기 1585
    LC05_기능복원/보조 및 복지기기 1545
    LC06_의료정보 및 시스템 1866
    LC07_한의과학 1495
    LC08_보건학 1586
    LC09_간호과학 1393
    LC10_치의과학 1688
    LC11_식품안전관리 1622
    LC12_영양관리 1639
    LC13_의약품안전관리 1547
    LC14_의료기기안전관리 1645
    LC15_독성 및 안전성관리 기반기술 1656
    OA_뇌과학,뇌과학 OA01_뇌신경생물 1544
    OA02_뇌인지 1515
    OA03_뇌의약 1746
    OA04_뇌공학 1576
    OB_인지/감성과학 ,인지/감성과학 OB01_인지과학 1611
    OB02_감성과학 1552
    합계 300240

     

    과학기술표준분류
    대분류별 구성비
    기계  8%
    재료 4%
    화공 6%
    전기/전자 6%
    정보통신 8%
    에너지/자원 4%
    원자력 5%
    환경 8%
    건설/교통 6%
    물리학 5%
    화학 5%
    지구과학 7%
    생명과학 6%
    농림수산식품 11%
    보건의료 8%
    뇌과학 2%
    인지/감성과학 1%
  • 저작도구 설명서 및 저작도구 다운로드

    저작도구 설명서 다운로드 저작도구 다운로드
  • AI 모델 상세 설명서 다운로드

    AI 모델 상세 설명서 다운로드 AI 모델 다운로드

    1. 데이터 활용 

    데이터 명  과학기술표준분류 대응 특허 데이터
    학습 모델  과학기술표준분류 매핑 모델
    모델 BERT
    성능 지표 F1-score
    개발 내용 구축되는 학습 데이터를 활용하여 BERT 모델로 과학기술표준분류 188개 중분류에 대한 특허 데이터의 속성, 데이터 내용을 학습한 후, 새롭게 입력되는 특허 데이터들을 과학기술표준분류 중분류에 매핑하여 도출함
    응용서비스
    (예시 및 유의사항)
    -과학기술표준분류에 매핑된 특허 데이터를 통해 빅데이터 분석이 가능함
    -국가연구소, 대학교 연구자들의 연구 성과에 대한 통계 분석이 가능함
    -R&D 연구 개발 주제와 관련된 과학기술분야에 속하는 특허 데이터로부터 다양한 아이디어 및 해결 방안 도출이 가능함

     

    2. 활용 AI모델의 유효성 검증

    유효성 항목 및 지표
    항목명 특허 분류의 유효성 (과학기술표준분류 중분류 대상)
    임무 분류(Classification)
    지표 F1-Score
    측정 산식 2*(Precision*Recall)/(Precision+Recall)
    HW 사양
    구성방식 로컬서버
    CPU AMD Ryzen 7 3700X 8-Core Processor
    Memory 64GB
    GPU GeForce RTX 2080ti
    Storage 6TB HDD
    OS CentOS Linux release 7.8.2003
    알고리즘 및 학습 조건
    개발 언어 Python 3.7.4
    프레임워크 CUDA 11.0, Pytorch 1.4.0
    알고리즘 BERT (한글 KoBert 기반 cls) 
    학습조건 epoch = 20, batch = 32, optimizer, loss, iteration 등
    loss func = Focalloss(alpha=0.25)
    데이터셋 분할 • 학습용 데이터셋: 29425 / 80% 
    (수량, 비율) • 검증용 데이터셋: 3269 / 10%
      • 평가용 데이터셋: 3270 / 10%
    구축목표 총 데이터 수량 대비 비율 구축 목표 총 데이터 수 : 300,000
    초기 데이터 : 32,695
    구축 비율 : 약 10.9%

     

    3. 응용 서비스 
    (1) 특허 데이터 맵핑 데이터 도출

    기술분류 자동 매핑 서비스

    -국가과학기술표준분류는 논문, 특허, 학술지, 연구자료, 전문분야 정보, 통계 및 분석 정보, 학술지 출판 및 배포à전문 정보 및 데이터 수집/검색/관리/활용에 활용되고 있음.  이외에도, 국가 R&D 정보, 지식 정보의 공유, 협업, 인프라 자원 이용, 기술 및 산업분석 활용, 과학 기술 동향 파악, 교육 및 행사 등에서 활용되고 있음

    - AI 학습 데이터를 통해 AI모델을 구축함으로써, 특허와 논문과 같은 기술 분류를 보다 정확하고 신속하게 고품질의 기술문서-국가과학기술표준분류의 매핑 데이터가 도출 될 수 있음. 

    -기술문서(특허)-국가과학기술표준분류는 연구기관/기업체, 정부부처/공공기관 등에서 R&D 정책 자료, 다각도 데이터 분석, 데이터 연계성, 다양한 통계 분석에 활용함으로써 다양한 수요자들이 활용할 수 있는 기술문서의 신규 가치 창출이 가능할 것으로 기대됨.

     

    3. 응용서비스 개발 

    • 특허 자동분류 AI모델에 활용

    - 과학기술표준분류에 따른 특허문헌데이터의 특징(Feature)을 학습한 AI모델은 다양한 특허문헌의 주요 텍스트 항목을 기반으로, 과학기술분야를 자동으로 매핑해줄 수 있음. 이 AI 모델은, 특허문헌의 분류뿐만 아니라, 검색과 분석에서의 편의성 그리고 기업/기관별로 산업분야 맞춤형 특허정보 활용이 가능해짐

     

    • 과학기술표준분류별 국가 R&D 전략수립

    - 위 과학기술표준분류 대응 특허 데이터 AI모델을 이용하면, 과학기술표준분류별 특허DB를 실시간으로 업데이트가 가능하여, 국가 과학 기술 발전을 목적으로 한 R&D 전략수립의 기초 분석데이터로 활용이 가능함

     

    • AI번역 등의 과학기술표준분류별 학습텍스트 데이터셋으로 타 분야에 AI에 활용

    - AI번역 엔진의 학습데이터로 다양한 텍스트데이터가 사용되고 있는데, 과학기술 관련 번역의 경우에는 과학기술표준분류별로 동일한 용어가 다른 의미로 사용되어 번역품질을 높이는데 한계가 있음. 이러한 한계를, 과학기술별로 매핑된 특허문헌정보를 학습데이터셋으로 활용함으로서 극복할 수 있을 것임

     

    • 특허도면정보 활용 과학기술표준분류별 이미지 데이터셋으로 타 분야 AI에 활용

    - 특허는 텍스트정보 뿐만 아니라, 도면이미지정보를 같이 포함하고 있음. 과학기술표준분류별로 특허문헌정보가 매핑된 데이터가 구축되면, 이미지와 과학기술표준분류도 동시에 매핑된 데이터가 생성될 수 있음. 최근 주관기관인 워트인텔리전스가 국내최초로 런칭한 AI도면인식 모델을 이용하면 도면 하나하나의 이미지별로도 과학기술표준분류 태깅이 가능하므로 보다 정교한 이미지-과학기술표준분류 데이터셋으로 활용될 수 있음

     

    • 특허빅데이터를 활용한 혁신산업 및 서비스 창출에 활용

    - 최근 최신 기술트랜드를 특허빅데이터로 분석하는 것이 시장에서 확산되고 있는 바, 이런한 특허빅데이터 분석에 과학기술표준분류정보가 더 해진다면, 특허데이터를 기반으로 각 과학기술에 대한 새로운 혁신기술군을 발굴할 수 있으며, 이러한 발굴 등을 위한 시스템 등으로 다양하게 활용될 수 있음

    - 국가과학기술표준분류의 중분류 단위로 특허문헌을 매칭하는 작업을 수행함으로써, 기술 문서의 중요한 예시 중 하나인 특허데이터를 국가과학기술표준분류에 매칭하고, 이를 다른 종류의 기술 문서에도 확장하기 위한 AI 모델을 학습하기 위한 학습데이터를 구축하는 과제임. 하기와 같은 플로우로 라벨링 과정을 거쳐 실제 AI 특허분류모델로 검증하고 그 결과물을 국민들이 쉽게 활용할 수 있도록 제공하고자 함

  • 데이터 성능 점수

    측정값 (%)
    기준값 (%)

    데이터 성능 지표

    데이터 성능 지표
    번호 측정항목 AI TASK 학습모델 지표명 기준값 점수 측정값 점수
    1 과학기술표준분류 분류성능 Text Classification BERT (한글 KoBert 기반 cls) F1-Score 0.8 0.8249

    ※ 데이터 성능 지표가 여러 개일 경우 각 항목을 클릭하면 해당 지표의 값이 그래프에 표기됩니다.

    ※ AI모델 평가 지표에 따라 측정값의 범위, 판단 기준이 달라질 수 있습니다. (ex. 오류율의 경우, 낮을수록 좋은 성능을 내는 것으로 평가됩니다)

  • 설명서 및 활용가이드 다운로드

    데이터 설명서 다운로드 구축활용가이드 다운로드
    구분  획득(수집) 단계  정제 단계 가공(라벨링) 단계
    데이터 구분 원시데이터 원천데이터 최종데이터
    데이터 형태 텍스트: 명칭, 요약, 발명의 상세한 설명, 청구항 텍스트: 명칭, 요약, 발명의 상세한 설명, 청구항 텍스트: docID, 문헌타입, 과학기술표준분류 대분류/중분류, 키워트(6T분류, 국가중점기술분류)
    이미지: 도면 이미지: 도면
    데이터 포멧 SGML, XML(ST36/ST96), PDF, JPG, TXT  SGML, XML(ST36/ST96), PDF, JPG, TXT json

     

    <라벨링 데이터의 구성 요소>

    구분 속성명 타입 필수여부 설명
    1 dataset      
      1-1 updateDate string Y 데이터생성일
    1-2 documentId string Y 문헌키
    1-3 country_code string Y 국가코드
    1-4 application_number string Y 출원번호
    1-5 document_type string Y 문헌타입 (특허, 실용신안, 공개, 등록 구분)
    1-6 ipc_main string Y 메인 IPC
    1-7 Lno string Y 과학기술표준분류 대분류코드
    1-8 Ltext string Y 과학기술표준분류 대분류설명
    1-9 Mno string Y 과학기술표준분류 중분류코드
    1-10 Mtext string Y 과학기술표준분류 중분류명칭
    1-11 keyword string Y 키워드 (태그: 6T 분류 / 국가중점기술분류 대분류)

     

    <데이터 포맷 예시>

    데이터 포맷 예시

     

    <과학기술표준분류 중분류 리스트>

    대분류 중분류
    EA_기계 EA01_측정표준/시험평가기술
    EA_기계 EA02_생산기반기술
    EA_기계 EA03_요소부품
    EA_기계 EA04_정밀생산기계
    EA_기계 EA05_로봇/자동화기계
    EA_기계 EA06_나노/마이크로기계시스템
    EA_기계 EA07_에너지/환경기계시스템
    EA_기계 EA08_산업/일반기계
    EA_기계 EA09_자동차/철도차량
    EA_기계 EA10_조선/해양시스템
    EA_기계 EA11_항공시스템
    EA_기계 EA12_우주발사체
    EA_기계 EA13_인공위성
    EA_기계 EA14_재난안전장비
    EA_기계 EA15_국방플랫폼
    EB_재료 EB01_금속재료
    EB_재료 EB02_세라믹재료
    EB_재료 EB03_고분자재료
    EB_재료 EB04_주조/용접/접합
    EB_재료 EB05_소성가공/분말
    EB_재료 EB06_열/표면처리
    EB_재료 EB07_분석/물성평가기술
    EB_재료 EB08_국방소재
    EC_화공 EC01_화학공정
    EC_화공 EC02_나노 화학공정기술
    EC_화공 EC03_고분자 공정기술
    EC_화공 EC04_생물화학 공정기술
    EC_화공 EC05_정밀화학
    EC_화공 EC06_화학제품
    EC_화공 EC07_섬유제조
    EC_화공 EC08_염색가공
    EC_화공 EC09_섬유제품
    EC_화공 EC10_화학공정 안전기술
    EC_화공 EC11_무기화생방/화력탄약
    ED_전기/전자 ED01_광응용기기
    ED_전기/전자 ED02_반도체장비
    ED_전기/전자 ED03_중전기기
    ED_전기/전자 ED04_반도체소자 및 시스템
    ED_전기/전자 ED05_전기전자부품
    ED_전기/전자 ED06_가정용기기 및 전자응용기기
    ED_전기/전자 ED07_계측기기
    ED_전기/전자 ED08_영상/음향기기
    ED_전기/전자 ED09_전지
    ED_전기/전자 ED10_디스플레이
    ED_전기/전자 ED11_무기센서 및 제어
    EE_정보/통신 EE01_정보 이론
    EE_정보/통신 EE02_소프트웨어
    EE_정보/통신 EE03_정보보호
    EE_정보/통신 EE04_광대역 통합망
    EE_정보/통신 EE05_위성/전파
    EE_정보/통신 EE06_이동통신
    EE_정보/통신 EE07_디지털방송
    EE_정보/통신 EE08_홈네트워크
    EE_정보/통신 EE09_RFID/USN
    EE_정보/통신 EE10_U-컴퓨팅
    EE_정보/통신 EE11_정보통신 모듈 및 부품
    EE_정보/통신 EE12_ITS/텔레매틱스
    EE_정보/통신 EE13_재난정보관리
    EE_정보/통신 EE14_국방정보통신
    EF_에너지/자원 EF01_온실가스 처리
    EF_에너지/자원 EF02_자원탐사/개발/활용
    EF_에너지/자원 EF03_수화력발전
    EF_에너지/자원 EF04_송-배전계통
    EF_에너지/자원 EF05_전력IT
    EF_에너지/자원 EF06_신재생에너지
    EF_에너지/자원 EF07_가스에너지
    EG_원자력 EG01_원자로 노심 기술
    EG_원자력 EG02_원자로계통/핵심기기술
    EG_원자력 EG03_원자력 계측/제어기술
    EG_원자력 EG04_원자력안전기술
    EG_원자력 EG05_핵연료/원자력소재
    EG_원자력 EG06_핵연료주기/방사성 폐기물 관리기술
    EG_원자력 EG07_방사선기술
    EG_원자력 EG08_원자력기반/첨단기술
    EG_원자력 EG09_원전 건설/운영기술
    EG_원자력 EG10_핵융합
    EH_환경 EH01_대기질 관리
    EH_환경 EH02_물관리
    EH_환경 EH03_토양/지하수 복원/관리
    EH_환경 EH04_생태계 복원/관리
    EH_환경 EH05_소음/진동 관리
    EH_환경 EH06_해양환경
    EH_환경 EH07_폐기물 관리 및 자원순환
    EH_환경 EH08_위해성 평가 및 관리
    EH_환경 EH09_환경보건
    EH_환경 EH10_환경예측/감시/평가
    EH_환경 EH11_친환경 소재/제품
    EH_환경 EH12_친환경 공정
    EH_환경 EH13_측정분석장비/장치
    EH_환경 EH14_청정생산 및 설비
    EH_환경 EH15_작업환경기술
    EI_건설/교통 EI01_국토정책 및 계획
    EI_건설/교통 EI02_국토공간개발기술
    EI_건설/교통 EI03_시설물 설계 및 해석기술
    EI_건설/교통 EI04_건설시공 및 재료
    EI_건설/교통 EI05_도로교통기술
    EI_건설/교통 EI06_철도교통기술
    EI_건설/교통 EI07_항공교통기술
    EI_건설/교통 EI08_해양안전 및 교통기술
    EI_건설/교통 EI09_수공시스템기술
    EI_건설/교통 EI10_물류기술
    EI_건설/교통 EI11_시설물 안전 및 유지관리 기술
    EI_건설/교통 EI12_건설 환경설비 기술
    NB_물리학 NB01_입자/장물리
    NB_물리학 NB02_통계물리
    NB_물리학 NB03_원자핵 물리
    NB_물리학 NB04_유체/플라즈마
    NB_물리학 NB05_광학
    NB_물리학 NB06_응집 물질 물리
    NB_물리학 NB07_원자/분자물리
    NB_물리학 NB08_천체물리
    NB_물리학 NB09_복합물리
    NC_화학 NC01_물리화학
    NC_화학 NC02_유기화학
    NC_화학 NC03_무기화학
    NC_화학 NC04_분석화학
    NC_화학 NC05_고분자화학
    NC_화학 NC06_생화학
    NC_화학 NC07_광화학
    NC_화학 NC08_전기화학
    NC_화학 NC09_나노화학
    NC_화학 NC10_융합화학
    ND_지구과학(지구/대기/해양/천문) ND01_지질과학
    ND_지구과학(지구/대기/해양/천문) ND02_지구물리학
    ND_지구과학(지구/대기/해양/천문) ND03_지구화학
    ND_지구과학(지구/대기/해양/천문) ND04_대기과학
    ND_지구과학(지구/대기/해양/천문) ND05_기상과학
    ND_지구과학(지구/대기/해양/천문) ND06_기후학
    ND_지구과학(지구/대기/해양/천문) ND07_자연재해분석/예측
    ND_지구과학(지구/대기/해양/천문) ND08_해양과학
    ND_지구과학(지구/대기/해양/천문) ND09_해양자원
    ND_지구과학(지구/대기/해양/천문) ND10_해양생명
    ND_지구과학(지구/대기/해양/천문) ND11_극지과학
    ND_지구과학(지구/대기/해양/천문) ND12_천문학
    ND_지구과학(지구/대기/해양/천문) ND13_우주과학
    ND_지구과학(지구/대기/해양/천문) ND14_천문우주관측기술
    LA_생명과학 LA01_분자세포생물학
    LA_생명과학 LA02_유전학/유전공학
    LA_생명과학 LA03_발생/신경생물학
    LA_생명과학 LA04_면역학 및 생리학
    LA_생명과학 LA05_분류/생태/환경생물학
    LA_생명과학 LA06_생화학 및 구조생물학
    LA_생명과학 LA07_융합바이오
    LA_생명과학 LA08_생물공학
    LA_생명과학 LA09_산업바이오
    LA_생명과학 LA10_바이오공정/기기
    LA_생명과학 LA11_생물위해성
    LB_농림수산식품 LB01_식량작물과학
    LB_농림수산식품 LB02_원예특용작물과학
    LB_농림수산식품 LB03_농생물학/작물보호
    LB_농림수산식품 LB04_농화학
    LB_농림수산식품 LB05_농업환경생태
    LB_농림수산식품 LB06_동물자원과학
    LB_농림수산식품 LB07_수의과학
    LB_농림수산식품 LB08_농업기계/설비
    LB_농림수산식품 LB09_농업인프라 공학
    LB_농림수산식품 LB10_산림자원학
    LB_농림수산식품 LB11_조경학
    LB_농림수산식품 LB12_임산공학
    LB_농림수산식품 LB13_수산양식
    LB_농림수산식품 LB14_수산자원/어장환경
    LB_농림수산식품 LB15_어업생산/이용가공
    LB_농림수산식품 LB16_농수축산물 안전
    LB_농림수산식품 LB17_식품과학
    LB_농림수산식품 LB18_식품영양과학
    LB_농림수산식품 LB19_식품조리/외식/식생활 개선
    LB_농림수산식품 LB20_농림수산식품 경영/정보 등
    LC_보건의료 LC01_의생명과학
    LC_보건의료 LC02_임상의학
    LC_보건의료 LC03_의약품/의약품개발기술
    LC_보건의료 LC04_치료/진단기기
    LC_보건의료 LC05_기능복원/보조 및 복지기기
    LC_보건의료 LC06_의료정보 및 시스템
    LC_보건의료 LC07_한의과학
    LC_보건의료 LC08_보건학
    LC_보건의료 LC09_간호과학
    LC_보건의료 LC10_치의과학
    LC_보건의료 LC11_식품안전관리
    LC_보건의료 LC12_영양관리
    LC_보건의료 LC13_의약품안전관리
    LC_보건의료 LC14_의료기기안전관리
    LC_보건의료 LC15_독성 및 안전성관리 기반기술
    OA_뇌과학,뇌과학 OA01_뇌신경생물
    OA_뇌과학,뇌과학 OA02_뇌인지
    OA_뇌과학,뇌과학 OA03_뇌의약
    OA_뇌과학,뇌과학 OA04_뇌공학
    OB_인지/감성과학,인지/감성과학 OB01_인지과학
    OB_인지/감성과학 ,인지/감성과학 OB02_감성과학
  • 데이터셋 구축 담당자

    수행기관(주관) : 워트인텔리전스
    수행기관(주관)
    책임자명 전화번호 대표이메일 담당업무
    송완감 팀장 070-4919-5420 wgsong@wert.co.kr 과제수행책임
    수행기관(참여)
    수행기관(참여)
    기관명 담당업무
    특허법인 무한 품질 검증
    트위그팜 품질 검증, 크라우드 워커 관리
보건의료 데이터 개방 안내

보건의료 데이터는 온라인 및 오프라인 안심존을 통해 개방됩니다.

안심존이란 안심존 이용메뉴얼 안심존 이용신청
  • 인터넷과 물리적으로 분리된 온라인·오프라인 공간으로 의료 데이터를 포함하여 보안 조치가 요구되는 데이터를 다운로드 없이 접근하고 분석 가능
    * 온라인 안심존 : 보안이 보장된 온라인 네트워크를 통해 집, 연구실, 사무실 등 어디서나 접속하여 데이터에 접근하고 분석
    * 오프라인 안심존 : 추가적인 보안이 필요한 데이터를 대상으로 지정된 물리적 공간에서만 접속하여 데이터에 접근하고 분석

    1. AI 허브 접속
      신청자
    2. 안심존
      사용신청
      신청자신청서류 제출*
    3. 심사구축기관
    4. 승인구축기관
    5. 데이터 분석 활용신청자
    6. 분석모델반출신청자
  • 1. 기관생명윤리위원회(IRB) 심의 결과 통지서 [IRB 알아보기]
    2. 기관생명윤리위원회(IRB) 승인된 연구계획서
    3. 신청자 소속 증빙 서류 (재직증명서, 재학증명서, 근로계약서 등 택1)
    4. 안심존 이용 신청서 [다운로드]
    5. 보안서약서 [다운로드]
    ※ 상기 신청서 및 첨부 서류를 완비한 후 신청을 진행하셔야 정상적으로 절차가 이루어집니다.

  • 신청 및 이용관련 문의는 safezone1@aihub.kr 또는 02-525-7708, 7709로 문의

데이터셋 다운로드 승인이 완료 된 후 API 다운로드 서비스를 이용하실 수 있습니다.

API 다운로드 파일은 분할 압축되어 다운로드 됩니다. 분할 압축 해제를 위해서는 분할 압축 파일들의 병합이 필요하며 리눅스 명령어 사용이 필요합니다.

리눅스 OS 계열에서 다운로드 받으시길 권장하며 윈도우에서 파일 다운로드 시 wsl(리눅스용 윈도우 하위 시스템) 설치가 필요합니다.

※ 파일 병합 리눅스 명령어

find "폴더경로" -name "파일명.zip.part*" -print0 | sort -zt'.' -k2V | xargs -0 cat > "파일명.zip"

- 해당 명령어 실행 시, 실행 경로 위치에 병합 압축 파일이 생성됩니다.

- 병합된 파일 용량이 0일 경우, 제대로 병합이 되지 않은 상태이니 "폴더경로"가 제대로 입력되었는지 확인 부탁드립니다.

※ 데이터셋 소개 페이지에서 다운로드 버튼 클릭하여 승인이 필요합니다.