-
데이터 변경이력
데이터 변경이력 버전 일자 변경내용 비고 1.2 2024-04-25 데이터 추가 개방 Validation/라벨링데이터 1.1 2023-12-27 데이터 최종 개방 1.0 2023-07-31 데이터 개방(Beta Version) 데이터 히스토리
데이터 히스토리 일자 변경내용 비고 2024-04-12 AI모델 수정 소스코드 파일 추가 2024-01-24 산출물 전체 공개 소개
기술문서(특허)-국가과학기술표준분류는 연구기관/기업체, 정부부처/공공기관 등에서 R&D 정책 자료, 다각도 데이터 분석, 데이터 연계성, 다양한 통계 분석에 활용함으로써 다양한 수요자들이 활용할 수 있는 기술문서의 신규 가치 창출이 가능
구축목적
특허와 같은 기술 문서를 표준화되고, 법제화된 국가과학기술표준분류에 대응하여 매핑하고, 이를 통해 AI 모델을 학습함으로써 서로 다른 종류의 기술문서도 통일된 국가과학기술표준분류로 매핑하여 서로 연동시킴으로써 새로운 관점의 분석 결과를 도출하거나, 국가 R&D 관련 다양한 활동에 활용할 수 있음
-
메타데이터 구조표 데이터 영역 지식재산 데이터 유형 텍스트 데이터 형식 txt 데이터 출처 한국특허정보원(KIPRIS) 한국 공개/등록 데이터 라벨링 유형 텍스트 라벨링 형식 JSON 데이터 활용 서비스 문서 분류 서비스 데이터 구축년도/
데이터 구축량2022년/300,240건 -
1. 데이터 구축 규모
1. 데이터 구축 규모 구분 구축실적 데이터셋 과학기술표준분류 188개 (중분류) 라벨링 특허건수 300,240건 어노테이션 (중점과학기술분류) 300,240건 어노테이션 (6T 분류) 300,240건 -라벨링 데이터: 과학기술표준분류 17개 대분류, 188개 중분류에 대해 총 300,240건 구축
-각 건별로 중점과학기술분류 대분류 11개, 6T 분류의 6개 분류로 어노테이션 설정2. 데이터 분포 (과학기술표준분류의 중분류별 구축 건수)
2. 데이터 분포 (과학기술표준분류의 중분류별 구축 건수) 대분류 중분류 구축건수 EA_기계 EA01_측정표준/시험평가기술 1548 EA02_생산기반기술 1593 EA03_요소부품 1512 EA04_정밀생산기계 1520 EA05_로봇/자동화기계 1728 EA06_나노/마이크로기계시스템 2238 EA07_에너지/환경기계시스템 1928 EA08_산업/일반기계 1508 EA09_자동차/철도차량 1708 EA10_조선/해양시스템 1720 EA11_항공시스템 1620 EA12_우주발사체 1958 EA13_인공위성 1980 EA14_재난안전장비 1965 EA15_국방플랫폼 1394 EB_재료 EB01_금속재료 1457 EB02_세라믹재료 1581 EB03_고분자재료 1628 EB04_주조/용접/접합 1626 EB05_소성가공/분말 1671 EB06_열/표면처리 1667 EB07_분석/물성평가기술 1409 EB08_국방소재 1487 EC_화공 EC01_화학공정 1551 EC02_나노 화학공정기술 1664 EC03_고분자 공정기술 1627 EC04_생물화학 공정기술 1564 EC05_정밀화학 1541 EC06_화학제품 1621 EC07_섬유제조 1683 EC08_염색가공 1519 EC09_섬유제품 1660 EC10_화학공정 안전기술 1438 EC11_무기화생방/화력탄약 1616 ED_전기/전자 ED01_광응용기기 1569 ED02_반도체장비 1755 ED03_중전기기 1520 ED04_반도체소자 및 시스템 1686 ED05_전기전자부품 1581 ED06_가정용기기 및 전자응용기기 1735 ED07_계측기기 1614 ED08_영상/음향기기 1391 ED09_전지 1586 ED10_디스플레이 1933 ED11_무기센서 및 제어 1622 EE_정보/통신 EE01_정보 이론 1645 EE02_소프트웨어 1469 EE03_정보보호 1661 EE04_광대역 통합망 1531 EE05_위성/전파 1692 EE06_이동통신 2590 EE07_디지털방송 1672 EE08_홈네트워크 1513 EE09_RFID/USN 1583 EE10_U-컴퓨팅 1544 EE11_정보통신 모듈 및 부품 1665 EE12_ITS/텔레매틱스 1633 EE13_재난정보관리 1868 EE14_국방정보통신 1649 EF_에너지/자원 EF01_온실가스 처리 1548 EF02_자원탐사/개발/활용 1609 EF03_수화력발전 1660 EF04_송-배전계통 1754 EF05_전력IT 1429 EF06_신재생에너지 1927 EF07_가스에너지 1520 EG_원자력 EG01_원자로 노심 기술 1718 EG02_원자로계통/핵심기기술 1548 EG03_원자력 계측/제어기술 1457 EG04_원자력안전기술 1671 EG05_핵연료/원자력소재 1527 EG06_핵연료주기/방사성 폐기물 관리기술 1494 EG07_방사선기술 1805 EG08_원자력기반/첨단기술 1568 EG09_원전 건설/운영기술 1326 EG10_핵융합 1385 EH_환경 EH01_대기질 관리 1980 EH02_물관리 1906 EH03_토양/지하수 복원/관리 1527 EH04_생태계 복원/관리 1266 EH05_소음/진동 관리 1513 EH06_해양환경 1828 EH07_폐기물 관리 및 자원순환 1571 EH08_위해성 평가 및 관리 1623 EH09_환경보건 1377 EH10_환경예측/감시/평가 1315 EH11_친환경 소재/제품 1644 EH12_친환경 공정 1301 EH13_측정분석장비/장치 1542 EH14_청정생산 및 설비 1784 EH15_작업환경기술 1372 EI_건설/교통 EI01_국토정책 및 계획 1389 EI02_국토공간개발기술 1268 EI03_시설물 설계 및 해석기술 1316 EI04_건설시공 및 재료 1758 EI05_도로교통기술 1697 EI06_철도교통기술 1775 EI07_항공교통기술 1734 EI08_해양안전 및 교통기술 1628 EI09_수공시스템기술 1430 EI10_물류기술 1722 EI11_시설물 안전 및 유지관리 기술 1590 EI12_건설 환경설비 기술 1492 NB_물리학 NB01_입자/장물리 1517 NB02_통계물리 1607 NB03_원자핵 물리 1068 NB04_유체/플라즈마 1676 NB05_광학 1870 NB06_응집 물질 물리 1476 NB07_원자/분자물리 1959 NB08_천체물리 882 NB09_복합물리 1722 NC_화학 NC01_물리화학 1502 NC02_유기화학 1605 NC03_무기화학 1432 NC04_분석화학 1458 NC05_고분자화학 1643 NC06_생화학 1581 NC07_광화학 1710 NC08_전기화학 1515 NC09_나노화학 1619 NC10_융합화학 1488 ND_지구과학(지구/대기/해양/천문) ND01_지질과학 1505 ND02_지구물리학 1929 ND03_지구화학 1959 ND04_대기과학 1900 ND05_기상과학 1942 ND06_기후학 1822 ND07_자연재해분석/예측 1676 ND08_해양과학 1434 ND09_해양자원 1463 ND10_해양생명 1675 ND11_극지과학 1301 ND12_천문학 507 ND13_우주과학 1001 ND14_천문우주관측기술 1078 LA_생명과학 LA01_분자세포생물학 1518 LA02_유전학/유전공학 1697 LA03_발생/신경생물학 1546 LA04_면역학 및 생리학 1527 LA05_분류/생태/환경생물학 1383 LA06_생화학 및 구조생물학 1653 LA07_융합바이오 1717 LA08_생물공학 1610 LA09_산업바이오 1747 LA10_바이오공정/기기 1767 LA11_생물위해성 1394 LB_농림수산식품 LB01_식량작물과학 1392 LB02_원예특용작물과학 1525 LB03_농생물학/작물보호 1763 LB04_농화학 1609 LB05_농업환경생태 1658 LB06_동물자원과학 1457 LB07_수의과학 1748 LB08_농업기계/설비 1743 LB09_농업인프라 공학 1448 LB10_산림자원학 1761 LB11_조경학 1542 LB12_임산공학 1724 LB13_수산양식 1581 LB14_수산자원/어장환경 1634 LB15_어업생산/이용가공 1500 LB16_농수축산물 안전 1516 LB17_식품과학 1538 LB18_식품영양과학 1565 LB19_식품조리/외식/식생활 개선 1779 LB20_농림수산식품 경영/정보 등 1286 LC_보건의료 LC01_의생명과학 1417 LC02_임상의학 1524 LC03_의약품/의약품개발기술 1707 LC04_치료/진단기기 1585 LC05_기능복원/보조 및 복지기기 1545 LC06_의료정보 및 시스템 1866 LC07_한의과학 1495 LC08_보건학 1586 LC09_간호과학 1393 LC10_치의과학 1688 LC11_식품안전관리 1622 LC12_영양관리 1639 LC13_의약품안전관리 1547 LC14_의료기기안전관리 1645 LC15_독성 및 안전성관리 기반기술 1656 OA_뇌과학,뇌과학 OA01_뇌신경생물 1544 OA02_뇌인지 1515 OA03_뇌의약 1746 OA04_뇌공학 1576 OB_인지/감성과학 ,인지/감성과학 OB01_인지과학 1611 OB02_감성과학 1552 합계 300240 과학기술표준분류 대분류별 구성비 과학기술표준분류
대분류별 구성비
기계 8% 재료 4% 화공 6% 전기/전자 6% 정보통신 8% 에너지/자원 4% 원자력 5% 환경 8% 건설/교통 6% 물리학 5% 화학 5% 지구과학 7% 생명과학 6% 농림수산식품 11% 보건의료 8% 뇌과학 2% 인지/감성과학 1% -
-
AI 모델 상세 설명서 다운로드
AI 모델 상세 설명서 다운로드 AI 모델 다운로드1. 데이터 활용
데이터 명 과학기술표준분류 대응 특허 데이터 학습 모델 과학기술표준분류 매핑 모델 모델 BERT 성능 지표 F1-score 개발 내용 구축되는 학습 데이터를 활용하여 BERT 모델로 과학기술표준분류 188개 중분류에 대한 특허 데이터의 속성, 데이터 내용을 학습한 후, 새롭게 입력되는 특허 데이터들을 과학기술표준분류 중분류에 매핑하여 도출함 응용서비스
(예시 및 유의사항)-과학기술표준분류에 매핑된 특허 데이터를 통해 빅데이터 분석이 가능함 -국가연구소, 대학교 연구자들의 연구 성과에 대한 통계 분석이 가능함 -R&D 연구 개발 주제와 관련된 과학기술분야에 속하는 특허 데이터로부터 다양한 아이디어 및 해결 방안 도출이 가능함 2. 활용 AI모델의 유효성 검증
2. 활용 AI모델의 유효성 검증 유효성 항목 및 지표 항목명 특허 분류의 유효성 (과학기술표준분류 중분류 대상) 임무 분류(Classification) 지표 F1-Score 측정 산식 2*(Precision*Recall)/(Precision+Recall) HW 사양 구성방식 로컬서버 CPU AMD Ryzen 7 3700X 8-Core Processor Memory 64GB GPU GeForce RTX 2080ti Storage 6TB HDD OS CentOS Linux release 7.8.2003 알고리즘 및 학습 조건 개발 언어 Python 3.7.4 프레임워크 CUDA 11.0, Pytorch 1.4.0 알고리즘 BERT (한글 KoBert 기반 cls) 학습조건 epoch = 20, batch = 32, optimizer, loss, iteration 등 loss func = Focalloss(alpha=0.25) 데이터셋 분할 • 학습용 데이터셋: 29425 / 80% (수량, 비율) • 검증용 데이터셋: 3269 / 10% • 평가용 데이터셋: 3270 / 10% 구축목표 총 데이터 수량 대비 비율 구축 목표 총 데이터 수 : 300,000 초기 데이터 : 32,695 구축 비율 : 약 10.9% 3. 응용 서비스
(1) 특허 데이터 맵핑 데이터 도출-국가과학기술표준분류는 논문, 특허, 학술지, 연구자료, 전문분야 정보, 통계 및 분석 정보, 학술지 출판 및 배포à전문 정보 및 데이터 수집/검색/관리/활용에 활용되고 있음. 이외에도, 국가 R&D 정보, 지식 정보의 공유, 협업, 인프라 자원 이용, 기술 및 산업분석 활용, 과학 기술 동향 파악, 교육 및 행사 등에서 활용되고 있음
- AI 학습 데이터를 통해 AI모델을 구축함으로써, 특허와 논문과 같은 기술 분류를 보다 정확하고 신속하게 고품질의 기술문서-국가과학기술표준분류의 매핑 데이터가 도출 될 수 있음.
-기술문서(특허)-국가과학기술표준분류는 연구기관/기업체, 정부부처/공공기관 등에서 R&D 정책 자료, 다각도 데이터 분석, 데이터 연계성, 다양한 통계 분석에 활용함으로써 다양한 수요자들이 활용할 수 있는 기술문서의 신규 가치 창출이 가능할 것으로 기대됨.
3. 응용서비스 개발
• 특허 자동분류 AI모델에 활용
- 과학기술표준분류에 따른 특허문헌데이터의 특징(Feature)을 학습한 AI모델은 다양한 특허문헌의 주요 텍스트 항목을 기반으로, 과학기술분야를 자동으로 매핑해줄 수 있음. 이 AI 모델은, 특허문헌의 분류뿐만 아니라, 검색과 분석에서의 편의성 그리고 기업/기관별로 산업분야 맞춤형 특허정보 활용이 가능해짐
• 과학기술표준분류별 국가 R&D 전략수립
- 위 과학기술표준분류 대응 특허 데이터 AI모델을 이용하면, 과학기술표준분류별 특허DB를 실시간으로 업데이트가 가능하여, 국가 과학 기술 발전을 목적으로 한 R&D 전략수립의 기초 분석데이터로 활용이 가능함
• AI번역 등의 과학기술표준분류별 학습텍스트 데이터셋으로 타 분야에 AI에 활용
- AI번역 엔진의 학습데이터로 다양한 텍스트데이터가 사용되고 있는데, 과학기술 관련 번역의 경우에는 과학기술표준분류별로 동일한 용어가 다른 의미로 사용되어 번역품질을 높이는데 한계가 있음. 이러한 한계를, 과학기술별로 매핑된 특허문헌정보를 학습데이터셋으로 활용함으로서 극복할 수 있을 것임
• 특허도면정보 활용 과학기술표준분류별 이미지 데이터셋으로 타 분야 AI에 활용
- 특허는 텍스트정보 뿐만 아니라, 도면이미지정보를 같이 포함하고 있음. 과학기술표준분류별로 특허문헌정보가 매핑된 데이터가 구축되면, 이미지와 과학기술표준분류도 동시에 매핑된 데이터가 생성될 수 있음. 최근 주관기관인 워트인텔리전스가 국내최초로 런칭한 AI도면인식 모델을 이용하면 도면 하나하나의 이미지별로도 과학기술표준분류 태깅이 가능하므로 보다 정교한 이미지-과학기술표준분류 데이터셋으로 활용될 수 있음
• 특허빅데이터를 활용한 혁신산업 및 서비스 창출에 활용
- 최근 최신 기술트랜드를 특허빅데이터로 분석하는 것이 시장에서 확산되고 있는 바, 이런한 특허빅데이터 분석에 과학기술표준분류정보가 더 해진다면, 특허데이터를 기반으로 각 과학기술에 대한 새로운 혁신기술군을 발굴할 수 있으며, 이러한 발굴 등을 위한 시스템 등으로 다양하게 활용될 수 있음
- 국가과학기술표준분류의 중분류 단위로 특허문헌을 매칭하는 작업을 수행함으로써, 기술 문서의 중요한 예시 중 하나인 특허데이터를 국가과학기술표준분류에 매칭하고, 이를 다른 종류의 기술 문서에도 확장하기 위한 AI 모델을 학습하기 위한 학습데이터를 구축하는 과제임. 하기와 같은 플로우로 라벨링 과정을 거쳐 실제 AI 특허분류모델로 검증하고 그 결과물을 국민들이 쉽게 활용할 수 있도록 제공하고자 함
-
데이터 성능 점수
측정값 (%)기준값 (%)데이터 성능 지표
데이터 성능 지표 번호 측정항목 AI TASK 학습모델 지표명 기준값 점수 측정값 점수 1 과학기술표준분류 분류성능 Text Classification BERT (한글 KoBert 기반 cls) F1-Score 0.8 점 0.8249 점
※ 데이터 성능 지표가 여러 개일 경우 각 항목을 클릭하면 해당 지표의 값이 그래프에 표기됩니다.
※ AI모델 평가 지표에 따라 측정값의 범위, 판단 기준이 달라질 수 있습니다. (ex. 오류율의 경우, 낮을수록 좋은 성능을 내는 것으로 평가됩니다)
-
설명서 및 활용가이드 다운로드
데이터 설명서 다운로드 구축활용가이드 다운로드구분 획득(수집) 단계 정제 단계 가공(라벨링) 단계 데이터 구분 원시데이터 원천데이터 최종데이터 데이터 형태 텍스트: 명칭, 요약, 발명의 상세한 설명, 청구항 텍스트: 명칭, 요약, 발명의 상세한 설명, 청구항 텍스트: docID, 문헌타입, 과학기술표준분류 대분류/중분류, 키워트(6T분류, 국가중점기술분류) 이미지: 도면 이미지: 도면 데이터 포멧 SGML, XML(ST36/ST96), PDF, JPG, TXT SGML, XML(ST36/ST96), PDF, JPG, TXT json <라벨링 데이터의 구성 요소>
<라벨링 데이터의 구성 요소> 구분 속성명 타입 필수여부 설명 1 dataset 1-1 updateDate string Y 데이터생성일 1-2 documentId string Y 문헌키 1-3 country_code string Y 국가코드 1-4 application_number string Y 출원번호 1-5 document_type string Y 문헌타입 (특허, 실용신안, 공개, 등록 구분) 1-6 ipc_main string Y 메인 IPC 1-7 Lno string Y 과학기술표준분류 대분류코드 1-8 Ltext string Y 과학기술표준분류 대분류설명 1-9 Mno string Y 과학기술표준분류 중분류코드 1-10 Mtext string Y 과학기술표준분류 중분류명칭 1-11 keyword string Y 키워드 (태그: 6T 분류 / 국가중점기술분류 대분류) <데이터 포맷 예시>
<과학기술표준분류 중분류 리스트>
<과학기술표준분류 중분류 리스트> 대분류 중분류 EA_기계 EA01_측정표준/시험평가기술 EA_기계 EA02_생산기반기술 EA_기계 EA03_요소부품 EA_기계 EA04_정밀생산기계 EA_기계 EA05_로봇/자동화기계 EA_기계 EA06_나노/마이크로기계시스템 EA_기계 EA07_에너지/환경기계시스템 EA_기계 EA08_산업/일반기계 EA_기계 EA09_자동차/철도차량 EA_기계 EA10_조선/해양시스템 EA_기계 EA11_항공시스템 EA_기계 EA12_우주발사체 EA_기계 EA13_인공위성 EA_기계 EA14_재난안전장비 EA_기계 EA15_국방플랫폼 EB_재료 EB01_금속재료 EB_재료 EB02_세라믹재료 EB_재료 EB03_고분자재료 EB_재료 EB04_주조/용접/접합 EB_재료 EB05_소성가공/분말 EB_재료 EB06_열/표면처리 EB_재료 EB07_분석/물성평가기술 EB_재료 EB08_국방소재 EC_화공 EC01_화학공정 EC_화공 EC02_나노 화학공정기술 EC_화공 EC03_고분자 공정기술 EC_화공 EC04_생물화학 공정기술 EC_화공 EC05_정밀화학 EC_화공 EC06_화학제품 EC_화공 EC07_섬유제조 EC_화공 EC08_염색가공 EC_화공 EC09_섬유제품 EC_화공 EC10_화학공정 안전기술 EC_화공 EC11_무기화생방/화력탄약 ED_전기/전자 ED01_광응용기기 ED_전기/전자 ED02_반도체장비 ED_전기/전자 ED03_중전기기 ED_전기/전자 ED04_반도체소자 및 시스템 ED_전기/전자 ED05_전기전자부품 ED_전기/전자 ED06_가정용기기 및 전자응용기기 ED_전기/전자 ED07_계측기기 ED_전기/전자 ED08_영상/음향기기 ED_전기/전자 ED09_전지 ED_전기/전자 ED10_디스플레이 ED_전기/전자 ED11_무기센서 및 제어 EE_정보/통신 EE01_정보 이론 EE_정보/통신 EE02_소프트웨어 EE_정보/통신 EE03_정보보호 EE_정보/통신 EE04_광대역 통합망 EE_정보/통신 EE05_위성/전파 EE_정보/통신 EE06_이동통신 EE_정보/통신 EE07_디지털방송 EE_정보/통신 EE08_홈네트워크 EE_정보/통신 EE09_RFID/USN EE_정보/통신 EE10_U-컴퓨팅 EE_정보/통신 EE11_정보통신 모듈 및 부품 EE_정보/통신 EE12_ITS/텔레매틱스 EE_정보/통신 EE13_재난정보관리 EE_정보/통신 EE14_국방정보통신 EF_에너지/자원 EF01_온실가스 처리 EF_에너지/자원 EF02_자원탐사/개발/활용 EF_에너지/자원 EF03_수화력발전 EF_에너지/자원 EF04_송-배전계통 EF_에너지/자원 EF05_전력IT EF_에너지/자원 EF06_신재생에너지 EF_에너지/자원 EF07_가스에너지 EG_원자력 EG01_원자로 노심 기술 EG_원자력 EG02_원자로계통/핵심기기술 EG_원자력 EG03_원자력 계측/제어기술 EG_원자력 EG04_원자력안전기술 EG_원자력 EG05_핵연료/원자력소재 EG_원자력 EG06_핵연료주기/방사성 폐기물 관리기술 EG_원자력 EG07_방사선기술 EG_원자력 EG08_원자력기반/첨단기술 EG_원자력 EG09_원전 건설/운영기술 EG_원자력 EG10_핵융합 EH_환경 EH01_대기질 관리 EH_환경 EH02_물관리 EH_환경 EH03_토양/지하수 복원/관리 EH_환경 EH04_생태계 복원/관리 EH_환경 EH05_소음/진동 관리 EH_환경 EH06_해양환경 EH_환경 EH07_폐기물 관리 및 자원순환 EH_환경 EH08_위해성 평가 및 관리 EH_환경 EH09_환경보건 EH_환경 EH10_환경예측/감시/평가 EH_환경 EH11_친환경 소재/제품 EH_환경 EH12_친환경 공정 EH_환경 EH13_측정분석장비/장치 EH_환경 EH14_청정생산 및 설비 EH_환경 EH15_작업환경기술 EI_건설/교통 EI01_국토정책 및 계획 EI_건설/교통 EI02_국토공간개발기술 EI_건설/교통 EI03_시설물 설계 및 해석기술 EI_건설/교통 EI04_건설시공 및 재료 EI_건설/교통 EI05_도로교통기술 EI_건설/교통 EI06_철도교통기술 EI_건설/교통 EI07_항공교통기술 EI_건설/교통 EI08_해양안전 및 교통기술 EI_건설/교통 EI09_수공시스템기술 EI_건설/교통 EI10_물류기술 EI_건설/교통 EI11_시설물 안전 및 유지관리 기술 EI_건설/교통 EI12_건설 환경설비 기술 NB_물리학 NB01_입자/장물리 NB_물리학 NB02_통계물리 NB_물리학 NB03_원자핵 물리 NB_물리학 NB04_유체/플라즈마 NB_물리학 NB05_광학 NB_물리학 NB06_응집 물질 물리 NB_물리학 NB07_원자/분자물리 NB_물리학 NB08_천체물리 NB_물리학 NB09_복합물리 NC_화학 NC01_물리화학 NC_화학 NC02_유기화학 NC_화학 NC03_무기화학 NC_화학 NC04_분석화학 NC_화학 NC05_고분자화학 NC_화학 NC06_생화학 NC_화학 NC07_광화학 NC_화학 NC08_전기화학 NC_화학 NC09_나노화학 NC_화학 NC10_융합화학 ND_지구과학(지구/대기/해양/천문) ND01_지질과학 ND_지구과학(지구/대기/해양/천문) ND02_지구물리학 ND_지구과학(지구/대기/해양/천문) ND03_지구화학 ND_지구과학(지구/대기/해양/천문) ND04_대기과학 ND_지구과학(지구/대기/해양/천문) ND05_기상과학 ND_지구과학(지구/대기/해양/천문) ND06_기후학 ND_지구과학(지구/대기/해양/천문) ND07_자연재해분석/예측 ND_지구과학(지구/대기/해양/천문) ND08_해양과학 ND_지구과학(지구/대기/해양/천문) ND09_해양자원 ND_지구과학(지구/대기/해양/천문) ND10_해양생명 ND_지구과학(지구/대기/해양/천문) ND11_극지과학 ND_지구과학(지구/대기/해양/천문) ND12_천문학 ND_지구과학(지구/대기/해양/천문) ND13_우주과학 ND_지구과학(지구/대기/해양/천문) ND14_천문우주관측기술 LA_생명과학 LA01_분자세포생물학 LA_생명과학 LA02_유전학/유전공학 LA_생명과학 LA03_발생/신경생물학 LA_생명과학 LA04_면역학 및 생리학 LA_생명과학 LA05_분류/생태/환경생물학 LA_생명과학 LA06_생화학 및 구조생물학 LA_생명과학 LA07_융합바이오 LA_생명과학 LA08_생물공학 LA_생명과학 LA09_산업바이오 LA_생명과학 LA10_바이오공정/기기 LA_생명과학 LA11_생물위해성 LB_농림수산식품 LB01_식량작물과학 LB_농림수산식품 LB02_원예특용작물과학 LB_농림수산식품 LB03_농생물학/작물보호 LB_농림수산식품 LB04_농화학 LB_농림수산식품 LB05_농업환경생태 LB_농림수산식품 LB06_동물자원과학 LB_농림수산식품 LB07_수의과학 LB_농림수산식품 LB08_농업기계/설비 LB_농림수산식품 LB09_농업인프라 공학 LB_농림수산식품 LB10_산림자원학 LB_농림수산식품 LB11_조경학 LB_농림수산식품 LB12_임산공학 LB_농림수산식품 LB13_수산양식 LB_농림수산식품 LB14_수산자원/어장환경 LB_농림수산식품 LB15_어업생산/이용가공 LB_농림수산식품 LB16_농수축산물 안전 LB_농림수산식품 LB17_식품과학 LB_농림수산식품 LB18_식품영양과학 LB_농림수산식품 LB19_식품조리/외식/식생활 개선 LB_농림수산식품 LB20_농림수산식품 경영/정보 등 LC_보건의료 LC01_의생명과학 LC_보건의료 LC02_임상의학 LC_보건의료 LC03_의약품/의약품개발기술 LC_보건의료 LC04_치료/진단기기 LC_보건의료 LC05_기능복원/보조 및 복지기기 LC_보건의료 LC06_의료정보 및 시스템 LC_보건의료 LC07_한의과학 LC_보건의료 LC08_보건학 LC_보건의료 LC09_간호과학 LC_보건의료 LC10_치의과학 LC_보건의료 LC11_식품안전관리 LC_보건의료 LC12_영양관리 LC_보건의료 LC13_의약품안전관리 LC_보건의료 LC14_의료기기안전관리 LC_보건의료 LC15_독성 및 안전성관리 기반기술 OA_뇌과학,뇌과학 OA01_뇌신경생물 OA_뇌과학,뇌과학 OA02_뇌인지 OA_뇌과학,뇌과학 OA03_뇌의약 OA_뇌과학,뇌과학 OA04_뇌공학 OB_인지/감성과학,인지/감성과학 OB01_인지과학 OB_인지/감성과학 ,인지/감성과학 OB02_감성과학 -
데이터셋 구축 담당자
수행기관(주관) : 워트인텔리전스
수행기관(주관) 책임자명 전화번호 대표이메일 담당업무 송완감 팀장 070-4919-5420 wgsong@wert.co.kr 과제수행책임 수행기관(참여)
수행기관(참여) 기관명 담당업무 특허법인 무한 품질 검증 트위그팜 품질 검증, 크라우드 워커 관리
-
인터넷과 물리적으로 분리된 온라인·오프라인 공간으로 의료 데이터를 포함하여 보안 조치가 요구되는 데이터를 다운로드 없이 접근하고 분석 가능
* 온라인 안심존 : 보안이 보장된 온라인 네트워크를 통해 집, 연구실, 사무실 등 어디서나 접속하여 데이터에 접근하고 분석
* 오프라인 안심존 : 추가적인 보안이 필요한 데이터를 대상으로 지정된 물리적 공간에서만 접속하여 데이터에 접근하고 분석 -
- AI 허브 접속
신청자 - 안심존
사용신청신청자신청서류 제출* - 심사구축기관
- 승인구축기관
- 데이터 분석 활용신청자
- 분석모델반출신청자
- AI 허브 접속
-
1. 기관생명윤리위원회(IRB) 심의 결과 통지서 [IRB 알아보기] [공용IRB 심의신청 가이드라인]
2. 기관생명윤리위원회(IRB) 승인된 연구계획서
3. 신청자 소속 증빙 서류 (재직증명서, 재학증명서, 근로계약서 등 택1)
4. 안심존 이용 신청서 [다운로드]
5. 보안서약서 [다운로드]
※ 상기 신청서 및 첨부 서류를 완비한 후 신청을 진행하셔야 정상적으로 절차가 이루어집니다. -
신청 및 이용관련 문의는 safezone1@aihub.kr 또는 02-525-7708, 7709로 문의
데이터셋 다운로드 승인이 완료 된 후 API 다운로드 서비스를 이용하실 수 있습니다.
API 다운로드 파일은 분할 압축되어 다운로드 됩니다. 분할 압축 해제를 위해서는 분할 압축 파일들의 병합이 필요하며 리눅스 명령어 사용이 필요합니다.
리눅스 OS 계열에서 다운로드 받으시길 권장하며 윈도우에서 파일 다운로드 시 wsl(리눅스용 윈도우 하위 시스템) 설치가 필요합니다.
※ 파일 병합 리눅스 명령어
find "폴더경로" -name "파일명.zip.part*" -print0 | sort -zt'.' -k2V | xargs -0 cat > "파일명.zip"
- 해당 명령어 실행 시, 실행 경로 위치에 병합 압축 파일이 생성됩니다.
- 병합된 파일 용량이 0일 경우, 제대로 병합이 되지 않은 상태이니 "폴더경로"가 제대로 입력되었는지 확인 부탁드립니다.
※ 데이터셋 소개 페이지에서 다운로드 버튼 클릭하여 승인이 필요합니다.
오프라인 데이터 이용 안내
본 데이터는 K-ICT 빅데이터센터에서도 이용하실 수 있습니다.
다양한 데이터(미개방 데이터 포함)를 분석할 수 있는 오프라인 분석공간을 제공하고 있습니다.
데이터 안심구역 이용절차 및 신청은 K-ICT빅데이터센터 홈페이지를 참고하시기 바랍니다.