Open 데이터 국내·외 AI 개발을 위해 공개된 Open 데이터를 소개합니다.
KorPatBERT(Korean Patent BERT)는 한국특허정보원이 연구개발한 AI 언어모델입니다.
특허분야 한국어 자연어처리 문제 해결 및 특허산업분야의 지능정보화 인프라 마련을 위해 기존 Google BERT base 모델의 아키텍쳐를 기반으로 대용량 국내 특허문헌(약 406만건, 4억6천만 문장, 266억 토큰, 120GB)을 사전학습(pre-training)하였고, 무료로 제공하고 있습니다.16개 수집 샘플, 기술 정보가 포함되었습니다.
1000개 수집 샘플, 기술 정보가 포함된 Fox New Facebook 데이터셋입니다.
10000개 수집 샘플, 기술 정보가 포함된 트위터 데이터셋입니다.
4000개 수집 샘플, 기술 정보 등이 포함된 동물 이미지 데이터셋입니다.
인도의 모든 용감한 수상자들에 대한 철저한 데이터 세트입니다.
2021년 최고의 축구선수들이 어디 출신인지에 대한 지도입니다.
Comcast Telecom 문의 데이터셋
상파울루 FC 디스트리투스
Kaggle GrandMaster들의 계층과 나라 목록입니다.