콘텐츠로 건너뛰기 메뉴로 건너뛰기 푸터로 건너뛰기
데이터를 불러오고 있습니다
데이터를 저장하고 있습니다
공지사항
2023년 인공지능 학습용 데이터 베타버전 개방 안내
등록일 2024-06-26
조회수 11,634
첨부파일

[2023년 인공지능 학습용 데이터 베타버전 개방 안내]

안녕하세요, AI 허브입니다.
2023년 인공지능 학습용 데이터의 베타버전을 오픈합니다.

2023년 데이터 142종 중 141종이 개방되었습니다.
이 외 데이터는 7월 이후 점진적으로 개방될 예정이오니 많은 관심과 이용 부탁드립니다.

아울러, 데이터 접근성 향상을 위해 새롭게 추가 된 기능인 "오픈 API 다운로드(AI 허브 Shell 다운로드)"를 활용하시면

Linux 등 개발환경에서 바로 다운로드 받아 학습이 가능하오니 많은 이용 바랍니다.

 

[23년 인공지능 학습용 데이터 개방 목록]

※ 데이터명 클릭 시 해당 데이터 페이지로 이동됩니다.

  - 개방 데이터
  - 데이터 개방 예정

[한국어]
- 한국어 SNS 멀티턴 대화 데이터
- 동화 이해도 테스트를 위한 질의응답 쌍생성 데이터
- 법률안 검토 보고서 요약 데이터
- 국회 회의록 기반 지식 검색 데이터
- 국가기록물 대상 초거대AI 학습을 위한 말뭉치 데이터
- 초거대AI 헬스케어 질의응답 데이터
- k-culture 관광 콘텐츠 특화 일본어 말뭉치 데이터
- 기계번역기 평가 및 신규 말뭉치 구축 데이터

- 베트남어 말뭉치 데이터
- 라이브 스트리밍 영상 영어 통번역 데이터
- 라이브 스트리밍 영상 중국어 통번역 데이터
- 라이브 스트리밍 영상 일본어 통번역 데이터

- 다국어 일상대화 실시간 통번역 데이터
- 국제 학술대회용 전문분야 한영/영한 통번역 데이터

- 다국어 번역 품질 평가 데이터
- 전문분야(기술과학) 한국어 멀티세션 데이터
- 전문분야(사회과학) 한국어 멀티세션 데이터
- 일상대화 한국어 멀티세션 데이터

- 다양한 소음원에서의 Ground Truth 지식 정보 데이터
- 한국어 텍스트-비디오-사운드 데이터
- 음성인식에 의한 영상 요약 데이터
- 지식그래프-투-텍스트 데이터
- 한국어 다중 이벤트 추출 데이터
- AI 응답 결과에 대한 품질 평가 데이터
- 아동·청소년 상담 데이터
- 고령자 근현대 경험 기반 스토리 구술 데이터

- 한국어 성능이 개선된 초거대AI 언어모델 개발 및 데이터
- 인도네시아어 말뭉치 데이터
- 초거대 언어모델 신뢰성 벤치마크 데이터

[영상이미지]
- 안면 랜드마크 데이터
- 시나리오 기반 3D 표정 데이터

- 한국인 피부상태 측정 데이터
- 한국인 전신 및 포즈 데이터
- 차트 이미지-텍스트 쌍 데이터
- 표 이미지-텍스트 쌍 데이터
- 다중언어 OCR 데이터
- 한국형 텍스트-3D 객체 쌍 데이터
- 한국 전통 수묵 채색화 제작 데이터
- 의류 스케치-패턴 도면 쌍 데이터
- 음식 3D 데이터
- 가상 실내 공간 3D 합성데이터
- 교량 외관점검 입면정사 영상 데이터
- 낙상사고 위험 동작 영상-센서 쌍 데이터
- 양육 스트레스 상황 바이오 이미지 복합 데이터
- 음성 기반 3D 발화얼굴 데이터
- 일상생활 작업 및 명령수행 데이터(공간)
- 일상생활 작업 및 명령수행 데이터(물체)
- 일상생활 작업 및 명령수행 데이터(임무수행명령어)
- 유사상표 이미지 검색 서비스의 사용자 입력 이미지데이터

- 물체 조작 손 동작 3D 데이터
- 한국어 GQA 데이터

[헬스케어]
- 경추 CT 데이터
- 무릎 관절염 켈그렌-로렌스분류(K-L grade) 데이터
- 족부족관절 체중부하 CT 데이터
- 난소암 데이터
- 배아 이미지합성 데이터
- 내시경 이미지 합성 데이터
- 구강 이미지 합성 데이터
- 노인 정신건강 영상 데이터
- 뇌졸중 경과 관찰 데이터
- 비뇨기계 암 병리 이미지 데이터
- 약물유도 수면내시경 영상 데이터
- 소아청소년 심리검사 및 뇌영상 데이터

- 경동맥 혈관 CT 및 MRI 데이터
- 말초 혈관 초음파 데이터

[교통물류]
- 어선 조업 패턴 항적 데이터
- 열화상 카메라 융합 자율주행 데이터
- 생활도로 객체인식 자율주행 데이터
- 전국 도로시설물 영상정보 데이터
- 고해상도 도로노면 이미지 데이터 
- 특이 도로 환경 주행 데이터 (고도화)- 비포장 도로환경 주행 데이터
- 과수원 내 로봇 주행 데이터(포도, 감귤 류)
- 과수원 내 로봇 주행 데이터(사과, 배 류)
 

[재난안전환경]
- 건물 균열탐지 이미지(고도화)- SOC 시설물 균열패턴 이미지데이터
- 도로 지상시설물 안전관리를 위한 GPR 데이터
- 무인 플랜트 안전감시를 위한 데이터
- 스마트 제조시설 안전감시를 위한 데이터
- 자연기반 탄소흡수원 시계열 데이터
- 권역별 식생탄소 포집량 식별 데이터
- 선박·해양 플랜트 스마트 야드 안전 데이터
- 전기설비공사현장 위험상태 판단 데이터 
- 수변구역 변화탐지 데이터(한강유역)
- 수변구역 변화탐지 데이터(낙동강유역)
- 놀이기구 및 시설이용자 위험상황 인식 데이터
- 화학물질(유전독성) 유해성 예측 데이터
- 산업설비 전기화재 사고예방부분 방전 데이터
- 기반암 시추 시료를 이용한 암반 등급분류 데이터
- 하천유입 농축산계 비점오염원 이미지 데이터
- AI탑재 생체모방로봇을 활용한 상수도관 내외부 데이터
- 건설용 자갈 품질관리 데이터

- 어린이 보호구역 내 등하교 및 시설물 영상 데이터
- 위급상황 음성/음향 (고도화)- 119 지능형 신고접수 음성 인식 데이터
- 화재 발생 예측 영상 (고도화)- 영상 기반 화재 감시 및 발생 위치 탐지 데이터 
- 부산시 침수위험 복합 데이터
 

[농축수산]
- 식용곤충 사육 자동화 데이터
- 원예식물(화분류) 물주기(수분공급주기) 생육데이터
- 국내 재배 아열대·열대 병해충 데이터
- 꿀벌 질병진단 이미지 데이터
- 말(馬) 부위식별 및 이상상태 진단 이미지 데이터 
- 해조류 및 저서물질 초분광 영상 데이터
- 지능형 스마트 미꾸리 종자생산시스템 및 양식 데이터
- 해파리 초기 유생 데이터
- 경상북도 어류(북태평양연어) 지능형 양식생산 데이터구축
- 주요 화훼류 품질 데이터
- 양돈생체 에너지데이터

- 잔디 생육환경 다분광 이미지 데이터
 

[문화관광]
- 동화 삽화 생성 데이터
- 동화 줄거리 생성 데이터
- 전통한복 3D 데이터
- 관광 특화 말뭉치 데이터
- 만화·웹툰 생성 데이터
- 만화·웹툰 인물 및 장면 이미지 데이터
- 탈춤 동작 데이터 
- 한국 대중음악 루프 사운드 생성 데이터
- 관광 분야 이미지-텍스트쌍 데이터

- 국내 여행로그 데이터(수도권)
- 국내 여행로그 데이터(동부권)
- 국내 여행로그 데이터(서부권)

- 국내 여행로그 데이터(제주도 및 도서지역)
 

[교육]
- 진로문장 완성 검사 텍스트 데이터
- 학습태도 및 성향관찰 데이터
- 수학과목 자동풀이 데이터
- 수학과목 문제생성 데이터
- 공적 말하기 실습 및 평가 데이터

 

[로보틱스]
- 로봇 행동 데이터(3D 물건파지)
- 로봇 행동 데이터(소형객체파지)
- 로봇관점 주행영상(고도화) - 소셜내비게이션로봇주행

 

[제조]
- 건설기계 무인운행 데이터
- 배터리불량 이미지 데이터
- 부품 품질검사 영상 데이터(선박·해양플랜드) (고도화) 
- 창원지역 특화 산업 고도화 및 디지털 전환 촉진을 위한 용접AI
- 전기인프라 지능화를 위한 가전기기 전력 사용량 데이터

- 김치 생산공정별 비파괴 품질검사를 위한 데이터셋 구축
 

[지식재산]
- 한-중/한-일 특허 및 기술과학 분야 병렬 말뭉치 데이터
- 국가중점 기술 대응 특허 데이터

 

[법률]
- 국내법률 대상 다국어 번역 데이터
- 법률지식 기반 관계 데이터
- 법률/규정 텍스트 분석 데이터(고도화)- 상황에 따른 판례 데이터

 

[스포츠]
한국 씨름 동작 데이터
야구 주요 규칙 판정 영상 데이터
  

[금융]
- 금융분야 다국어 병렬 말뭉치 데이터
- 금융 합성데이터

   

  

※ 23년 안심존 및 일부 데이터는 별도의 데이터 신청 및 승인 절차에 따라 이용하실 수 있습니다.

2023년 인공지능 학습용 데이터 중 개방 데이터에 대한 문의는 AI 허브 사이트의 고객지원>문의하기의 문의 창구를 통해 의견을 주시기 바랍니다.
(23년 인공지능 학습용 개방 데이터 클릭 시 데이터 페이지 내 '문의하기' 버튼 클릭)

더욱 다양한 인공지능 학습용 데이터 개방을 통해 국내 인공지능 인프라 조성과 저변 확대 등에 기여할 수 있도록 노력하겠습니다.

 

감사합니다.

 

- AI 허브 개방 담당자