콘텐츠로 건너뛰기 메뉴로 건너뛰기 푸터로 건너뛰기
데이터를 불러오고 있습니다
데이터를 저장하고 있습니다
공지사항
2022년 인공지능 학습용 데이터 정식개방 안내
등록일 2023-10-31
조회수 9,991
첨부파일

안녕하세요. AI 허브 입니다.

 

그간 BETA 개방한 “2022년 인공지능 학습용 데이터(319종)”의 접수된 의견 반영에 따른 품질 보완과 민감정보 비식별화 재점검 등으로 인해 점진적으로 최종 데이터를 오픈하고 있습니다.
10월 31부터 매주 순차적으로 최종 데이터를 공개할 예정이니 많은 관심과 이용 부탁드립니다.

아울러 데이터 접근성 향상을 위해 새롭게 추가 된 기능인 “오픈 API 다운로드(AI 허브 Shell 다운로드)”를 활용하시면 Linux 등 개발환경에서 바로 다운로드 받아 학습이 가능하오니 많은 이용 바랍니다.

 

[22년 인공지능 학습용 데이터 개방 목록]

※데이터명 클릭 시 해당 데이터 페이지로 이동됩니다.
 

1. 패션 액세서리 착용 데이터
2. 연도별 패션 선호도 파악 및 추천 데이터
3. 쉐이프리스 의류 및 포즈 데이터
4. 의류 디자인 패턴 데이터
5. 동일 객체 인식 오류 방지 데이터
6. OCR 데이터(금융 및 물류)
7. 훼손 및 블러링 데이터
8. 방송콘텐츠 한국어-영어 번역 말뭉치
9. 방송콘텐츠 한국어-유럽어 번역 말뭉치
10. 교육용 유럽어 모국어 사용자의 한국어 음성 데이터
11. 교육용 중·일어 모국어 사용자의 한국어 음성 데이터
12. 교육용 아시아어(중·일어 제외) 사용자의 한국어 음성 데이터
13. 안면 인식 에이징(aging) 이미지 데이터
14. 식생 탄소 포집량 식별 데이터
15. X-ray 다중 객체 인식 데이터
16. 픽셀 단위 장면 인지 멀티모달 데이터
17. 
AI기반 국립공원 변화탐지 모니터링 플랫폼 구축
18. 교육용 한국인의 중국어·일본어 음성 데이터
19. 발화유형(문어/구어/채팅)별 기계번역 병렬 말뭉치
20. 규칙 기반 상황 인지 및 행동 예측 이미지 데이터
21. 명령어 인식을 위한 소음 환경 데이터
22. 금융, 법률 문서 기계독해 데이터
23. 자전거도로 주행 데이터
24. OCR 데이터(교육)
25. OCR 데이터(옛한글)
26. 해조류 종자생산(김) 데이터
27. 중·노년층 한국어 방언 데이터(강원도, 경상도)
28. 중·노년층 한국어 방언 데이터(충청도, 전라도, 제주도)
29. 한국어 멀티세션 대화
30. 추상 요약 사실성 검증 데이터
31. 시간 표현 탐지 데이터
32. 소셜로봇 고객응대 데이터
33. 전시 공연 도슨트 데이터
34. 방송콘텐츠 대화체 음성인식 데이터
35. 한국어-다국어(영어 제외) 번역 말뭉치(기술과학)
36. 한국어-다국어 번역 말뭉치(기초과학)
37. 한국어-다국어 번역 말뭉치(인문학)
38. 주요질환 이미지 합성데이터(X-ray)
39. 주요질환 이미지 합성데이터(CT)
40. 주요질환 이미지 합성데이터(MRI)
41. 전문분야 심층인터뷰 데이터
42. 시설작물(딸기) 개체 이미지 및 시설작물(딸기) 질병 이미지
43. 문장 유형(추론, 예측 등) 판단 데이터
44. 응급실 임상 대화 데이터
45. 메타버스 캐릭터 모션 리타게팅 데이터
46. SNS 데이터 고도화

47. 비디오 전환 경계 추론 데이터
48. 의류 통합 데이터(착용 이미지, 치수 및 원단 정보)
49. 비동일 객체 인식 오류 방지 데이터
50. 
유사성 기반 추론 데이터
51. 저조도 환경 데이터
52. 
소아청소년 심리검사 및 뇌영상 데이터
53. 교육용 한국인의 외국어(영·중·일 제외) 음성 데이터
54. 교육용 영어 모국어 사용자의 한국어 음성 데이터
55. 뉴스 대본 및 앵커 음성 데이터
56. 바이오․의료 논문 간 연계 분석 데이터
57. 전력신사업을 위한 전라남도 지역 전력소비패턴 데이터 구축
58. 객체 인식용 한국형 비전 데이터
59. 이미지 설명문 추출 및 생성용 한국형 비전 데이터
60. 규칙 기반 집단행동 인식 비디오 데이터
61. 한국 전통 수묵화 화풍별 제작 데이터
62. 자가 수면 검사 데이터
63. 구음장애인 명령어 데이터
64. 저해상도 라이다의 해상도 개선을 위한 Point-cloud Super-resolution 데이터
65. 배드민턴 동작 및 경기영상 데이터
66. 실내(편의점, 매장) 사람 이상행동 데이터
67. 주요 화훼류 품질 데이터
68. 국내 여행로그 데이터(수도권)
69. 악천후 환경에서의 라이다 점 군 데이터 개선을 위한 Denoising 데이터
70. 실내 자율주차용 데이터
71. 대형시설 실내·인접 자율 배송 데이터
72. 지하수 수량·수질 데이터
73. 상수원-취수원 통합 수질 및 녹조 데이터
74. 실내(편의점, 매장) 구매 행동 데이터
75. 3D 지표투과레이더 탐사 데이터
76. 해외상표 이미지 AI 데이터
77. 토지피복지도 항공위성 이미지
78. 개체 레벨 인식 (Instance level recognition, ILR) 데이터
79. OCR 데이터(공공)
80. 방송콘텐츠 한국어-영어 통·번역 음성 데이터
81. 페르소나 대화
82. 지식검색 대화
83. 공감형 대화
84. 승용 자율주행차 주간 도심도로 데이터
85. 승용 자율주행차 야간 도심도로 데이터
86. 승용 자율주행차 주간 자동차 전용도로 데이터
87. 승용 자율주행차 야간 자동차 전용도로 데이터
88. 의료, 법률 전문 서적 말뭉치
89. 대화·발표 동작 모션캡처 데이터
90. 재활용품 분류 및 선별 데이터
91. 실험기반 재료 물성 데이터
92. 해양침적쓰레기 이미지 데이터 고도화
93. 특수환경 자율주행 3D 데이터 고도화
94. 뇌질환 융합데이터

95. 악성 림프종 예후 예측 융합 데이터
96. 서울 지역 중학생들의 국어, 수학 교과용 감성 AI 튜터 데이터
97. 경북 세계문화유산 서원 메타버스 이미지 및 3D데이터
98. 이안류 CCTV 데이터
99. 유사 상표 이미지 검색 서비스의 사용자 입력 이미지 데이터
100. 비디오 장면 설명문 생성 데이터
101. 행동 분류 및 상호작용 인식용 한국형 비전 데이터
102. 교육용 한국인의 영어 음성 데이터
103. 소방대원 행동모션 3D 객체 모델링 데이터
104. 고막 내시경 검사 이미지 데이터
105. 만성콩팥병 및 합병증 추적관찰 임상의료 데이터
106. 만성질환 관련 임상 및 생활습관 데이터
107. 근력운동 처방 데이터
108. 화상 이미지 및 임상 데이터
109. 상용 자율주행차 야간 도심도로 데이터
110. 벼 생육이상 인식 데이터
111. 전술 판정 영상 데이터(축구)
112. 전술 판정 영상 데이터(농구)
113. 전술 판정 영상 데이터(핸드볼)
114. 3D 사람 간 상호작용 데이터(3인 이상)
115. 감성 및 발화 스타일 동시 고려 음성합성 데이터
116. 극한 소음 환경 소리 데이터
117. 인터페이스(자판/음성)별 고빈도 오류 교정 데이터
118. 표 정보 질의응답 데이터
119. 관광 음식메뉴판 데이터
120. 태양광 발전 현황 및 적지 분석 데이터
121. 연안어장 생태환경 피해 유발 해양생물 데이터 구축
122. 지역안전재난(산불) 방재의 고도화를 위한 대규모 인공지능 데이터베이스 구축
123. 인과 관계 기반 추론 데이터
124. 시각 상식 기반 추론 데이터
125. 카테고리 기반 추론 데이터
126. 객체 분할용 한국형 비전 데이터
127. 당뇨관리 앱을 통한 음식 이미지 활용 및 환류
128. 방송콘텐츠 한국어-아시아어 통·번역 음성 데이터
129. 방송콘텐츠 한국어-아시아어 번역 말뭉치
130. 산림 수종 3D 객체 스캐닝·모델링 데이터
131. 흉부 청진음 데이터
132. 상용 자율주행차 주간 도심도로 데이터
133. 지능형 스마트양식장(송어, 산천어) 데이터
134. 한국인의 주제적응형 영어말하기 평가데이터
135. 낚시성 기사 탐지 데이터
136. 자연어 기반 질의(NL2SQL) 검색 생성 데이터
137. 기술과학 문서 기계독해 데이터
138. 3D 에셋-사물 모델링 이미지 쌍 데이터
139. 3D 에셋–스케치 쌍 데이터
140. 자율주행차 정적객체정보 인지 및 갱신 자동화 데이터
141. 선박 도장 품질 데이터
142. 지능형 곤충 스마트팜(누에, 쌍별귀뚜라미) 데이터
143. 전통식품 발효 융합 데이터
144. 반려견, 반려묘 건강정보 데이터
145. 축산 기자재(소, 돼지) 3D 데이터
146. 테니스 동작 및 경기영상 데이터
147. 관광 KVQA 데이터(제주도 및 도서지역)
148. 건설 현장 위험 상태 판단 데이터
149. 산업용 헴프 생육 이미지 및 환경 데이터
150. 부산광역시 항만도로 컨테이너 차량에 의한 노면 파손 이미지 데이터
151. 고령인구 우울증 데이터
152. 국내 여행로그 데이터(동부권)
153. 국내 여행로그 데이터(서부권)
154. 국내 여행로그 데이터(제주도 및 도서지역)
155. 수위 측정 데이터
156. 생활환경소음 AI학습용 데이터 및 민원 관리 서비스 구축 사업
157. 아산시 하천부지 점유현황 데이터
158. 비전영역, 축구 킥 동작 및 축구공 궤적 데이터 구축
159. OCR 데이터(고서한자)
160. 기계번역 품질 검증 데이터
161. 청성유발반응검사 데이터
162. 상용 자율주행차 주간 자동차 전용도로 데이터
163. 상용 자율주행차 야간 자동차 전용도로 데이터
164. 상용 자율주행차 악천후 데이터
165. Face parsing 데이터
166. IR 실제 환경 안면 검출 및 인식 데이터
167. 3D 사람 간 상호작용 데이터(2인)
168. 주소 음성 데이터
169. 가려진 객체 추론 데이터
170. 이미지 사운드 매칭 데이터
171. 3D 관광지 데이터(관광명소)
172. 멀티 영상 동일 상황 및 객체 식별 데이터

 

2022년 인공지능 학습용 데이터중 개방 데이터에 대한 문의는 AI 허브 사이트의 고객지원>문의하기> [2023년 신규 데이터 개선 의견] 문의 창구를 통해 의견을 주시기 바랍니다.

(22년 인공지능 학습용 개방 데이터 클릭 시 데이터 페이지 내 ‘데이터 개선 의견 제안’ 버튼 클릭)

 

더욱 다양한 인공지능 학습용 데이터 개방을 통해 국내 인공지능 인프라 조성과 저변 확대 등에 기여할 수 있도록 노력하겠습니다.

 

감사합니다.

 

- AI 허브 -