콘텐츠로 건너뛰기 메뉴로 건너뛰기 푸터로 건너뛰기
데이터를 불러오고 있습니다
데이터를 저장하고 있습니다
공지사항
2022년 인공지능 학습용 데이터 정식개방 안내
등록일 2023-10-31
조회수 18,601
첨부파일

안녕하세요. AI 허브 입니다.

 

그간 BETA 개방한 “2022년 인공지능 학습용 데이터(319종)”의 접수된 의견 반영에 따른 품질 보완과 민감정보 비식별화 재점검 등으로 인해 점진적으로 최종 데이터를 오픈하고 있습니다.
10월 31부터 매주 순차적으로 최종 데이터를 공개할 예정이니 많은 관심과 이용 부탁드립니다.

아울러 데이터 접근성 향상을 위해 새롭게 추가 된 기능인 “오픈 API 다운로드(AI 허브 Shell 다운로드)”를 활용하시면 Linux 등 개발환경에서 바로 다운로드 받아 학습이 가능하오니 많은 이용 바랍니다.

 

[22년 인공지능 학습용 데이터 개방 목록]

※데이터명 클릭 시 해당 데이터 페이지로 이동됩니다.
 

1. 패션 액세서리 착용 데이터
2. 연도별 패션 선호도 파악 및 추천 데이터
3. 쉐이프리스 의류 및 포즈 데이터
4. 의류 디자인 패턴 데이터
5. 동일 객체 인식 오류 방지 데이터
6. OCR 데이터(금융 및 물류)
7. 훼손 및 블러링 데이터
8. 방송콘텐츠 한국어-영어 번역 말뭉치
9. 방송콘텐츠 한국어-유럽어 번역 말뭉치
10. 교육용 유럽어 모국어 사용자의 한국어 음성 데이터
11. 교육용 중·일어 모국어 사용자의 한국어 음성 데이터
12. 교육용 아시아어(중·일어 제외) 사용자의 한국어 음성 데이터
13. 안면 인식 에이징(aging) 이미지 데이터
14. 식생 탄소 포집량 식별 데이터
15. X-ray 다중 객체 인식 데이터
16. 픽셀 단위 장면 인지 멀티모달 데이터
17. AI기반 국립공원 변화탐지 모니터링 플랫폼 구축

18. 교육용 한국인의 중국어·일본어 음성 데이터
19. 발화유형(문어/구어/채팅)별 기계번역 병렬 말뭉치
20. 규칙 기반 상황 인지 및 행동 예측 이미지 데이터
21. 명령어 인식을 위한 소음 환경 데이터
22. 금융, 법률 문서 기계독해 데이터
23. 자전거도로 주행 데이터
24. OCR 데이터(교육)
25. OCR 데이터(옛한글)
26. 해조류 종자생산(김) 데이터
27. 중·노년층 한국어 방언 데이터(강원도, 경상도)
28. 중·노년층 한국어 방언 데이터(충청도, 전라도, 제주도)
29. 도시 수목 3D 생육 데이터

30. 추상 요약 사실성 검증 데이터
31. 시간 표현 탐지 데이터
32. AI 허브 데이터 활용을 위한 기계 번역앱 구축과 번역기 평가 및 신규 말뭉치 구축

33. 전시 공연 도슨트 데이터
34. 방송콘텐츠 대화체 음성인식 데이터
35. 한국어-다국어(영어 제외) 번역 말뭉치(기술과학)
36. 한국어-다국어 번역 말뭉치(기초과학)
37. 한국어-다국어 번역 말뭉치(인문학)
38. 주요질환 이미지 합성데이터(X-ray)
39. 주요질환 이미지 합성데이터(CT)
40. 주요질환 이미지 합성데이터(MRI)
41. 전문분야 심층인터뷰 데이터
42. 시설작물(딸기) 개체 이미지 및 시설작물(딸기) 질병 이미지
43. 문장 유형(추론, 예측 등) 판단 데이터
44. 응급실 임상 대화 데이터
45. 메타버스 캐릭터 모션 리타게팅 데이터
46. SNS 데이터 고도화

47. 비디오 전환 경계 추론 데이터
48. 의류 통합 데이터(착용 이미지, 치수 및 원단 정보)
49. 비동일 객체 인식 오류 방지 데이터
50. 유사성 기반 추론 데이터

51. 저조도 환경 데이터
52. 소아청소년 심리검사 및 뇌영상 데이터

53. 교육용 한국인의 외국어(영·중·일 제외) 음성 데이터
54. 교육용 영어 모국어 사용자의 한국어 음성 데이터
55. 뉴스 대본 및 앵커 음성 데이터
56. 바이오․의료 논문 간 연계 분석 데이터
57. 전력신사업을 위한 전라남도 지역 전력소비패턴 데이터 구축
58. 객체 인식용 한국형 비전 데이터
59. 이미지 설명문 추출 및 생성용 한국형 비전 데이터
60. 규칙 기반 집단행동 인식 비디오 데이터
61. 한국 전통 수묵화 화풍별 제작 데이터
62. 자가 수면 검사 데이터
63. 구음장애인 명령어 데이터
64. 저해상도 라이다의 해상도 개선을 위한 Point-cloud Super-resolution 데이터
65. 배드민턴 동작 및 경기영상 데이터
66. 실내(편의점, 매장) 사람 이상행동 데이터
67. 주요 화훼류 품질 데이터
68. 국내 여행로그 데이터(수도권)
69. 악천후 환경에서의 라이다 점 군 데이터 개선을 위한 Denoising 데이터
70. 실내 자율주차용 데이터
71. 대형시설 실내·인접 자율 배송 데이터
72. 지하수 수량·수질 데이터
73. 상수원-취수원 통합 수질 및 녹조 데이터
74. 실내(편의점, 매장) 구매 행동 데이터
75. 3D 지표투과레이더 탐사 데이터
76. 해외상표 이미지 AI 데이터
77. 토지피복지도 항공위성 이미지
78. 개체 레벨 인식 (Instance level recognition, ILR) 데이터
79. OCR 데이터(공공)
80. 방송콘텐츠 한국어-영어 통·번역 음성 데이터
81. 페르소나 대화
82. 지식검색 대화
83. 공감형 대화
84. 4D 이미징 레이다 센서 기반의 주행환경 객체 인지 데이터

85. 한국인 재식별 이미지 데이터셋 고도화 구축
86. 하천 및 항만 수중생활 폐기물 영상데이터
87. 실내측위를 위한 융합데이터셋 구축
88. 의료, 법률 전문 서적 말뭉치
89. 소(한우, 젖소) 및 돼지 발정행동 데이터

90. 재활용품 분류 및 선별 데이터
91. 실험기반 재료 물성 데이터
92. 해양침적쓰레기 이미지 데이터 고도화
93. 특수환경 자율주행 3D 데이터 고도화
94. 뇌질환 융합데이터

95. 악성 림프종 예후 예측 융합 데이터
96. 서울 지역 중학생들의 국어, 수학 교과용 감성 AI 튜터 데이터
97. 경북 세계문화유산 서원 메타버스 이미지 및 3D데이터
98. 이안류 CCTV 데이터
99. 유사 상표 이미지 검색 서비스의 사용자 입력 이미지 데이터
100. 비디오 장면 설명문 생성 데이터
101. 행동 분류 및 상호작용 인식용 한국형 비전 데이터
102. 교육용 한국인의 영어 음성 데이터
103. 소방대원 행동모션 3D 객체 모델링 데이터
104. 고막 내시경 검사 이미지 데이터
105. 만성콩팥병 및 합병증 추적관찰 임상의료 데이터
106. 만성질환 관련 임상 및 생활습관 데이터
107. 근력운동 처방 데이터
108. 화상 이미지 및 임상 데이터
109. 상용 자율주행차 야간 도심도로 데이터
110. 벼 생육이상 인식 데이터
111. 전술 판정 영상 데이터(축구)
112. 전술 판정 영상 데이터(농구)
113. 전술 판정 영상 데이터(핸드볼)
114. 3D 사람 간 상호작용 데이터(3인 이상)
115. 넙치 질병 데이터
116. 극한 소음 환경 소리 데이터
117. 인터페이스(자판/음성)별 고빈도 오류 교정 데이터
118. 표 정보 질의응답 데이터
119. 관광 음식메뉴판 데이터
120. 태양광 발전 현황 및 적지 분석 데이터
121. 연안어장 생태환경 피해 유발 해양생물 데이터 구축
122. 지역안전재난(산불) 방재의 고도화를 위한 대규모 인공지능 데이터베이스 구축
123. 인과 관계 기반 추론 데이터
124. 시각 상식 기반 추론 데이터
125. 카테고리 기반 추론 데이터
126. 객체 분할용 한국형 비전 데이터
127. 당뇨관리 앱을 통한 음식 이미지 활용 및 환류
128. 방송콘텐츠 한국어-아시아어 통·번역 음성 데이터
129. 진안홍삼 품질 데이터
130. 산림 수종 3D 객체 스캐닝·모델링 데이터
131. 흉부 청진음 데이터
132. 상용 자율주행차 주간 도심도로 데이터
133. 지능형 스마트양식장(송어, 산천어) 데이터
134. 한국인의 주제적응형 영어말하기 평가데이터
135. 낚시성 기사 탐지 데이터
136. 작물 종자 품종 표현형 데이터

137. 기술과학 문서 기계독해 데이터
138. 3D 에셋-사물 모델링 이미지 쌍 데이터
139. 3D 에셋–스케치 쌍 데이터
140. 자율주행차 정적객체정보 인지 및 갱신 자동화 데이터
141. 선박 도장 품질 데이터
142. 지능형 곤충 스마트팜(누에, 쌍별귀뚜라미) 데이터
143. 전통식품 발효 융합 데이터
144. 반려견, 반려묘 건강정보 데이터
145. 축산 기자재(소, 돼지) 3D 데이터
146. 테니스 동작 및 경기영상 데이터
147. 관광 KVQA 데이터(제주도 및 도서지역)
148. 건설 현장 위험 상태 판단 데이터
149. 산업용 헴프 생육 이미지 및 환경 데이터
150. 부산광역시 항만도로 컨테이너 차량에 의한 노면 파손 이미지 데이터
151. 고령인구 우울증 데이터
152. 국내 여행로그 데이터(동부권)
153. 국내 여행로그 데이터(서부권)
154. 국내 여행로그 데이터(제주도 및 도서지역)
155. 수위 측정 데이터
156. 생활환경소음 AI학습용 데이터 및 민원 관리 서비스 구축 사업
157. 아산시 하천부지 점유현황 데이터
158. 비전영역, 축구 킥 동작 및 축구공 궤적 데이터 구축
159. OCR 데이터(고서한자)
160. 기계번역 품질 검증 데이터
161. 청성유발반응검사 데이터
162. 상용 자율주행차 주간 자동차 전용도로 데이터
163. 상용 자율주행차 야간 자동차 전용도로 데이터
164. 상용 자율주행차 악천후 데이터
165. Face parsing 데이터
166. IR 실제 환경 안면 검출 및 인식 데이터
167. 3D 사람 간 상호작용 데이터(2인)
168. 주소 음성 데이터
169. 가려진 객체 추론 데이터
170. 이미지 사운드 매칭 데이터
171. 3D 관광지 데이터(관광명소)
172. 멀티 영상 동일 상황 및 객체 식별 데이터
173. 객체 간 관계성 인지용 한국형 비전 데이터
174. 자연어 분석 후처리용 과교정 검증 데이터
175. 화재영상 3D 객체 데이터 생성
176. 금속 3D프린팅 스파크 이미지 데이
177. 전정기능검사 데이터
178. 폐암 예후 예측 융합 데이터
179. 인공호흡기 작동 데이터
180. 인삼 년근 판독 및 등급 식별을 위한 인공지능 학습 데이터 구축
181. 노지작물(배추 등) 작황 데이터
182. 지능형 스마트종자배양장(넙치, 돌돔) 데이터
183. 패류 종자생산(전복) 데이터
184. 다중 객체 3차원 표현 데이터(실외)
185. 채용면접 인터뷰 데이터
186. 극한 소음 음성인식 데이터
187. 한국인 신체 3D 스캐닝 데이터
188. 한국인 얼굴 3D 스캐닝 데이터
189. 자율주행 고장진단 데이터
190. 3D프린팅 출력물 형상 보정용 데이터
191. 조선·해양 플랜트 P&ID 심볼 식별 데이터

192. 일반상식 문장 생성 평가 데이터
193. 고정밀데이터 수집차량 주간 도심도로 데이터
194. 고정밀데이터 수집차량 야간 도심도로 데이터
195. 고정밀데이터 수집차량 주간 자동차 전용도로 데이터
196. 고정밀데이터 수집차량 야간 자동차 전용도로 데이터
197. 고정밀데이터 수집차량 악천후 데이터
198. 보행보조 착용형 로봇 모션 데이터
199. 지능형 양봉 데이터
200. 갑각류 종자생산 데이터
201. 다중 객체 3차원 표현 데이터(실내)
202. 한국어 대학 강의 데이터
203. 음악 유사성 판별 데이터
204. 속성기반 감정분석 데이터
205. 기술과학 요약 데이터
206. 자율주행차의 다양한 주행환경에서의 신호등 신호정보 인지 영상 데이터
207. 철도 선로 상태 인식 데이터
208. 전차선 애자 상태 인식 데이터
209. 교통법규 위반 상황 데이터
210. 메타버스 활용목적 전통가옥 학습 데이터 구축
211. 계란 데이터
212. 제조업 노동자 근골격계 부담요인 예방을 위한 인공지능 데이터 구축
213. IP산업의 상표권 보호를 위한 오프라인 상표 이미지 데이터
214. 이매패류(새조개, 바지락) 종자생산 데이터
215. 지능형 터널 및 지하차도 데이터
216. 비전영역, 음식이미지 및 정보소개 텍스트 데이터
217. 일상생활 작업 및 명령 수행 데이터(물체)
218. 문화유산 유적 3D 데이터
219. 관광지 소개 다국어 번역 데이터
220. 실내외 군중 특성 데이터
221. 건축 도면 데이터
222. 감귤 착과량 학습 데이터
223. 강원도 한해성어류(연어,명태) 지능형양식 종합데이터
224. 지자체 도로부속시설물 파손 데이터
225. 연약 지반 GPR 탐사 데이터
226. AI 기반 아동 미술심리 진단을 위한 그림 데이터 구축
227. 전북 새만금 방조제 유입 하천 쓰레기 데이터
228. 인공지능기반 학생 진로탐색을 위한 상담 데이터 구축
229. 수술 단계별 영상 데이터
230. 일반상식 문장 생성 데이터
231. 파킨슨병 및 관련 질환 진단 음성 데이터
232. 치과 구내 임상사진 이미지 데이터
233. 감정이 태깅된 자유대화 (청소년)
234. 가구·가전·사무기기 사용 모션 캡처 데이터
235. 국악 악보 및 음원 데이터
236. 3D 관광지 데이터(산·하천)
237. 건설 현장 장비 모니터링 및 생산성 측정 데이터
238. 심볼(로고) 생성 데이터
239. 정상 및 병적보행 융합데이터
240. 한국인 얼굴 합성을 위한 발화 모습 이미지
241. 일반상식 문장 교정 데이터
242. 도로교통 시설 3D 스캐닝 데이터
243. 다국어 통·번역 낭독체 데이터
244. 숫자연산 기계독해 데이터
245. 문화, 게임 콘텐츠 분야 용어 말뭉치
246. 소셜로봇 고객응대 데이터
247. 디지털 트랩 포집 해충 데이터
248. 디지털 K-Art 데이터
249. 건설 모래 품질관리 데이터
250. 손·팔 협조에 의한 파지-조작 동작 데이터
251.
관광 KVQA 데이터(동부권) 
252. 과학기술표준분류 대응 특허 데이터
253. 4D 이미징 레이다 센서 기반의 동적 객체 인지 데이터
254. 한국 골목길 이미지 및 3D 데이터

255. 온실가스 지중저장 적지 탐사 데이터
256. 하천시설 3D 스캐닝 데이터
257. 암환자 방사선 치료 데이터
258. 난임시술 배아 이미지 데이터
259. 태아 심박동 모니터링 데이터 
260. 디스플레이 중심 안구 움직임 영상 데이터 
261. 감정이 태깅된 자유대화 (성인) 
262. 외부 지식 기반 멀티모달 질의응답 데이터
263. 자가 폐기능 검사 데이터 
264. AI 기반 신호 최적화를 위한 데이터
265. CMF 식별 데이터 
266. 식물 기능성 예측 유전체 데이터 
267. 방송콘텐츠 한국어-유럽어 통·번역 음성 데이터
268. 소방시설·장비 3D 스캐닝 데이터
269. 양돈 생체 에너지 데이터
270. 가상공간 환경음 매칭 데이터
271.
빌딩풍 재해위험도 분석 데이터
272. 어린이 음성맥락 인식률 향상을 위한 방송 음성 및 자연어 처리 학습용 데이터
273. 화질 변환 영상 데이터
274. 방송콘텐츠 한국어-아시아어 번역 말뭉치
275. 공공분야 고객응대 데이터
276. 민간분야 고객 상담 데이터
277. 지능형 스마트팜(참외) 데이터
278. 국도 CCTV 영상을 통한 비정상주행 판별 데이터
279. 객체 폐색(occlusion) 데이터
280. 소아 뇌파 검사 데이터
281. 한국어 멀티세션 대화
282. 승용 자율주행차 주간 도심도로 데이터
283. 차량 관제 서비스 고도화를 위한 모빌리티 데이터
284. 소아 복부 엑스레이 이미지 데이터
285. 소아청소년 정신질환 진단 안저 이미지 데이터
286. 신생아 카테터 엑스레이 데이터
287. 승용 자율주행차 야간 도심도로 데이터
288. 승용 자율주행차 주간 자동차 전용도로 데이터
289. 승용 자율주행차 야간 자동차 전용도로 데이터
290. 승용 자율주행차 악천후 데이터
291. 개인 특정을 위한 자필과 모사 필기체 데이터
292. 교통수단판별 데이터
293. 피겨 스케이팅 동작 데이터
294. 크로스핏 동작 데이터
295. 피부질환 병리검사 이미지 데이터
296. 노변기지국 송·수신 V2X 메시지 데이터
297. 로봇 핸드용 객체 특성 식별 데이터

298.감성 및 발화스타일 동시 고려 음성합성 데이터
299. 관광 KVQA 데이터(수도권)
300. 관광 KVQA 데이터(서부권)
301. 다양한 문화콘텐츠 스토리 데이터
302. 생활폐기물 데이터 활용·환류
303. 자연어 기반 질의(NL2SQL) 검색 생성 데이터
304. 대화·발표 동작 모션캡처 데이터
305. 일상생활 작업 및 명령 수행 데이터(임무수행 명령어)
306. 연령대별 특징적 발화(은어·속어 등) 음성 데이터
307. 한국어 지식기반 관계 데이터
308. 일상생활 작업 및 명령 수행 데이터(공간)

 

 

2022년 인공지능 학습용 데이터중 개방 데이터에 대한 문의는 AI 허브 사이트의 고객지원>문의하기> [2023년 신규 데이터 개선 의견] 문의 창구를 통해 의견을 주시기 바랍니다.

 

(22년 인공지능 학습용 개방 데이터 클릭 시 데이터 페이지 내 ‘데이터 개선 의견 제안’ 버튼 클릭)

더욱 다양한 인공지능 학습용 데이터 개방을 통해 국내 인공지능 인프라 조성과 저변 확대 등에 기여할 수 있도록 노력하겠습니다.

감사합니다.

- AI 허브 -