2020 인공지능 그랜드 챌린지

소개

2020 인공지능 그랜드 챌린지

 

대회목적
  • 국내외 인공지능 분야의 연구자들이 경진대회를 통해 기술 난제 및 사회현안해결 방안의 우수성을 경합하는 AI 그랜드 챌린지 대회
대회특전
  • 챌린지 대회 우수 선발자(팀)에게는 시상과 함께 해당분야의 후속연구를 추진할 수 있도록 후속 연구비를 1년간 지원

1

 

대회일정

22

 

참가자격
  • - 대회는 국내외 대학(원)생, 일반인, 기업, 대학, 연구기관, 연구조합, 사업자단체 및 산‧학‧연 컨소시엄 등 참가가능
    * 외국소재의 개인, 기업, 대학, 연구소 등 재외국민 및 외국인 등을 포함
  • - 1단계 대회에 참여하지 않았거나, 1단계 대회에서 선발되지 못한 연구자(팀)도 참가가능
신청방법
  • 별도 사업계획서 없이 ‘참여의향서’ 전산 제출
    * 인공지능 그랜드 챌린지 홈페이지(www.ai-challenge.kr)를 통해 참여의향서 제출
문의처
  • Email: challenge@iitp.kr
  • Tel: 070-4169-9946
  • 홈페이지 : www.ai-challenge.kr

◻︎ 3차 대회 [트랙 1 : 상황인지] 샘플 데이터 셋

데이터 셋 및 어노테이션 설명

 

  • 3기의 드론이 동시에 촬영한 해상도 1920×1080px 이상 / 10fps / 30초 길이의 동영상 15개 클립(5개 상황 × 3기 드론) 및 해당 동영상에 등장하는 인물들의 총 인원수
  • 각 드론이 촬영한 동영상은 각도 및 거리가 상이하며, 촬영시점이 정확히 일치하지 않을 수 있음(최대 20초의 시간오차)
  • 각 동영상은 프레임별 jpg 형식의 이미지로 분할하여 제공
  • 프레임 별 이미지에 등장하는 사람이 짧은 축 기준 32픽셀 이상일 경우 1인 단위로 계수
  • 동일한 대상으로 판단한 인물은 하나의 영상 내 여러 이미지에 등장하더라도 동일한 인물로 계수

 

◻︎ 3차 대회 [트랙 2 : 문자인지] 샘플 데이터 셋

데이터 셋 및 참고용 기술자료 설명

 

  • 각기 다른 지역에서 드론으로 촬영한 4K급 이미지 20장 및 해당 이미지가 촬영된 지점의 지도 정보·지도 이미지 2장, 상호 리스트 json 파일 1개
  • 이미지는 드론으로 촬영한 해상도 4000×2250px, FOV(Field-of-view) 약 가로 83° / 세로48° 규격의 이미지

 

◻︎ 3차 대회 [트랙 3 : 음향인지] 샘플 데이터 셋

데이터 셋 및 어노테이션 설명

 

  • 실외에서 드론으로 녹음한 해상도 16bit / 48kHz 이상 / 30초 미만 길이의 오디오 10개 클립
  • 실외에서 호버링 중인 드론 하단에 삼각대를 이용하여 지면과 수평이 되도록 고정시킨 스테레오 마이크로 오디오 신호를 녹음
  • 스테레오 마이크의 중심점 기준 20°간격으로 배치된 스피커를 통해 무작위로 음원 재생
    * 여러 방향 및 거리에서 동시에 음원이 재생될 수 있으며 재생되는 음원의 위치와 수는 임의로 선택됨
  • 재생 음원은 성인남녀 및 소아 발화자가 지정된 스크립트를 각각 발화
    * 스크립트 예시는 “도와주세요!”, “여기에요!” 등이며, 음성 외에 바람 소리, 타 드론의 프로펠러 구동음 등 주변 환경의 소음이 함께 녹음될 수 있음
  • 태깅은 해당음원의 발원방향을 0도부터 180도까지 20도 단위로 표현하고, 음원내 발화자 수를 성인남자/성인여자/소아로 구분하여 표현

 

◻︎ 4차 대회 [트랙 1 : 행동인지] 샘플 데이터 셋

데이터 셋 및 어노테이션 설명

 

  • 고정된 카메라로 촬영된 해상도 1920×1080px 이상 / 15fps / 20초 길이의 mp4 동영상 40개 클립 및 실신상황의 인물에 대한 바운딩 박스 좌표정보
  • 각 동영상은 프레임별 jpg 형식의 이미지로 분할하여 제공
  • 프레임 별 이미지에 등장하는 실신상황의 사람이 짧은 축 기준 32픽셀 이상일 경우 바운딩 박스로 표현
  • 실신기준에 대한 상세기준은 데이터 셋 가이드라인 참조

 

◻︎ 4차 대회 [트랙 2 : 음성인지] 샘플 데이터 셋

데이터 셋 및 어노테이션 설명

 

  • 해상도 16bit / 48kHz 이상 / 40초 미만 길이의 wav오디오 40개 클립
  • 시나리오 기반의 2인 이상 다자가 발화한 대화음성 및 해당 대화의 스크립트, 해당 대화 내 포함된 위협상황의 코드
  • 사람간 대화 외에 BGM 및 생활소음이 포함되며, 중의적인 표현이 있는 대화가 포함됨

 

◻︎ 4차 대회 [트랙 3 : 사물인지] 샘플 데이터 셋

데이터 셋 및 어노테이션 설명

 

  • 다양한 각도로 촬영된 단수 혹은 복수의 정형·비정형 사물이 등장하는 해상도 1280×720px(가로) / 720×1280(세로) 이미지 400장
  • 각 이미지 는 생활폐기물 분류기준에 맞춰 태깅되어 있으며, 해당 사물에 표기된 분리배출 요령을 기본으로 하되, 복합재질의 사물 등 그 외 기준은 환경부의 재활용품 분리배출 가이드라인을 따름

 

◻︎ 4차 대회 [트랙 4 : 사물인지] 베이스라인 모델 및 학습 데이터 셋

베이스라인 모델 설명

 

  • 해당 모델은 EfficientDet D2를 기반으로 하며, 주어진 동영상에서 사람을 검출하여 바운딩 박스를 좌표로 표현하는 기능을 갖고 있음

 

학습데이터 셋 설명

 

  • 드론으로 촬영된 해상도 1920×1080px / 15fps / 30초 길이 동영상 190개 클립
  • 각 동영상은 프레임 별 jpg 형식으로 제공되며, 학습을 위한 태깅이 되어 있음
  • 동영상 내에는 다양한 인물과 사물이 등장하며, 태깅은 등장인물에만 해당 위치의 바운딩 박스를 좌표로 표현