포스트코로나 AI 챌린지

소개
목적
  • AI•빅데이터 기술을 활용하여 코로나19와 같은 위기에 대응하고 극복하고자 대국민 프로젝트를 시작합니다!

 

(감염병예방공모전)(AI Hub)타이틀

 

개요
  • 대상: 혁신 기술과 아이디어로 무장한 누구나 (개인/팀)
    - 감염병 대응 관련 모델링, 앱 서비스 개발 아이디어 中 택1 (팀 구성은 최대 5명으로 제한)
  • 응모기간 : 2020년 4월 6일 ~ 5월 10일 / 수상작 발표 5월 22일
    - 모델링 개발을 위해 제공하는 데이터는 총 3회에 걸쳐 공모전 신청자에 한하여 제공될 예정
    - 앱 개발 서비스 아이디어의 경우, 학생부(대학생 이하), 일반부(대학원생 이상)으로 나누어 진행
  • 수상작 선정 수: 총 30명(팀)
    - 감염병 대응 모델링 개발 부문 : 10명(팀)
    - 앱 개발 서비스 아이디어 : 학생부(10명(팀)), 일반부(10명(팀))

     

(공모부문1) 모델링 개발
  • (주제) 해외의 감염병이 국내로 유입될 위험도 산출 모델링
    - 5월5일까지의 데이터 활용하여, 5월6~19일까지 유입 확진자 수 예측
  • 활용데이터: 공모전 제공 기본 데이터 + 기타 자율수집데이터
    o 공모전 제공 데이터: 전 세계 질병 관련 뉴스 데이터, KT 가입자 로밍 통계 데이터
    o 공모전 제공 데이터는 3회에 걸쳐 제공
    - 1차 배포(4월 6일) : 2019년 12월 1일 ~ 2020년 3월 31일까지의 수집 데이터
    - 2차 배포(4월 29일) : 2020년 4월 1일 ~ 2020년 4월 28일까지의 수집 데이터
    - 3차 배포(5월 6일) : 2020년 4월 29일 ~ 2020년 5월 5일까지의 수집 데이터
  •  평가방식: 모델 예측 결과와 실제 유입 확진자 발생의 오차
    - 예선심사(~5월17일), 본선심사(5월18~20일), 결선심사(5월22일)
    - 대상, 최우수상 수상작은 KT 글로벌 감염병 확산방지 플랫폼(Global Epidemic Prevention Platform)에 활용될 수 있음

img

 

(공모부문2) 앱 개발 서비스 아이디어
  • (주제)감염병으로부터 국민안전에 기여할 수 있는 서비스 제안
    - (예시) 사용자 이동 동선에 따른 감염병 위험도 안내 서비스
  •  앱 개발 서비스 아이디어 부문은 학생부(대학생 이하)와 일반부(대학원생 이상)로 구분하여 심사 진행
  •  평가방식: 자율적인 아이디어를 기반으로 상용화 개발 가능한 아이디어
    - 예선심사(~5월13일), 본선심사(5월14~17일), 결선심사(5월22일)
    - 대상, 최우수상 수상작 중 유의미한 상용화 아이디어는 개발지원 검토 진행

img

 

선정/시상
  • 운영국에서 수립한 내부기준에 의해 출품작을 내부 및 외부 전문심사위원단이 심사
     - 개인 또는 팀 단위(최대 5명)로 참여가 가능하며, 개인과 팀을 구분하지 않고 함께 심사하여 수상작 선정
     - 부문별 본선과 결선 심사로 진행되며, 결선 진출자(팀)에 한하여 개별 연락
     - 최종 등수는 결선 진출자(팀)의 공모작에 대한 프리젠테이션 심사를 통해 선정
  • 시상식은 별도로 진행되며 온라인 시상식으로 대체될 수 있음
    ※ 상금은 세금을 차감한 나머지 금액으로 지급됩니다

 

주의사항
  • 공모전 참여는 개인, 팀 단위 참여 가능합니다.
  • 출품작은 순수 창작물에 한하여 타 공모전 수상작, 타인의 저작물 도용으로 확인될 경우 심사 제외 및 수상 취소와 함께 시상 내역을 환수할 수 있습니다.
  • 응모작의 저작권등 법적인 문제와 관련된 법률적 책임은 응모자 당사자에게 있습니다.
  • 수상작이 팀 단위 출품작일 경우의 상금은 대표자 1인에게 지급되며, 배분은 관여하지 않습니다.
  • 출품작에 대한 지식재산권은 출품자(팀)에게 귀속합니다.
  • 공모전 관련 문의는 ktpostcorona@gmail.com로 문의하실 수 있습니다.
감사합니다. 신청 접수가 마감 되었습니다.

 

감사합니다. 신청 접수가 마감 되었습니다.

※ 모델링 데이터는 공모전 신청 및 데이터 신청 완료 후 다운로드 가능합니다.

  • 모델링 데이터 제공 일정
차수 배포시기 데이터 수집기간 파일명
1차 4월 6일 2019.12.1 ~ 2020.3.31 corona_contest_data_0406.zip
2차 4월 29일 2020.4.1 ~ 2020.4.28 corona_contest_data_0429.zip
3차 5월 6일 2020.4.29 ~ 2020.5.5 corona_contest_data_0506_0.zip
모델링 개발 Desciption
  • 모델링 개발 배경
    - 2019년 중국에서 발생한 COVID-19는 2020년 현재 전 세계로 퍼지게 되었습니다. 우리나라 역시 초기에는 중국에서 유입된 바이러스가 전국으로 확산되면서 만 명이 넘는 확진자가 발생하였습니다. 대구/경북 지역에서 발생한 확산세가 진정 국면에 접어들면서 현재는 해외에서의 감염병 유입을 차단하는 것이 다시 중요한 문제가 되었습니다.
    - 이에 따라 정부는 특별입국절차를 만들어 해외에서의 입국의 수요를 감소시키는 정책을 진행하고 있습니다. 이를 통해 국내로 입국하는 내/외국인의 숫자가 현저하게 줄어들어 감염병의 유입 위험을 감소시키기는 하였지만, 이러한 조치는 막대한 경제적인 피해를 동반하게 됩니다.
    -따라서, 어느 시점에 국내 입국절차를 원위치해야 하는지를 언젠가는 의사결정을 해야 합니다. 이를 위해서는 해외에서 유입되는 확진자의 규모를 예측할 수 있어야 합니다.
    - 본 공모전은, KT가 제공하는 해외 로밍 이용객 통계정보와 전 세계의 감염병과 관련된 뉴스 정보를 2019년 12월 ~ 2020년 5월 5일까지 기본 데이터로 제공하여, 여기에 각 팀별로 해외유입 확진자 수를 예측하기 위해 다양한 정보를 활용하여 향후 2주간의 유입 확진자의 수를 예측하는 모델을 만드는 것을 목표로 합니다.
모델링 제공 데이터 안내
  • 로밍 데이터
    - KT 로밍 이용고객 전체 데이터를 활용하여 생성한 통계 데이터로, 체류 국가의 입국/출국 날짜 및 여행자수 정보 제공

 

※ 데이터 구조

img

 

  • 감염병 기사 데이터
    - 해외 감염병 발병 기사를 수집한 데이터로 WHO, CDC 등 주요기관에서 감염병 발생 확인을 위해 사용하는 데이터와 동일한 수준의 데이터

※ 데이터 구조

img

 

문제 정의 및 평가 방식
  • 문제 정의
    - 5월 5일까지의 제공된 데이터셋 + 자유 활용 데이터셋을 활용하여
    5월 6일 ~ 19일(2주)간의 해외유입 확진자의 숫자를 일자별로 예측
  • 예선 평가방식 : 모델의 정확성(100%)
    ○모델의 정확성(100%)
    - 5월 11일 ~ 5월 17일(7일)간의 실제 유입 확진자수와 예측한 확진자수의 차이
    - 차이가 적은 모델 순으로 수상작의 2배수 선정

 

※ 모델의 정확도 산출식

img

 

  • 본선 평가방식 : 모델의 정확성(40%), 외부 심사위원단의 평가(60%)
    ㅇ 모델의 정확성(40%)
    - 5월 11일 ~ 5월 19일(9일)간의 실제 유입 확진자수와 예측한 확진자수의 차이
    ㅇ 활용 데이터 및 모델에 대한 외부 심사위원단의 평가(60%)
    - 활용 데이터의 타당성(30%), 모델의 혁신성, 창의성(30%)
  • 결선 평가방식 : 프리젠테이션 기반 종합평가
    ㅇ 외부심사위원단(7명) 종합 평가
    - 최고, 최저 점수 제외한 평균으로 평가 점수 반영
    ㅇ 2차 평가점수 70%, 3차 평가점수 30% 합산하여 최종 점수 산정
분석도구 및 소스파일 제출 안내
  • 분석도구는 제한 없으나 Python, R 등 오픈소스 사용 권고
  • 소스파일 제출 가이드라인에 맞춰 제출 권고
    - 분석도구, 활용한 라이브러리 및 버전 명시
    - 제출 코드는 예측 결과를 복원할 수 있어야 함
    - 코드에 ‘/data’ 데이터 입/출력 경로 포함 제출
    - 전체 프로세스를 일목요연하게 정리하여 주석을 포함하여 하나의 파일로 제출
    - 모든 코드는 오류 없이 실행되어야 함(라이브러리 로딩 코드 포함되어야 함)
    - 코드와 주석의 인코딩은 모두 UTF-8을 사용하여야 함
    - 입상자 외 제출 코드는 폐기 조치함
  • 제출 안내
    - 공모전 제출 자료 및 양식에 맞춰서 제출 필요
    - 최종 제출한 자료를 기준으로 평가 (마지막 제출 이전 자료는 삭제)
    - 서약서, 개인(신용)정보 수집 ·이용 동의서는 자필 서명 후 스캔하여 제출
    - 제출된 자료는 반환하지 않음
  • 필수 제출 자료
    ㅇ 모델링 개발 참가자
         ① 서약서
         ② 개인(신용)정보 수집·이용 동의서
         ③ 예측모델 소스코드
             - 데이터 전처리 및 분석과정에 사용된 전체 코드
             - 최종 결과가 재현 가능한 형태의 파일로 제출 (활용 라이브러리 및 버전 명시 필요)
         ④ 기타 자율 수집 데이터
             - 공모전 제공 기본 데이터 외 분석에 활용한 데이터가 있는 경우에 한함
         ⑤ 분석 결과서(PPT 양식 활용)
    ㅇ 앱 서비스 개발 아이디어 참가자
         ① 서약서
         ② 개인(신용)정보 수집·이용 동의서
         ③ 아이디어 소개자료(자유양식)
            - 문서형식 (ppt, doc 등) : 첫페이지에 서비스명, 대표자/팀원 이름, 참여구분(일반부/대학부) 표기
            - 동영상 : 영상 시작 3초간 서비스명, 대표자/팀원 이름, 참여구분(일반부/대학부) 노출
  • 양식 다운로드
    - 모델링 개발 참가자 제출자료 [다운로드]
    - 앱 서비스 개발 아이디어 참가자 제출자료 [다운로드]
  • 제출 유의사항
    - 필수 제출 자료를 누락한 경우 별도의 안내 없이 심사상 불이익이 발생할 수 있음
    - 제출 자료 전체를 Zip 형식으로 압축하여 제출
       ※ 제출 파일 양식 : 이름_제출날짜(YYMMDD)_주제(모델링or앱).zip
    - 제출 파일이 200MB가 초과할 경우 공모전 자료를 ktpostcorona@gmail.com으로 제출

 

감사합니다. 신청 접수가 마감 되었습니다.

공모전을 신청한 계정에 대해서만 데이터 다운로드 승인을 하고 있습니다.
공모전을 아직 신청하지 않았으면 공모전을 먼저 신청해 주시고
공모전을 신청하신 경우라면 마이페이지에 생성된 반려 버튼을 누르고, 재신청(Apply) 버튼을 누르시면 됩니다.
 
위와같이 해도 해결 되지 않을 경우는 계정명(이메일주소)와 함께 ktpostcorona@kt.com 으로 문의 메일 주시면 확인해드리겠습니다.

 

응모 기간 및  최종 결과물 제출은 5월 10일 23시 59분까지 입니다.
마감 시간에 임박하여 제출할 경우 사용자가 몰릴 수 있으니 시간적 여유를 두고 제출 하는 걸 권장 합니다.
 

(예제)
return iso arrival departure count 20200131 ae 20200102 20200102 3

(해석)
아랍에미리트에 2020년1월2일 도착한 뒤, 아랍에미리트를 2020년 1월 2일 출국하여, 한국에 귀국한 날짜가 2020년 1월 31일인 입국자수는 3명
아랍에미리트 1/2 도착. 아랍에미리트 1/2 출국으로 아랍에미리트 경유행을 탑승한 것으로 해석할 수 있음
아랍에미리트 출국날짜 대비, 한국 귀국 날짜가 오랜 차이를 보이는 것은 한국 귀국 전 다른 나라에 머문 것으로 볼 수 있음

 

프리젠데이션 및 시상식은 5월 22일 예정으로, 수상 후보자 대상(개인/팀)으로 별도 안내를 드릴 예정입니다
대표자가 프리젠테이션 하는 것이 원칙이나 부득이한 경우 운영국과 협의하여 팀원이 프리젠데이션 할 수 있습니다.

 

개인의 경우에는 개인신청자만 다운로드 가능하며, 팀의 경우에는 팀장만 가능합니다.

해외 유입 확진자 수는 운영국에서 따로 제공하지는 않습니다.
관련 내용은 아래 경로를 통해 질병관리본부에서 제공하는 자료를 확인하실 수 있습니다.
질병관리본부 홈페이지 (http://www.cdc.go.kr/) > 알림·자료 > 보도자료 > 코로나바이러스감염증-19 국내 발생 현황(0월 0일, 정례브리핑)

 

데이터를 다운 받기 위해서는 아래와 같은 절차로 진행해 주시면 됩니다.
(AI Hub 비회원의 경우) AI Hub 회원가입 → 공모전 신청 → 데이터 다운로드 신청
참고로, AI Hub 회원가입 신청 완료 후 가입한 이메일 계정으로 “계정 활성화 링크”를 보내드립니다.
계정 활성화 링크를 클릭한 후 로그인 가능합니다.

 

공모전에서 제공하는 데이터(제공 데이터를 가공한 데이터 포함) 및 자료는 정책상 외부 활용이 불가합니다. Ex) 논문, 출판 등
예외적인 사용이 필요할 경우, 공모전 종료 후에 관련 자료와 함께 운영국으로 요청해 주시면 검토 후 연락드리겠습니다.

 

공모전 제출시 필수 제출 자료인 “서약서”에 전체 참가자의 정보를 작성하여 제출 하시면 됩니다.

단, 팀 전체 인원은 5명으로 제한 합니다.

네, 팀 참여자 전원의 이름, 주민번호(생년월일) 입력 해야합니다.

제출 양식 파일의 서약서에도 동일하게 기재하시면 됩니다.

  개인의 경우에는 신청서 양식에 신청인 한 명의 정보만 기입하시면 되며,
팀 등록의  경우에는 신청서 양식의 신청인 칸을 보면 +, - 표시가 있습니다. 해당 버튼을 눌러서 팀 구성원 수에 맞도록 입력 칸을 조절 하시어 기재바랍니다.
참고로, 개인 또는 팀 단위(최대 5명)로 참여 가능하오니 참고 바랍니다.

 

두 가지 부문(모델링 개발, 앱 개발 서비스 아이디어) 중복 참여는 불가합니다. 한 가지 부문에 대한 중복 참여 또한 불가합니다.

참가 나이제한은 없습니다. 공모부문별 참가 자격은 아래와 같습니다.

(공모부분1) 모델링 개발
- 제한 없음

(공모부분2) 앱 개발 서비스 아이디어
- 학생부 : 대학생 이하
- 일반부 : 대학원생 이상

 

회원 가입시 사용한 ID(이메일 주소)로 계정 활성화 메일을 보내드립니다.

보내드리는 메일 본문의 활성화 링크를 클릭하여 계정 활성화 한 후 로그인 하실 수 있습니다.