편향성 고려 소득 예측 정형 이지AI

사람의 여러 정보를 통해 연간 소득 수준에 대해 일정 기준 초과 여부를 예측하여 이중 분류하는 모델 개발

데이터 설명

  • • 입출력
    • - Input: 나이, 성별, 교육 수준 등 15 개의 feature
    • - Output: 연간 소득 수준 50,000만불 초과 여부에 대한 이진 분류 ('<=50K.' 혹은 '>50K.')
  • • 데이터 구성
  • • Train
    • - 사람 ('ID')별로 나이, 직업군, 성별, 교육 수준 등 15 개의 feature와 연간 소득 수준에 대한 이진 분류 정보('class')가 담긴 csv 파일 (약 32,000개의 행)
  • • Test
    • - 사람 ('ID')별로 나이, 직업군, 성별, 교육 등 15 개의 feature가 담긴 csv 파일 (약 16,000개의 행)
  • • 참고 데이터 : machine-learning-databases/adult (open-source) (https://archive.ics.uci.edu/ml/machine-learning-databases/adult/)