편향성을 고려한 소득 예측 AI 개발
2022.10.12 - 2022.12.31
0
0
0
공유
0
공유

1. 주최

경희대학교 인공지능학과 AI실전연구프로젝트1

 

2. 개요

  • 개인의 삶에 영향을 미치는 중요한 결정에 많은 데이터 활용이 이뤄지면서 보다 안전하고, 윤리적이면서 책임감있는 사용을 보장하는 AI에 대한 중요성이 대두되고 있다. 좋은 목적으로 알고리즘을 개발하고 데이터를 활용하더라도 의도하지 않게 성별, 문화적, 민족적 편향성을 AI가 보여준다면 결코 공정하다고 할 수 없다. 
  • 이에 본 과제는 성별, 문화, 민족 등 데이터가 가진 사회적 편향성을 극복하여 보다 공정한 AI 개발의 중요성이 대두됨에 따라 적어도 한 카테고리('성별')에 대한 편향성을 고려한 모델을 개발한다. 
  • 이를 응용하여 성별, 인종, 직업 등의 편향성에 영향을 덜 받는 공정한 대출 심사 또는 신용점수 평가 서비스를 구축할 수 있다. 

 

3. 데이터 개요

  • train data : 사람 ('ID')별로 나이, 직업군, 성별, 교육 수준 등 15개의 feature와 연간 소득 수준에 대한 분류 정보('class')가 담긴 csv 파일 (총 26,049개의 데이터셋)
  • test data : 사람 ('ID')별로 나이, 직업군, 성별, 교육 등 15개의 feature가 담긴 csv 파일 (총 6,513개의 데이터셋)

데이터 출처: https://www.aihub.or.kr/dataprcuse/aiply/view.do?pageIndex=1&aiPlySn=19&currMenu=126&topMenu=102&dataTyCode=AIPLYDATA001&searchCondition=&searchKeyword=

 

4. 채점방식

F1-Score를 이용하여 채점을 진행한다.

  • F1 score : 정밀도와 재현율의 조화 평균
    F1 = (2 * Precision * Recall ) / ( Precision + Recall )