숫자가 포함된 음성인식 모델 개발
2021.11.18 - 2021.12.07
0
600만원
51
0
공유
0
공유

공지사항

[11/18] - 대회 개최일 연기 관련 안내

참가자 여러분 안녕하세요. 

대회 규칙 및 상세 내용 조정으로 인해 대회개최일이 18일로 연기되었습니다.

사전에 공지드리지 못한 점 참가자분들께 진심으로 죄송하다는 말씀 드리며, 더욱 원활한 대회 운영을 위해 힘쓰도록 하겠습니다.

감사합니다.

 

배경

  • 음성인식 문제의 경우 인공지능 비서, 음성인식 봇, AI 스피커, AI 콜센터 등 다양한 분야에서 활용 사례가 증가하고 있습니다.
  • 하지만, 숫자가 포함된 발화 데이터의 경우 숫자의 특성상 문자와의 연음 현상이나, 서수와 기수의 혼재, 같은 숫자의 반복, 자릿수를 끊어서 읽기 등 읽는 방법이 다양한 발화의 특성이 일반적인 음성인식과 다르기 때문에 상대적으로 일반 문장의 음성 인식률에 비해서 떨어집니다.
  • 본 대회는 이러한 문제를 해결하기 위한 알고리즘을 개발하여 공공 목적으로 활용하고자 합니다.

 

평가 방식

  • 평가 점수는 추론된 텍스트와 정답 텍스트의 음절 단위 F1-score(70%)와 숫자가 포함된 단어의 일치율(30%)의 가중 평균으로 계산됩니다.

F1-score(β=1)

 

숫자가 포함된 단어의 일치율

예시)
"[무명 일 동]에서 [무명 이 동]으로 자연스럽게 연결되는 하천이 [하나] 있는데 수질검사에서 낙점을 받았어."
  • 대괄호 내부는 숫자가 포함된 단어를 의미합니다.
  • 숫자가 포함된 단어의 일치율 = 일치하는 개수 / 정답 개수(3개)

 

대회 규칙

제출 관련

  • 본 대회의 제출 횟수는 1일 최대 15회로 제한됩니다.

외부 데이터 사용 관련

  • 본 대회는 외부 데이터 사용이 불가능합니다. 제공된 데이터로만 진행 부탁드립니다.

팀 참가 관련

  • 팀 대표 계정으로 대회참가 신청부탁드립니다.
  • 제출은 반드시 팀 대표 1인의 아이디로 제출 부탁드립니다.
  • 팀이 수상하는 경우 팀 대표에게만 상금이 지급됩니다.