[15주차] 기말고사 - Gemma LoRA 파인튜닝으로 댓글감성 분류하기🕵🏻

2024.04.29 - 2099.02.01
14

참여하기

본 세미나 및 경진대회에 참여하시려면, 상단 위 [참여하기]라는 버튼을 클릭해주시면 됩니다.

실시간 세미나

구글 오픈소스 LLM인 Gemma를 이용하여 댓글 감성 분류를 해보자

  • 구글이 오픈소스 언어 모델인 Gemma2B와 7B를 공개했습니다.
  • Gemma2B인 경우 구글 코랩의 T4 GPU을 이용하여 수십분 이내로 태스크별 파인튜닝이 가능합니다. 
  • Gemma2B 파인튜닝을 통하여 댓글 감성 분류를 해봅니다.

경진대회

  • 시작일 : 2024년 6월 10일(월요일) 오후 7시 30분   (✨세미나 시작 시간에 오픈됩니다✨)
  • 종료일 : 2024년 6월 23일(일요일) 오전 11시 00분

데이터셋

베이스라인 코드

  • 본 태스크를 쉽게 따라할 수 있도록 Gemma 2B 파인튜닝 및 댓글 감성 분류 예제를 구글 코랩에서 바로 해볼 수 있도록 준비해뒀습니다. 
  • [베이스라인] 탭에서 [Open in Colab] 버튼을 클릭하시면 됩니다. 

평가방법

  • 여러분이 제출할 tarr_sample_submit.txt에는 음식점 댓글 문장만 포함되어 있고, 라벨값은 제공되지 않습니다. 
  • Gemma 모델을 통해 tarr_sample_submit의 문장을 입력하여 추론한 라벨값을 파일로 저장한 뒤 제출합니다. 
  • 제출은 우측 상단에 [제출하기] 버튼을 클릭하시면 됩니다. 제출양식은 [베이스라인]을 참고하시기 바랍니다. 
  • AIFactory 플랫폼에는 정답 라벨값이 저장되어 있으며, 사용자와 제출한 라벨값과 비교하여 점수를 매깁니다. 이진 분류이므로 정확도로 평가됩니다. 총 100개의 문항이므로 모두 맞추면 1.0점, 50개 맞추면 0.5점입니다. 

코드 제출 및 검증

  • 대회가 종료되면 토론탭에 여러분의 솔루션 및 소스코드를 게시물로 등록 합니다.
  • 재현이 가능해야하므로 구글 코랩에서 바로 동작할 수 있도록 사전 점검을 마칩니다.
  • 코드 검증 시 재현이 되지 않는다면 별도 문의를 드릴 예정입니다.
  • 재현이 원활하지 않을 경우 불이익이 생길 수 있습니다.