참여하기
본 세미나 및 경진대회에 참여하시려면, 상단 위 [참여하기]라는 버튼을 클릭해주시면 됩니다.
실시간 세미나
- 세미나 일정 : 6월 10일 (월요일) · 오후 7:30~ 8:30
- 시간대: Asia/Seoul
- 세미나 링크(Google Meet) : https://meet.google.com/kkh-ayaw-dhv
구글 오픈소스 LLM인 Gemma를 이용하여 댓글 감성 분류를 해보자
- 구글이 오픈소스 언어 모델인 Gemma2B와 7B를 공개했습니다.
- Gemma2B인 경우 구글 코랩의 T4 GPU을 이용하여 수십분 이내로 태스크별 파인튜닝이 가능합니다.
- Gemma2B 파인튜닝을 통하여 댓글 감성 분류를 해봅니다.
경진대회
- 시작일 : 2024년 6월 10일(월요일) 오후 7시 30분 (✨세미나 시작 시간에 오픈됩니다✨)
- 종료일 : 2024년 6월 23일(일요일) 오전 11시 00분
데이터셋
- 음식점 댓글 감성 분류 데이터셋
- 훈련 데이터셋 및 테스트를 위한 데이터셋은 데이터 탭에서 확인 부탁드립니다.
베이스라인 코드
- 본 태스크를 쉽게 따라할 수 있도록 Gemma 2B 파인튜닝 및 댓글 감성 분류 예제를 구글 코랩에서 바로 해볼 수 있도록 준비해뒀습니다.
- [베이스라인] 탭에서 [Open in Colab] 버튼을 클릭하시면 됩니다.
평가방법
- 여러분이 제출할 tarr_sample_submit.txt에는 음식점 댓글 문장만 포함되어 있고, 라벨값은 제공되지 않습니다.
- Gemma 모델을 통해 tarr_sample_submit의 문장을 입력하여 추론한 라벨값을 파일로 저장한 뒤 제출합니다.
- 제출은 우측 상단에 [제출하기] 버튼을 클릭하시면 됩니다. 제출양식은 [베이스라인]을 참고하시기 바랍니다.
- AIFactory 플랫폼에는 정답 라벨값이 저장되어 있으며, 사용자와 제출한 라벨값과 비교하여 점수를 매깁니다. 이진 분류이므로 정확도로 평가됩니다. 총 100개의 문항이므로 모두 맞추면 1.0점, 50개 맞추면 0.5점입니다.
코드 제출 및 검증
- 대회가 종료되면 토론탭에 여러분의 솔루션 및 소스코드를 게시물로 등록 합니다.
- 재현이 가능해야하므로 구글 코랩에서 바로 동작할 수 있도록 사전 점검을 마칩니다.
- 코드 검증 시 재현이 되지 않는다면 별도 문의를 드릴 예정입니다.
- 재현이 원활하지 않을 경우 불이익이 생길 수 있습니다.