한정된 레이블을 사용한 한국 음식 분류 챌린지.

종료

한정된 레이블을 사용한 한국 음식 분류 챌린지.

2022.10.12 - 2022.12.31

0

0

131

0

0

1.배경

최근 세계적으로 한국문화에 대한 관심도가 늘어나며 한식에 대한 관심또한 커지고 있습니다.
한식은 메인요리 외에도 다양한 반찬과 같이 곁들여 먹는게 일반적인데 한식을 잘 모르는 외국인 기준에서 먹는 음식이 어떤 음식인지도 모르고 먹는 경우가 많습니다.
한식을 잘 모르는 사람들에게 한식을 더욱 알리고 친숙해지도록 한식 분류 모델 챌린지를 제안합니다.
한식은 같은 음식이라 하더라도 지방, 지역에 따라 음식 재료의 구성이 약간씩 달라지기도 하며 조리방법 또한 달라지기도 합니다. 따라서 이런 모든 경우를 고려한 학습은 어렵기 때문에 한정된 레이블을 사용하는 few-shot learning classification 챌린지를 진행합니다.

2. few-shot learning

few-shot learning이란 각 클래스당 1~10개 정도의 학습데이터만을 사용해서 학습하는 방법을 의미합니다.
매우 적은 학습데이터셋으로 학습해야 하는 조건이 매우 어려운 만큼 이러한 문제를 풀기 위해 많은 방법들이 소개되었는데, 그중에서도 transfer-learning을 기반으로 이번 챌린지를 진행합니다.
먼저 transfer-learning에 대해 간략히 소개를 하자면, 거대한 학습 데이터셋에 사전 학습된 모델의 가중치를 사용해 한정된 레이블(few-shot)을 사용해서 재학습하는 과정을 말합니다.
최근 few-shot learning에서 준수한 성능을 보이는 방법은 주로 사전학습시 거대한 학습 데이터셋에 self-superviesd방법을 적용시켜 사전학습시키는 방법입니다.

3. 데이터 제공

데이터셋은 AI-Hub에 공개된 한국 이미지(음식) 데이터셋을 활용합니다.
데이터셋 출처 : https://www.aihub.or.kr/aihubdata/data/view.do?currMenu=116&topMenu=100&aihubDataSe=ty&dataSetSn=79
보다 쉬운 챌린지를 위해 총 12개의 대분류 밑에 150개의 소분류로 나눠져 있지만, 12개의 대분류를 분류하는 문제로 정의합니다.
학습 데이터셋은 12개의 대분류당 10개의 데이터가 주어져 총 120개의 학습데이터셋으로 구성됩니다.
테스트 데이터셋은 12개의 대분류당 100개의 데이터가 주어져 총 1200개의 테스트데이터셋으로 구성됩니다.

4. 평가방법

이미지 분류에 사용되는 Top 1 acc (%)를 평가방법으로 사용합니다. ( Top 5 acc는 평가하지 않습니다.)

5. 대회규칙

외부 데이터셋은 자유롭게 사용가능합니다.
초거대 model의 pre-trained weight를 사용하는것또한 가능합니다.