대회 개요
배경
최근의 인공지능은 MNIST, CIFAR-100, ImageNet 등 Image Classification (이미지 분류) 문제의 대표적인 벤치마크에서 90% 이상의 정확도를 달성하며 super-human 수준에 도달했다고 평가받고 있다.
하지만 이러한 성공적인 모델들을 막상 실세계의 문제를 해결하려고 적용할 때는 다양한 문제가 발생하는데, 본 대회는 그 중에서 파괴적 망각 문제를 해결하고 연속학습을 달성하는 것을 목표로 한다.
Catastrophic Forgetting (파괴적 망각)
파괴적 망각 문제는 학습하려는 모델에 연속적인 방식으로 입력 데이터를 학습하려고 할 때 발생하며, 근본적으로 모델 가중치의 덮어쓰기에 의해 발생된다고 설명할 수 있다.
예를 들어, 현존하는 모든 차량의 외관 데이터를 학습한 모델은 지금까지 학습한 차종을 잘 분류할 수 있다.
하지만 시간이 지나 신차가 여럿 출시되고 새로운 차종에 대한 분류를 위해 이 모델을 업데이트 해야한다고 가정해보자.
- 이전에 학습에 사용했던 모든 차량의 외관 데이터와 신차에 대한 외관 데이터를 모두 모아 새 모델에 처음부터 새롭게 학습하는 것은 비용이 너무 많이 들고, 신차가 추가될 때마다 매번 새로 학습해야 하는데 그 비용은 점점 증가하는 문제가 있다.
- 이전에 학습된 모델에 신차에 대한 외관 데이터만을 연속적으로 학습시키면 파괴적 망각이 발생한다.
→ 신차에 대한 학습이 추가적으로 이루어짐으로써 이전에 학습한 차량과 신차 모두 잘 분류하기를 기대했겠지만,
→ 실제로는 이전에 학습했던 지식은 거의 잃어버려 방금 학습한 신차에 대해서는 분류를 잘 수행하더라도 이전에 학습했던 차종을 더이상 분류하지 못하는 결과를 얻게 된다.
→ 신차 데이터에 의해 이전에 학습된 모델의 가중치가 덮어써지며 이전 차종에 대한 의미를 잃어버리게 된 것이다.

Continual Learning (연속학습)
연속학습은 파괴적 망각 문제를 해결하여 이전 task와 현재 task 모두에서 좋은 성능을 내는 것을 목표로 한다.
연속학습 실험의 전제조건은 다음과 같다.
- Disjoint set으로 이루어진 여러 task들을 연속적인 방식으로 학습한다.
- 다음 task를 학습하기 시작하면 더이상 이전 task 데이터에 접근할 수 없다.
- 지금까지 학습한 모든 task 데이터에 대해 평가를 진행한다.
예를 들어,
Task 0: {(X,Y) of class 0, 1, …, 9}
Task 1: {(X,Y) of class 10, 11, …, 19}
…
Task 9: {(X,Y) of class 90, 91, …, 99}
학습 데이터가 위와 같이 구성되어 있다면,
Task 0 학습, task 1 학습, …, task 9 학습 과 같이 연속적으로 학습이 진행되고,
만약 task 2를 학습 중이라면 이전 task에 해당하는 task 0, task 1 데이터는 더이상 사용할 수 없다.
(물론 현 시점에서 아직 발생하지 않은 future task (task 3, …) 데이터를 미리 학습해서도 안된다.)
Task 9 까지 학습이 모두 완료되면, 지금까지 학습한 class 0~99 중 어떤 입력에 대해서도 올바른 분류를 수행할 수 있어야한다.
평가방법
학습한 모든 task 입력에 대해 top-1 accuracy(%)를 사용

K: 전체 task 개수 (ex. 10)
A_K,t: task K 까지 학습 후 (모두 학습 완료 후), task t 데이터에 대한 top-1 accuracy
데이터셋 정보
차량 외관 영상 데이터 (AI-Hub 제공: https://www.aihub.or.kr/aihubdata/data/view.do?dataSetSn=554)
차종 100종에 대한 차량 외관 학습데이터 322,664 장
→ 소분류ID(1~100)를 class label(0~99)로 활용
Trainset
10개 task로 분할한 차종 100종에 대한 차량 외관 학습데이터 290,004 장
source: 091.차량 외관 영상 데이터/01.데이터/1.Training/원천데이터/TS*.zip
Task 0: {(X,Y) of class 0, 1, …, 9}
Task 1: {(X,Y) of class 10, 11, …, 19}
…
Task 9: {(X,Y) of class 90, 91, …, 99}
Testset
차종 100종에 대한 차량 외관 학습 데이터 32,660 장 (random order)
source: 091.차량 외관 영상 데이터/01.데이터/2.Validation/원천데이터/VS*.zip
https://drive.google.com/file/d/1lNlg8xgSwR8ip9NJWkbh8E5dQEZx3uDj/view?usp=sharing
샘플 데이터 및 제출 csv 형식은 '데이터' 탭 하단 ‘기타 파일’ 참조
| X (input) | Y (label) | |
|---|---|---|
| 형식 | jpg image (1920x1080x3) | int (0~99) |
| 예시 | ![]() | 6 |
데이터 분포

서비스 활용 시나리오
- 자율 주행 차량을 위한 전용 모델
- 도로 주행하는 승용차량 차종 구분을 위한 전용 프로그램에 활용
- 자율 주행 차량에 연계된 도로 위 사물 인식 시스템의 한 모듈로서 포함됨
- CCTV 연동 전용 모델
- 도로를 주행하는 승용차량 차종 구분을 위한 전용 프로그램에 활용
- 자동차 주행 도로에 설치된 CCTV와 연계된 도로 위 사물 인식 시스템의 한 모듈로서 포함된
- 자동차 견적 및 수리 App 구성 모듈
- 자동차 사용자가 직접 촬영한 자동차 사진에서 차종 및 외관 구성 요소를 구분해내고, 각 구성 요소별 이상 탐지를 하는 별도의 모듈과 연계하여 견적 또는 소리에 대한 정량적 지표 출력 가능

