인공지능 모델로 재활용품 이미지를 분류하는 것을 목표로 한 Task이다. 재활용품 이미지에 상응하는 label을 분류 예측하는 것이다. Task에 대한 솔루션 수행 시, 모델 아키텍처에 대한 것은 베이스라인으로 주어진 사전 학습된 ResNet34에서 다른 CNN 기반 모델(VGG, ResNet18, ResNet50, ResNet121, DenseNet121 등)의 적용과 Fine-tuning을 통해 적용된 모델의 학습이 되는 부분을 조정하였다. 예를 들어, freeze 되는 부분의 위치 및 영역의 범위를 변경하고 FC Layer 부분에 Dropout과 같은 Normalize를 적용하여 모델의 성능을 비교 실험하였다. 또한, 하이퍼파라미터 튜닝으로 batch size, epoch, learning rate와 같은 값의 변경으로 모델의 성능을 비교할 수 있었다. Accuracy 이외의 다른 평가 지표를 사용하지 못 하였는데 추후 이 부분은 개선점이라 생각한다.
모델 아키텍처모델 아키텍처의 경우 기존 베이스라인의 resnet34에서 resnet50의 predtrained된 모델로 변경하여 진행하였습니다. resnet50이 비교적으로 전체적인 task에서 효과적인 성능을 보인다는 것을 과거 경험을 기반으로 선정하여 변경하였으며, 실제로 resnet34를 통해 학습한 결과보다 더 높은 성능을 보였습니다. 하이퍼파라미터 튜닝기존 베이스라인의 learning rate의 경우 0.001로 비교적 빠르게 loss를 업데이트하도록 설계되어 있었습니다. 하지만 resnet50으로 layer를 수정하며, 모델이 더 잘 수렴하기 위해서는 learning rate를 0.0001로 변경하여 loss가 더 잘 수렴하도록 설계하여 학습을 진행하였습니다.pretrained 모델을 사용하였지만 새로운 데이터로 새롭게 학습하기 때문에, epoch를 20으로 늘려서 진행하였습니다. 소감과거의 경험을 기반으로 resnet50 모델이 전반적인 task에서 준수한 성능을 보인다는 것을 이번 테스크에서도 적용하여 실제로 뛰어난 성능을 달성하였습니다. 또한 learning rate 역시 모델 학습에 매우 중요한 요소라는 것을 이번 기회에 정확히 이해할 수 있었으며, 복잡한 모델의 많은 데이터일수록 learning rate를 적게 설정하여 모델이 천천히 학습하여 최적의 파라미터를 찾을 수 있도록 설계하는 것이 중요하다는 것을 이번 기회에 더 잘 알 수 있었습니다. 추가로 이러한 재활용품 분류 task는 현재 쓰레기 문제로 전세계에서 큰 문제로 동작하는데, 이러한 모델의 개발이 실제에도 이어져 사람에게 도움을 줄 수 있는 인공지능으로 동작할 수 있다는 기대에 더욱 관심있고, 흥미로운 테스크였습니다.이번 기회로 learning rate와 model의 선정의 중요성을 다시 한번 느끼게 되는 좋은 기회였습니다.
안녕하세요, 김동훈입니다.다음 Task의 솔루션을 간단하게 요약하고자 합니다.1. 모델 아키텍쳐모델은 ImageNet pretrained ResNet152 모델을 이용했습니다.클래스 수를 task에 맞게 수정해주었습니다. 2. 하이퍼 파라미터 튜닝학습 epoch만 50 정도로 늘려 학습을 수행했습니다. 3. 전처리 / 후처리데이터 증강은 다음을 적용하였습니다.RandomRotation(15)Random Horizontal / Vertical FlipNormalize( 0.5, 0.5) Confusion matrix를 관찰한 결과 배터리 예측을 못하는 것 같아 최종적으로 모델 예측 시에는 앙상블을 적용하였습니다.last 체크포인트, 가장 낮은 loss를 갖는 체크포인트, 가장 높은 학습 정확도를 갖는 체크포인트를 사용하여hard vote를 수행하여 최종 결과를 예측하였습니다.
기본 모델: TorchVision의 ResNet34 모델.성능: 기본적인 성능을 보임.성능 개선 시도선택한 모델: Torchvision의 ResNet50.이유: 더 향상된 모델 구조로 성능 향상예상.조정된 요소: 배치 크기, 에포크 수.목적: 최적의 학습 조건 탐색.성능 개선 실패문제점:언더피팅(모델이 학습 데이터를 충분히 학습하지 못함)오버피팅(모델이 학습 데이터에 지나치게 최적화되어 일반화 성능이 떨어짐)가능한 원인:모델 구조에 따른 최적의 하이퍼파라미터 조정 실패학습 과정에서의 Input 데이터 처리 또는 전처리 문제결론 및 향후 계획결론: resnet50을 사용한 성능 개선 시도는 성공적이지 못했음.향후 계획:데이터 전처리 및 Augmentation 기법 도입 등다른 모델 아키텍처 탐색더 정밀한 하이퍼파라미터 튜닝 시도
모델의 backbone의 경우, 기존 베이스라인 코드에서는 pretrained ResNet34 모델을 사용했던 것 과는 달리 pretrained EfficientNet_B1을 사용하여 학습을 진행했다. 그리고 배치 사이즈는 기존 베이스라인 코드에서는 256을 사용했던 것 과는 달리 16을 사용했다.그리고 epoch수도 대폭 늘려 10으로 설정하였다. (베이스라인 코드에서의 epoch은 1)learning rate는 기존 baseline과 동일하게 1e-3을 사용하였다.해당 솔루션으로 베이스라인과 비교했을 때 한번에 많은 accuracy 격차를 확보할 수 있었지만, 솔루션을 작성해보고 나니 learning rate에 대한 튜닝이 부족한 것 같아 아쉬움이 남았다.
학습 모델로 이미지넷으로 사전학습한 ResNet-34를 활용하였으며, Optimizer는 Adam Optimizer를 활용함. Learning Rate는 0.001로 설정하였고 학습을 위해 Batch size, Epoch은 각각 128과 5로 설정하였음. 본 태스크를 통해 인공지능을 실생활에 적용하는 방법에 대해 간접적으로 경험할 수 있었으며, 실생활에 범용적으로 활용할 수 있도록 인공지능 모델을 학습하는 것은 매우 중요하며 쉽지 않은 문제임을 경험하였음. 재활용품을 분류 하도록 학습한 인공지능 모델의 도입을 통해 재활용품의 정확한 분류될 수 있음을 확인하였고, 이를 통해 폐기물의 양을 줄이고 자원을 효과적으로 보존하는 데 기여할 수 있으며, 최근 대두되고 있는 환경 문제를 완화하는 데 큰 기여를 할 수있다고 생각함. 또한 인공지능 모델의 도임을 통해 재활용품의 분류 프로세스를 자동화하여 분류 시간을 단축하고 분류 작업시 발생할 수 있는 오류를 최소화할 수 있다는 기대효과가 존재함.