1. 모델 선택의 변경
- 초기 접근: 기본 CNN 모델의 한계 인지.
- 전략적 전환: Torchvision의 DenseNet121 모델 채택.
- 선택 이유: 복잡한 구조로 더 나은 학습 성능 기대.
2. 성능 평가 및 하이퍼파라미터 조정
- 초기 성능 평가: 기초적인 성능 수준 진단.
- 조정된 하이퍼파라미터: 배치 크기와 에폭 수 조정으로 최적의 학습 환경 마련.
3. 성능 개선 결과와 문제 진단
- 언더피팅 및 오버피팅 문제 식별.
- 언더피팅: 모델이 데이터를 충분히 학습하지 못하는 상황.
- 오버피팅: 훈련 데이터에 과도하게 적응하여 일반화 실패.
4. 원인 분석
- 데이터셋의 한계: 다양성이 부족함.
- 모델과 하이퍼파라미터의 불일치: 구조적 최적화 미흡.
- 데이터 처리 문제: 학습 과정 중 적절한 전처리 부재.
5. 결론 및 향후 계획
- 현재 상황: DenseNet121 사용에도 성능 개선이 제한적.
- 향후 방향:
- 데이터 처리 방식 개선: 전처리 및 데이터 증강 기법 강화.
- 모델 다양화: 다른 아키텍처에 대한 실험.
- 하이퍼파라미터의 더 정밀한 조정.