CVPR2023에 제출된 Exploring Incompatible Knowledge Transfer in Few-Shot Image Generation의 baseline 코드를 기반으로 사용했습니다.해당 논문은 few shot과 domain adoptation에 특화되어 있기에, 이를 해당 테스크에 맞게 변환하여 iteration을 2000까지 돌린 뒤 그 중 제일 해당 캐릭터와 비슷하게 생성된 iteration을 제출하였습니다. 해당 코드를 사용하기 전에는 RGB의 색 조합으로만 보였던 image가 CVPR 코드를 사용하니 캐릭터의 얼굴과 비슷하게 생성되는 것을 보고모델의 튜닝에도 집중이 필요하다고 느꼈습니다.
태스크 주제가 너무 흥미로웠습니다, 학습 코드를 분석하면서 주로 학습 에포크를 수정하였습니다. 여러번 학습을 수행하면서 최적의 정확도를 찾을 수 있도록 하였습니다. 베이스라인 코드에서 GAN기반의 프로세스로 수행이 되었는데, 시간이 있다면 Diffusion모델이나 다른 모델을 적용해서 학습을 하고자 하였는데 시간이 조금 부족해서 주로 학습코드의 에포크를 10, 20, 30 등 10단위로 올려가면서 파인튜닝으로 학습 정확도를 구하였습니다. 현재 학습 코드는 고급 GAN 아키텍처를 위한 훈련 스크립트로, 이미지 생성 작업에 사용되는 다양한 코드가 적용되어 있습니다, 분산 훈련 지원, 정규화 기술, 그리고 다양한 손실 함수의 적용이 특징입니다. 향후 기회가 된다면 추가적인 로직 및 GAN이 아닌 다른 방법으로 코드를 구현해보고 싶습니다. 감사합니다.