본 프로젝트의 목적은 최신 랜섬웨어를 이미지화 후 이를 기반으로 랜섬웨어 종류를 분류하는 것 입니다. 이를위해 랜섬웨어 전 영역 및 특정 영역을 분류하여 시각화를 진행합니다. 이후 데이터 개수 및 CNN layer 개수에 따른 정확도에 대해 비교 분석함으로써 최적의 분류 기법을 제안합니다.
[Overview]
본 프로젝트의 CNN 모델의 목표는 랜섬웨어 이미지를 기반으로 랜섬웨어 종류를 분류하는 것 입니다.
- Model description
- Input: 랜섬웨어 이미지
- Output: 랜섬웨어 종류 (DarkSide, Gandcrab, Maze, NetWalker, Ryuk, Sodinokibi)
[Limitations]
- 최신 랜섬웨어에 대한 학습이 진행됨에 따라 기존의 랜섬웨어에 대한 분류는 어려울 수 있습니다.
- 단순히 랜섬웨어 여부에 대한 판단은 정확도가 높을 것으로 예상되지만 학습되지 않은 종으로 test를 진행할 경우 정확도가 현저히 낮을 수 있습니다.
[Performance]
모델 성능 평가를 위해 전체 데이터 중 정확히 분류된 데이터의 수를 의미하는 Accuracy(정확도)를 활용하며, 각 랜섬웨어 종류 별 결과를 시각화하여 확인할 수 있도록 Confusion matrix(혼동 행렬)을 활용합니다.
[Test your own data]
랜섬웨어로 의심되는 파일을 이미지화 해보세요.
이후 해당 파일의 랜섬웨어 여부 및 종류를 확인해보세요.
