[분야2] 서비스 품질 보장을 위한 플로우 특성 실시간 식별
2025.08.01 - 2025.08.31
0
1200만원
105
0
공유
0
공유

[문제2] 서비스 품질 보장을 위한 플로우 특성 실시간 식별

 

📚 대회 주제 및 분야 소개

👩🏻‍💻 예선 온라인 해커톤

🔹 분야 #2: 서비스 품질 보장을 위한 플로우 특성 실시간 식별

[출제배경]

  • 네트워크 플로우 분석은 네트워크 관리 및 보안 위협 탐지에 매우 중요합니다. 플로우를 구성하는 패킷들의 정보를 분석하여 플로우 지속시간과 전송량 등으로 플로우를 정확히 식별하면, 네트워크 성능 관리, 자원 할당, 비정상 행위 탐지 등에 유용하게 활용될 수 있습니다. 본 문제를 통해 AI 모델의 패킷 단위 데이터 처리 능력과 플로우 식별 정확도를 평가하고자 합니다.

[학습데이터]

  • 24시간 동안 수집된 플로우 데이터 및 플로우 패킷 데이터
  • 플로우 데이터 구성
    • flow_start_time: 플로우 시작 시간
    • src_ip, dest_ip: 출발지 및 목적지 IP (익명화된 값)
    • src_port, dest_port: 출발지 및 목적지 포트 (익명화된 값)
    • protocol: 상위 프로토콜 유형
    • pkt_count: 플로우에 속한 총 패킷 수
    • volume: 플로우에 속한 총 패킷 길이의 합
    • flow_duration: 플로우 지속시간
       
  • 플로우 패킷 데이터 구성
    • pkt_capture_time: 패킷 수집 시간
    • flow_start_time: 플로우 시작 시간
    • src_ip, dest_ip: 출발지 및 목적지 IP (익명화된 값)
    • src_port, dest_port: 출발지 및 목적지 포트 (익명화된 값)
    • protocol: 상위 프로토콜 유형
    • ip_len: IP 패킷 길이
    • ip_hdr_len: IP 헤더 길이
    • ip_tos: IP 헤더의 Type of Service
    • ip_ttl: IP 헤더 Time to Live
    • 이외 TCP 정보

[문제 구성 및 풀이 요령]

  • 플로우를 구성하는 첫 번째에서 n번째 (임의의 개수) 패킷의 정보를 활용하여, 지속시간과 전송량을 기준으로 정의된 여러 가지 플로우 유형 중에서 해당 플로우가 어떤 유형에 속하는지를 정확히 식별하는 문제입니다. 플로우 데이터셋과 플로우 패킷 데이터셋을 잘 연계하여 정확한 데이터셋을 구축하고 플로우의 초반 패킷 정보로부터 플로우를 신속하게 식별하는 것이 중요합니다.

[채점 기준]

  • 분류 정확도
  • 플로우 식별에 필요한 패킷 수
     

📊 평가 기준

본 해커톤에서는 다음과 같은 절차를 통해 최종 심사합니다 

  • 온라인으로 진행되는 예선에서는 해커톤 순위와 모델 설명서에 대한 정성적 심사를 통해 상위 6개 팀을 1차적으로 선발
  • 코드 재현성 검증을 거친 이후 결격 사유가 없다면 오프라인 본선 진출
    • 코드 재현성 검증 시 심각한 결격 사유가 발견되는 경우 해당 팀의 본선 진출 자격을 박탈하며 차순위 팀에게 본선 진출 자격이 주어짐
  • 오프라인 본선 심사를 통해 온라인 예선 상위 6개 팀의 최종 순위 결정

 

✅ 예선 온라인 해커톤 : 정량 및 정성 평가 (혼합)

  • 입상 후보팀으로 선정되는 경우 아래 3개 저작물을 cs@aifactory.page로 일괄 제출
  • 코드와 주석의 인코딩은 모두 UTF-8을 사용
  1. 작성 코드: .py 또는 .ipynb
    • 최종 1회 제출
    • 학습용 소스와 추론용 소스를 별도의 파일로 분리하는 것을 권장
    • 검증 자료 제출 시 사용한 python 버전, OS 버전 필수 기재 (권장버전: python 3.9)
    • 특히 특수 패키지를 사용하는 경우 반드시 python 패키지 명시
       
  2. 모델 가중치(weight) 파일 또는 저장된 모델
    • 딥러닝 계열로 weight가 파일로 저장되는 경우 저장된 weight
    • 그 밖의 겨우 pickle/joblib 등의 라이브러리를 이용해 dump한 모델
       
  3. 모델 설명서: *.docx(양식보기)
    • 최종 1회 제출
       

✅평가 방식

  • 분야 1과 2의 문제 풀이 점수를 정규화 후 합산하여 100점 만점으로 평가
  • 각 분야 별 배점은 아래 표 참고
 분야 1 (40점)분야 2 (60점)
문제풀이 정확도 (모델 성능)20점30점
문제풀이 정확도 (모델 설명서)20점30점

  •  

🗓 진행 일정

이번 대회는 온라인 해커톤을 통한 예선과 발표평가인 본선으로 진행되며 각 일정은 아래와 같습니다.
 

진행 일정시작일종료일
참가자 접수 기간7월 14일 (09:00)8월 15일 (23:59)
온라인 예선8월 1일 (09:00)8월 31일 (23:59)
검증기간 (예선)9월 1일9월 14일

본선 진출팀 결과 발표 

(6개팀 선정)

9월 15일
본선은 오프라인으로 진행됩니다.
오프라인 발표일 및 시상식9월 25일
  • 참가자 접수 기간 : 7월 14일(월) 오전 9시  ~ 8월 15일(금) 오후 11시 59분
  • 온라인예선 : 8월1일(금) ~ 8월 31일(일) 오후 11시 59분
  • 예선 온라인 해커톤 검증 기간 : 9월 1일(월) ~ 9월 14일(일)
  • 본선 오프라인 진출팀 결과 발표 : 9월 15일 *총 6개 팀 선정 
  • 본선 오프라인 발표일 및 시상식 : 9월 25일(목)

🏢 오프라인 발표 및 시상식 장소는 서울(추후 확정) 입니다

* 원활한 대회 운영을 위하여 하기 일정은 변동될 수 있으며 변경 시 공지사항을 통해 전체 안내드립니다