- 배경
전력 공급은 현대 사회의 핵심 요소 중 하나로, 산업 및 생활 활동을 유지하는데 불가결한 역할을 합니다. 전력 공급 안정성과 효율성은 국가 및 기업의 경제적 안전을 보장하기 위해 핵심적인 관심사 중 하나입니다. 전력 공급의 중단이나 장애는 심각한 사회 및 경제적 문제를 초래할 수 있습니다.
최근에는 기술의 발전으로 전력 시스템에서 발생하는 데이터의 양과 다양성이 크게 증가했습니다. 전력 상태 데이터, 전류, 전압, 주파수 및 기타 센서 데이터의 수집 및 분석을 통해 전력 시스템의 상태를 모니터링하고 평가하는 능력이 크게 향상되었습니다. 이러한 데이터는 전력 네트워크의 안정성을 관리하고 문제를 신속하게 식별하는 데 중요한 도구가 됩니다.
그러나 전력 데이터의 분석은 복잡하며, 데이터셋이 매우 크고 다양하다는 과제가 있습니다. 이상 상황, 예를 들어 과부하, 단락, 고장, 불규칙한 전력 요구 등은 이러한 데이터 내에서 발견하기 어려울 수 있습니다.
따라서, 이 대회는 참가자들에게 전력 상태 데이터를 기반으로 이상을 탐지하고 경고 및 예방 조치를 취하는 방법을 개발하는 기회를 제공합니다. 이 대회의 목표는 고도의 신뢰성과 효율성을 가진 전력 시스템을 유지하고 문제를 조기에 감지하여 전력 네트워크의 안전성을 향상시키는 것입니다.
참가자들은 전력 데이터를 분석하고 이상 패턴을 탐지하는 알고리즘 및 모델을 개발하며, 이러한 작업을 통해 실제 세계에서의 전력 시스템 안정성을 개선하는데 기여할 수 있는 기회를 얻을 것입니다.
- 데이터셋
Column은 다음 순으로 되어 있습니다.
R상무효전력 | R상선간전압 | R상역률 | R상유효전력 | R상전류 | R상전류고조파 | R상전압 | R상전압고조파 | S상무효전력 | S상선간전압 | S상역률 | S상유효전력 | S상전류 | S상전류고조파 | S상전압 | S상전압고조파 | T상무효전력 | T상선간전압 | T상역률 | T상유효전력 | T상전류 | T상전류고조파 | T상전압 | T상전압고조파 | 누적전력량 | 무효전력평균 | 상전압평균 | 선간전압평균 | 역률평균 | 온도 | 유효전력평균 | 전류고조파평균 | 전류평균 | 전압고조파평균 | 주파수 |
훈련 데이터 : 모두 정상
시험 데이터 : 정상, 이상
3. 평가 메트릭
F1-score
F1 점수는 분류 모델의 성능을 측정하는 중요한 메트릭 중 하나로, 모델의 정밀도 (Precision)와 재현율 (Recall)을 결합한 지표입니다. 이 메트릭은 특히 불균형한 데이터셋에서 모델의 성능을 평가하는 데 유용합니다.
정밀도 (Precision): 정밀도는 모델이 얼마나 정확하게 양성 클래스를 예측하는지를 나타냅니다. 이는 모델이 예측한 양성 중에서 실제 양성인 샘플의 비율을 의미합니다. 정밀도는 다음과 같이 계산됩니다: Precision = (TP) / (TP + FP) 여기서 TP는 모델이 올바르게 양성으로 분류한 샘플 수이고, FP는 모델이 잘못 양성으로 분류한 샘플 수입니다.
재현율 (Recall): 재현율은 모델이 양성 클래스 중 얼마나 많은 샘플을 식별할 수 있는지를 나타냅니다. 이는 실제 양성 중에서 모델이 올바르게 양성으로 분류한 샘플의 비율을 의미합니다. 재현율은 다음과 같이 계산됩니다: Recall = (TP) / (TP + FN) 여기서 TP는 모델이 올바르게 양성으로 분류한 샘플 수이고, FN은 모델이 놓친 실제 양성 샘플 수입니다.
F1 점수는 정밀도와 재현율의 조화 평균을 통해 계산됩니다. 이를 통해 모델이 양성 클래스를 정확하게 예측하면서도 가능한 한 많은 양성 샘플을 찾는 데 얼마나 성공적인지를 평가합니다. F1 점수는 다음과 같이 계산됩니다: F1 Score = 2 * (Precision * Recall) / (Precision + Recall)