[Space-S x KaKR] 그래프 러닝 및 해커톤
2022.09.18 - 2022.10.31
0
525만원
0
공유
0
공유

📊 대회 주제

그래프 데이터 분석에 머신러닝 및 딥러닝을 활용한 모델링의 성공사례가 늘면서 그래프 데이터에 대한 관심이 높아졌습니다. 그래프 데이터는 추천시스템, 물질개발, 신약개발에 필수적으로 사용되는 데이터 타입입니다. 그래프 데이터에 대해서 함께 배우고 커뮤니티 집단 지성을 이용해 다양한 솔루션을 얻고자 합니다. 
 

🎯 데이터셋

  • http://quantum-machine.org/datasets/ (Quantum-Machine.org)
  • C,H,O,N,F로 구성된 134k개의 안정된 small organic molecules 로 이루어져 있으며, 각 분자들에 대하여 양자역학계산을 사용해 기하학적, 에너지, 전자 및 열역학적 특성등 여러 물성을 계산한 데이터셋 입니다. 본 데이터베이스는 그래프 관련 연구에서 활발하게 활용되는 데이터셋이며, 양자역학 기법, 머신러닝 기법의 연구 개발에 쓰입니다.

💡 태스크

  • 입력
    • 노드(원자) 피쳐와 엣지(본드)피쳐로 이루어짐
    • 노드 피쳐: 5개 원자(Hydrogen, Carbon, Oxygen, Nitrogen, and Flourine)
    • 에지 피쳐: 4개의 본드 타입인 (single, double, triple, and aromatic bonds)
    • 각 피쳐는 인덱스로 표현되어 있으며, 원핫인코딩을 사용하시거나, 임베딩 레이어를 사용해 피쳐로 표현하실 수 있습니다.
  • 출력
    • Dipole moment (unit: D)
  • 평가 메트릭: Mean Absolute Error

📺 러닝

  • 그래프 데이터 이해하기 (추후제공)
  • 모델 베이스라인 코드 제공 : 베이스라인 탭의 모델링 베이스라인 참고
  • 데이터 시각화 코드 제공 : 베이스라인 탭의 시각화 베이스라인 참고

📆 대회 일정

  • 사전설명회: 9월 17일 (토) 19:30 (아래 유튜브 라이브에서 진행예정)
  • 참가 신청 및 대회 진행 : 9월 19일 (월) 09:00 ~ 10월 23일 (일) 23:55
    • 베이스라인 모델 제공 : 9월 19일부터
    • 시각화 및 코드공유 기능 제공 : 9월 26일부터
  • 수상발표: 10월 25일 (화) 09:00
  • 커뮤니티 데이: 10월 28일 (금)

※ 대회의 원활한 진행을 위하여 상세일정은 변경될 수 있음을 사전 안내드립니다

🙆🏻 참가 자격

  • 인공지능을 통한 문제해결에 관심있는 14세 이상 개인 및 팀 (최대 5인 이하)
  • 팀 대표자는 상금 수령이 가능한 국내 계좌를 보유하고 있는 대한민국 국적자여야 함
  • 팀병합은 대회 종료 2주전까지만 가능
  • 개인이 두 개 이상의 팀에 중복으로 참여 불가


🏆 상금

해커톤 리더보드 상

  • qm9 해커톤: 1등, 1,000,000원
  • qm9 해커톤: 2등, 750,000원
  • qm9 해커톤: 3등, 500,000원

시각화 및 커뮤니티 상

  • 시각화 상: 4팀, 250,000원
  • 코드공유 상: 4팀, 250,000원
    노력상: 4팀 250,000원

※ 상기 명시된 상훈은 변동될 수 있습니다.

🤝 주최/주관


📌 대회 규칙
 

팀 참가 관련

  • 해커톤 진행 중 결과 제출은 반드시 팀 대표 1인의 아이디로 제출해주시기 바랍니다.
  • 팀이 수상하는 경우 팀 대표에게 상금이 지급됩니다.

 

저작물 검증 관련

  • 입상 후보팀으로 선정되는 경우 아래 저작물을 제출해야 합니다.
    1. 작성 코드 : *.py 또는 *.ipynb → 최종 1회 제출 (학습용 소스와 추론용 소스를 별도의 파일로 분리하는 것을 권장)
    2. 모델 weight 또는 저장된 모델 : 딥러닝 계열로 weight가 파일로 저장되는 경우 저장된 weight를, 그 밖의 경우는 pickle/joblib 등의 라이브러리를 이용해 dump한 모델
    3. 모델 설명서 (풀이 방식 설명): *.docx (양식 보기) 
    4. 코드와 주석의 인코딩은 모두 UTF-8을 사용
    5. 작성 코드와 모델 설명서는 cs@aifactory.page 로 일괄 접수
  • 입상자가 제출한 코드는 공지된 검증 기간 내 구동 및 성능에 대한 재현성 검증이 되어야 합니다.
    • 모든 코드는 오류 없이 실행되어야 함
    • 별도 필요한 라이브러리가 있을 경우 소스코드 내에 설치하는 코드가 있어야 함
    • 원활한 코드 구동 및 성능 재현성 검증을 위해 필요한 최소한의 주석 혹은 가이드가 제공되어야 함

 

모델 재현 규정 (10월 5일 추가)

  • Pretrained 모델 사용 하는 경우 대회에서 사용하는 타겟 레이블(mu)을 사용하지 않은 Pretrained 모델만 허용합니다.
  • 기존 제출한 스코어가 Pretrained 모델을 사용한 경우 사용한 Pretrained 모델 또한 재현할 수 있어야 합니다.
  • 추가 사유 : 모델 해커톤 관련하여 몇가지 안내 사항 전달드립니다. 이번 대회에서 공개 데이터 셋을 사용하고 있어 Test Set의 정답을 유추할 수 있습니다. 대회 규정에 제출한 점수가 재현할 수 있어야 한다는 규정이 존재하지만,  Pretrained 모델을 사용하는 경우 치팅을 하더라도 식별하기 어려운 문제가 있습니다. 이에 따라 공정한 대회 진행을 위해 추가 규정을 공지합니다.

 

📝 저작물 소유권 관련

  • 공모전에 제출된 응모작에 대한 권리는 응모자에게 있으며, 입상자에 한해 저작물에 대한 기술 라이센스 공동 사용 계약을 체결하게 됩니다.
  • 본 경진대회의 주최자는 응모작들 중 입상하지 않은 응모작에 대해서는 어떠한 권리도 취득할 수 없습니다.
  • 공모전 응모자는 응모작의 반환을 요구할 수 있으며, 이 때 주최 측은 작품 반환 후 응모작과 관련된 자료 일체를 즉시 폐기합니다.
  • 공모전에 응모된 응모작과 관련하여 주최 측과 참가자 사이에 분쟁이 발생할 경우, 주최 측과 참가자는 우선적으로 대화와 협상을 통하여 분쟁을 해결하도록 최선을 다해야 합니다.
  • 본 대회에서 제공되는 저작물은 주최사 및 주관사의 자산이며 해당 정보는 본 대회의 참가 목적으로만 사용해야 하고, 그 외 용도로 타인에게 양도 및 대여, 재배포, 2차적 저작 및 상업적 용도로 이용할 수 없습니다.
  • 그밖의 산출물에 대한 권리 등 법적 권리에 관한 사항은 문체부 ‘창작물 공모전 가이드라인’을 준용합니다.
  • 표절 및 저작권 관련한 부분은 관련 법규 및 규정을 준수합니다.

 

📨 문의

  • Q&A 탭에 질문을 올려주세요~

 

📨 참고

  • L. Ruddigkeit, R. van Deursen, L. C. Blum, J.-L. Reymond, Enumeration of 166 billion organic small molecules in the chemical universe database GDB-17, J. Chem. Inf. Model. 52, 2864–2875, 2012.
  • R. Ramakrishnan, P. O. Dral, M. Rupp, O. A. von Lilienfeld, Quantum chemistry structures and properties of 134 kilo molecules, Scientific Data 1, 140022, 2014. [bibtex]