한글 손 글씨 글자 분류기

2023.11.01 - 2023.12.13
27

* Raw 데이터

 

* Raw Data 구조

  • 필기체
    • Training
      • Image(JPG)
        • 실험자 번호별 폴더 
      • Label(JSON)
        • 실험자 번호별 폴더 
    • Test
      • Image(JPG)
        • 실험자 번호별 폴더 
      • Label(JSON)
        • 실험자 번호별 폴더 
  • 인쇄체
    • Training
      • Image(JPG)
        • 실험자 번호별 폴더 
      • Label(JSON)
        • 실험자 번호별 폴더 
    • Test
      • Image(JPG)
        • 실험자 번호별 폴더 
      • Label(JSON)
        • 실험자 번호별 폴더 

 

 

1.  Preprocessing.py (필기체에 제한에서 진행)

 

- 클래스 수 축소 2350 class →  14 class 

  글자수는 각 파일명의 다섯자리 숫자로 정의되어 있음.

    "01001": "가",

    "03032": "나",

    "04043": "다",

    "05127": "라",

    "06124": "마",

    "07123": "바",

    "09065": "사",

    "11054": "아",

    "13002": "자",

    "14089": "차",

    "15071": "카",

    "16048": "타",

    "17024": "파",

    "17129": "하"

 

*이후  Image와 Json의 구조에 따라 ["text"]["letter"]["value"] 값에서 글자를 가져와 Encoding 후 Matching 진행

 

2. Train.py

 

 

3. Predict.py

 

 

4. Score.py