[전력계량기OCR인식] 2021/9/15 계량기사진 정보기록

September 15 2021

1. 데이터 정보

1) 계량기 사진

  • 984장

  • 파일 형식 : jpg

  • 각도 : 거의 정방향에 가까움

  • Type종류 : Type명이 보이는 계량기는 모두 G-Type

  • 사진오류

    • 계량기 사진이 아닌 형태가 4장 존재
    • Type명이 가려진 사진이 40여장 존재

2) 모뎀 사진

  • 984장
  • 파일 형식 : jpg
  • 각도 0도~180도로 회전 필요

3) 그 외

  • 파일명의 하이픈(_)을 기준으로 계량기 사진과 모뎀 사진이 매칭 됨.
    • 예를 들어 계량기 이미지 ‘847207D64AF9_P1134.jpg’와 모뎀 이미지 ‘847207D64AF9_P2134.jpg’의 ‘847207D64AF9‘부분이 일치하며 두 이미지의 배경이 같은 곳임

2. 오늘 한 것

어제 해본 matchTemplate는 크기, 방향, 회전 변환에는 잘 작동하지 않고, 속도가 느리다는 단점이 있어서 ‘G-Type’이라는 타입 이미지 크기, 방향, 각도를 변경해가면서 Template matching을 해야합니다. 그래서 결국 한글 ocr모델에 전력량 계량기의 글자 정보를 추가 훈련하여 문자탐지를 하거나, 타입 이미지가 아닌, 전력량 8-segment디스플레이를 찾아서 문자영역을 특정해야 할 것 같습니다.

1) 모델 만드는 방법 알아보기

- 데이터 셋 만들기

  • 참고 사이트에 따르면, 폰트제공 사이트, AI Hub의 한글 이미지 + 우리에게 필요한 글씨 이미지 (전력량계량기의 글씨 이미지)에 대한 데이터셋을 파일로 만들어야 합니다.
  • 데이터 셋을 만들어도 데이터 셋 파일을 불러 훈련을 하려면GPU가 필요한데 학원 컴퓨터로는 내장 GPU밖에 존재하지 않아 훈련을 데이터셋 불러오는것을 실패합니다. 알아본 정보가 맞는지 내일 선생님께 여쭤보고 확인해 볼 것입니다.

- ocr 모델 훈련

Leave a comment