반응형

구글 문서 기능을 사용해서 웹에서 OCR을 하는 방법과 OCR 성능 테스트를 한 결과물 요약입니다.

 

OCR은 광학 문자 판독기라는 의미로 사진 파일에 들어 있는 텍스트를 추출해서 일반 문서 형태로 만드는 기능을 말합니다.

유명한 유료 OCR 프로그램에 비해서는 성능이 떨어지지만 구글 OCR은 무료에 성능도 쓸 만하기 때문에 전문적인 OCR 작업이 필요하지 않거나 소량의 작업을 하는 경우 사용해 보면 좋을 거 같습니다.

 

구글 OCR 기능을 사용하기 위해서는 구글 아이디가 필요합니다.

추가적인 프로그램 설치는 없고 웹브라우저에서 실행이 됩니다.

 

 

※ 구글 문서를 사용한 OCR 방법

 

 

https://drive.google.com/

△ 구글 드라이브

구글 드라이브에 OCR 작업을 하려는 사진 파일을 업로드 합니다.

 

 

사진 파일을 선택한 후 마우스 우 클릭을 합니다.

연결 앱 -> Google 문서를 클릭합니다.

 

 

Google 문서가 새창으로 열리면서 바로 OCR된 결과를 표시해 줍니다.

 

 

※ 구글 문서 OCR 성능 테스트

 

 

위에 처음 테스트에 사용된 원본 사진입니다.

한글, 영어, 일어, 중국어를 사용해서 만들었습니다.

여러 언어가 섞여 있으면 결과물 상태는 아주 엉망이었습니다.

사진의 패턴을 분석하는 데 여러 언어가 있다 보니 비슷한 모양이라도 언어를 선택할 수 없어서 생기는 결과로 보입니다.

 

 

혹시나 하는 마음에 같은 내용의 사진을 길게 만들어서 테스트를 해봤습니다.

 

 

결과물은 여전히 엉망이었습니다.

한글을 모두 다른 언어로 인식을 해서 표시를 해줬습니다.

 

 

네모 박스는 그대로 두고 한글 부분만 잘라내서 테스트를 한 사진입니다.

오타 없이 깔끔하게 잘 인식이 됐습니다.

하지만 네모 박스의 일부가 글로 인식이 된 모습을 볼 수 있었습니다.

 

 

네모 박스를 제거하고 일본어 부분만 테스트를 한 사진입니다.

한문 한 글자만 오타가 발생했고 나머지는 잘 인식을 했습니다.

 

 

중국어만 잘라내서 테스트한 사진입니다.

한 곳의 인식이 잘못됐지만 나머지 부분은 정상적으로 추출이 됐습니다.

 

스샷은 없지만 영어는 특별한 문제 없이 인식이 되었습니다.

테스트 결과 전체적으로 한자의 인식률이 조금 떨어지는 거 같았습니다.

OCR 특성상 원판 사진의 크기가 더 커지면 한자의 인식률도 좀 더 좋아질 것으로 예상됩니다.

인식률은 영어가 가장 좋았습니다.

손글씨의 경우 인쇄 폰트를 사용한 사진보다 인식률이 현저하게 떨어지니 참고 바랍니다. 

 

 

◎ 구글 OCR의 인식률을 높이기 위한 방법

 - 한 종류의 언어를 사용

 - 글자 이외의 영역은 잘라내기

 - 잡티가 없는 큰 사진 사용하기

 - 가능하면 손글씨보다는 인쇄 폰트가 사용된 사진을 사용

반응형


AND