loading

PC.Div.Soft/Free Software

FREE OCR

나에+ 2017. 2. 20. 14:55
반응형

여러 무료 OCR 툴들이 존재하지만, 요즘은 대게 온라인이 되어버렸거나, 개발이 안되다시피 하고 있다. 사실 스마트폰앱들이 대게 다 해주니까...;

아직까지 그나마 명맥이 남아있는 무료 프로그램이라면 FreeOCR 정도인 듯. 


http://www.paperfile.net/download.html


Softpedia를 참조하면 더 많은 OCR 툴들이 있고, 국내에서 판매되는 툴도 있지만 사실상 손 메모 등의 인식률은 돈벌이가 되는 태블릿 앱이 좀 더 나은 것 같기도 하다.


추가 언어 설정은 langfile(traineddata)파일만 넣어주고, 프로그램을 재시작하면 된다. 손글씨나 삐닥하게 적힌 폰트의 인식률은 떨어지는데, 한글로만 된 논문 등의 경우 생각보다는 잘 인식하고, 영문의 경우에는 굉장히 만족스럽다.


사용 방법은 간단, 인식시킬 이미지 파일을 불러오고, OCR▼ 버튼을 누르면 진행된다. 그러면 왼쪽의 이미지들이 인식되어 오른쪽 화면에 나타난다. 지우기는 X버튼으로 가능하다. 추가 언어 설치 폴더는 Settings > Open Language Folder 에서 할 수 있다.


좀 더 뛰어난 한글 OCR 기능이 필요하다면 오피스나 아크로뱃, 혹은 원노트(매트로앱 말고)를 활용해 보도록 하자.



*만약 한글 langfile을 넣었는데도 오류가 뜨면서 종료되면 OCR 엔진을 업데이트해 주자.

위의 FREE OCR의 경우 홈페이지 설명에도 나와있지만, tesserac ocr엔진을 이용하고, 그 결과만을 보여주는 틀인만큼, 엔진만 업데이트해주도면 잘 동작한다.

3.0 버전의 랭파일, 3.0 버전을 기준으로 작동하니 3.x 버전을 구해서 받아두고, free ocr이 설치된 폴더에 덮어 쓰기 한 후, langfile로 3.0 버전으로 사용하자.


3.05 버전 다운로드(GitHub) - https://github.com/tesseract-ocr/tesseract/releases/tag/3.05.00

(소스코드라 다운받아서 빌드해야 함, 구버전(3.02) 다운로드는 - https://sourceforge.net/projects/tesseract-ocr-alt/files/ 에서 할 수 있다)

- https://github.com/UB-Mannheim/tesseract/wiki


언어 파일 - https://github.com/tesseract-ocr/tessdata/tree/3.04.00


위 방법이 힘들면 Capture2text에서 tesserac.exe 파일만 교체해도 무방하다.

- https://sourceforge.net/projects/capture2text/files/Capture2Text/

반응형

'PC.Div.Soft > Free Software' 카테고리의 다른 글

NexusFont  (0) 2017.02.27
EaseUS Partition Master  (0) 2017.02.13
OSFMount  (0) 2017.02.13