olmOCR - PDF에서 텍스트 추출
·
Web.World/Ai.ML.SD
PDF, JPG, PNG 문서에서 텍스트를 추출하는 오픈 소스 도구이며 표, 수식 손글씨 등을 인식한다고 합니다. 다만 영문서에 최적화되어 있어 다국어에서 올바르게 동작하지는 않는다고 하네요.