Удзельнік:Ssvb/Tesseract
Выгляд
Беларуская лацінка ў Tesseract OCR
[правіць]Можна паспрабаваць узяць за аснову польскую мадэль і дадаць літары ŭ, v, š, č. Прыклады:
- https://tesseract-ocr.github.io/tessdoc/tess4/TrainingTesseract-4.00.html#fine-tuning-for--a-few-characters
- https://guiem.medium.com/how-to-train-tesseract-4-ebe5881ff3b7
Беларуская кірыліца ў Tesseract OCR
[правіць]Было б добра выправіць працяжнік і іншыя знакі пунктуацыі.