Tesseract
De acordo com a página do Tesseract, “Tesseract is an open source text recognizer (OCR) Engine, available under the Apache 2.0 license”.
Versões Disponíveis
tesseract/4.00.00alpha
Submissão de Jobs Seriais
Crie um arquivo chamado, por exemplo, submit_serial_jobs.sh.
#!/bin/bash
#SBATCH -t 23:00:00
export INPUT="$TESSDATA"
export OUTPUT="*"
module load tesseract
job-nanny tesseract --tessdata-dir $TESSDATA -l heb hebrew.png out
Para submeter o processo, basta usar o comando:
sbatch submit_serial_jobs.sh
Referências
Para informações adicionais sobre o software, consulte a página do Tesseract.