Tesseract

De acordo com a página do Tesseract, “Tesseract is an open source text recognizer (OCR) Engine, available under the Apache 2.0 license”.

Versões Disponíveis

  • tesseract/4.00.00alpha

Submissão de Jobs Seriais

Crie um arquivo chamado, por exemplo, submit_serial_jobs.sh.

#!/bin/bash
#SBATCH -t 23:00:00

export INPUT="$TESSDATA"
export OUTPUT="*"

module load tesseract
job-nanny tesseract --tessdata-dir $TESSDATA -l heb hebrew.png out

Para submeter o processo, basta usar o comando:

sbatch submit_serial_jobs.sh

Referências

Para informações adicionais sobre o software, consulte a página do Tesseract.