RAxML

Envio local, exemplos de scripts

Informações sobre o uso direto do cluster local estão em aqui.

SMP

#!/bin/bash
#SBATCH -t 3 -c 8

module load raxml
goo-job-nanny raxmlHPC-PTHREADS-SSE3 -T 8 -p123 -m PROTGAMMAWAG -s raxml-smp.phy -n raxml-smp 

MPI

#!/bin/bash
#SBATCH -t 3:00 -n 16

module load raxml
goo-job-nanny srun -n 16 raxmlHPC-MPI-SSE3 -N 16 -p123 -m PROTGAMMAWAG -s raxml-mpi.phy -n raxml-mpi

Submissão Simplificada

Introdução

Instruções para acessar os servidores: InstrucoesDeAcesso

Informações sobre o sistema de submissão simplificado (GO): SubmissaoSimplificada

Utilização

  • Crie um arquivo de parâmetros (ex: caso.go) como explicado abaixo
  • (apenas para a opção -grid) Crie um certificado de proxy (myproxy-logon) com uma duração maior que a do seu job
  • Execute "go caso.go"

Isso cria e envia o seu job para o grid. Caso não queira enviar imediatamente, utilize a opção "-nosubmit". O arquivo de submissão será criado com o nome de "caso.go.submit".

Caso você tenha especificado checkpoints ou arquivos de progresso, eles serão automaticamente copiados para esse diretório.

IMPORTANTE: NÃO USE ESPAÇOS NOS NOMES DOS ARQUIVOS

Exemplo:

APP=raxml
CASE=node_do_caso
HOSTS=4
QUEUE=short

Caso INPUT não seja declarado, o sistema utilizará nome_do_caso.phy.

Caso OUTPUT não seja declarado, o sistema utilizará nome_do_caso.

Parâmetros:
  • CASE - Nome do caso. Define o nome de arquivos de entrada, log e saida. Padrão: (nome do arquivo de parâmetros, sem a extensão)
  • HOSTS - Número de hosts (processos) para a execução. Padrão: 1
  • PPH - Número de cores por servidor. Ativa o modo multi-thread. Padrão: 1

OBS: Alguns testes indicam problemas na execução misturando os modos MPI (HOSTS=) e SMP (PPH=).

Opções

Opções comuns

  • CASE - Nome do caso. Define o nome de arquivos de entrada, log e saida. Padrão: (nome do arquivo de parâmetros, sem a extensão)
  • HOSTS - Número de hosts (processos) para a execução. Padrão: 1
  • QUEUE - Fila do processo. Opções: short, medium, long Padrão: short (24 horas)
  • LARGE_FILES - Suporte a arquivos de simulação maiores que 8GB. Padrão: false

Opções avançadas

  • EXEC - executável
  • TRANSFER_EXEC - se transfere o executável
  • ARGS - argumentos
  • INPUT - arquivos de entrada, separados por espaço
  • OUTPUT - arquivos de saída, separados por espaço
  • PROGRESS - arquivo que exibe o progresso da simulação
  • WAIT_PROGRESS - tempo de atualização do progresso, em segundos. Padrão: 15 min.
  • CHECKPOINT - arquivo de checkpoint
  • WAIT_CHECKPOINT - tempo de atualização do checkpoint, em segundos. Padrão: 3 horas.
  • HOSTS - Número de hosts (processos) para a execução. Padrão: 1
  • PPH - Process per host. Opção para programas SMP. Padrão: 1. Máximo:8
  • MPI - Se o executável deve ser chamado em ambiente MPI
  • SHARED_FS - Utiliza um sistema de arquivos compartilhado (útil para aplicações MPI)
  • CORE_MEM - Memória RAM por core, em GB. Padrão: 2. Máximo: 16

Dicas

  • Não utilize espaço no nome dos arquivos
  • Caso o parâmetro tenha espaço (ex: INPUT="arquivo_1 arquivo_2") utilize aspas duplas (")
  • Ao especificar arquivos da saída, progresso ou checkpoint, é possível usar caracteres coringa do bash. Exemplo: OUTPUT="f*.dat x.out" copiará todos os aquivos que começam com f e tem a extensão .dat, mais o arquivo x.out. *Não é possível usar essa expansão para arquivos de entrada (INPUT).