Submissão de Simulações

Sistema de Submissão de Jobs

../_images/submissao_jobs.png

De maneira geral, percebe-se que os pesquisadores e estudantes não têm enfrentado grandes dificuldades no processamento das simulações. Contudo, a partir de um análise crítica dos e-mails enviados pelos usuários, a Equipe do GridUnesp notou que é possível haver um ganho significativo no entendimento de como realizar a submissão de jobs, o que poderia se realizar com uma melhora na documentação de apoio. Essa tarefa já está em adamento.

Tempo de Espera na Fila

../_images/submissao_jobs_tempo.png

Um ponto crítico está no tempo de espera para que um processo submetido aos worker nodes possa começar a executar. Esse tempo depende de vários fatores:

  • dos recursos disponíveis;
  • da quantidade de recursos demandada; e
  • da política de FairShare (Sistema de prioridades).

A utilização do cluster pelos pesquisadores e estudantes vinculados a projetos cadastrados no GridUnesp varia constantemente, tanto em relação à quantidade de simulações solicitadas, quanto aos recursos demandados por cada simulação e ao tempo de processamento. Como os recursos disponibilizados pelo GridUnesp são finitos, é natural que, em alguns momentos, haja mais demanda do que oferta. Isso implica que, nesses momentos, alguns jobs ficarão aguardando na fila, e entrarão em execução à medida que é finalizado o processamento daqueles jobs que se encontram já em processamento.

Por sua vez, a política de FairShare (Sistema de prioridades) classifica os jobs de acordo com a utilização do cluster tanto por parte dos usuários quanto por parte do grupo do qual cada um é membro. Assim, usuários que fazem uso frequente e que demandam uma quantidade significativa de recursos veem sua prioridade na fila diminuir proporcionamente a essa utilização. Essa redução na prioridade é ainda mais intensa se o grupo ao qual pertence também utiliza o cluster de maneira significativa.

O sistema de submissão de simulações dá preferência aos jobs que requeiram uma quantidade menor de recursos e/ou cujo índice FairShare seja mais favorável. Devido a esses fatores, há usuários cujas simulações talvez tenham que esperar durante horas, ou mesmo dias, para ver seus jobs iniciarem a execução.

Nota

No período em que essa Pesquisa de Satisfação foi realizada, a maior parte dos usuários ainda não havia começado a utilizar os novos recursos. Após o upgrade, os usuários do GridUnesp passaram a contar com 56 novos worker nodes e maior capacidade de processamento e armazenamento.