Introdução

O GridUNESP é uma estrutura computacional da UNESP, gerênciada pelo Núcle de Computação Científica (http://ncc.unesp.br).

Essa estrutura visa atender as necessidades de processamento intensivo de grupos de pesquisa da universidade. É composta por 8 clusters distribuidos em 7 sites espalhados pelo estado. Maiores detalhes estão no nosso site (Infraestrutura).

Uma estrutura de grid computing (computação em grade) é um sistema distribuído que interliga diversos recursos computacionais. Isso permite que uma simulação seja processada por vários computadores ao mesmo tempo, permitindo a computação de modelos complexos. O nosso sistema está interligado com um grid de cooperação internacional, o OSG, que utiliza a tecnologia do Globus Toolkit.

Para se beneficiar das vantagens da computação em grid as simulações precisam ter algumas características. Entre elas:
  • Se composta de muitos processos de curta duração (até 6 horas), sem intercomunicação entre os processos.
  • Processos batch (sem interação com o usuário), sem acesso a arquivos da simulação durante a execução.

Porém, ciente que nem todas as simulações dos usuários do GridUNESP se adaptam a essas características, adaptamos nosso sistema para melhor atender outros tipos de processos. Isso permite executar processos paralelos (SMP, MPI, ...) e processos de longa duração. Outro facilidade desenvolvida é permitir o acompanhamento da simulação.

Importante que algumas limitações fiquem claras para os nossos usuários. Em especial sobre simulações de longa duração

O sistema permite a execução de processos de longa duração (diversos dias). Porém, quanto mais longa a simulação e maior o número de servidores envolvidos, maior a probabilidade de falhas. Como em qualquer sistema, nossos servidores estão sujeitos a falhas (defeito de discos, falta de energia, updates...)

Por tanto recomendamos (e possivelmente no futuro exigiremos) que processos com mais de 24 horas de duração façam checkpoint e permitam reiniciar a simulação no caso de falha. Caso sua aplicação não disponibilize esse recurso, dispomos de ferramentas que podem ser usadas para esse fim.

Mais informações

Informações sobre como utilizar o sistema e entrar em contato com a nossa equipe no Guia do Usuário.