News
Nova versão do Mathematica
Foi instalada uma nova versão (9) do Mathematica.
É possível enviar simulação sequenciais e paralelas.
As instruções estão em Mathematica
Portal para envio de jobs
Lançamos uma nova ferramenta para envio e controle dos jobs.
Ela está disponível em http://portal.grid.unesp.br
Atualização de SO e middleware de grid
Hoje, 11/09, entre as 15h e 19h, os servidores do GridUNESP foram atualizados, incluindo o middleware de grid.
Não é esperada nenhuma falha em decorrência dessa atualização.
Qualquer problema, por favor, reportar.
Instabilidade com WN
Um workernode (node090) apresentou uma instabilidade e foi reiniciado. Os processos em execução nesse servidor foram perdidos.
Travamento do escalonador do Cluster
Foi detectado a pouco que o serviço que faz o escalonamento do cluster central travou, paralizando a fila de execuções.
O processo foi reiniciado e estamos acompanhando para ver se a situação se normaliza.
Agradecemos ao usuário que reportou o problema.
Desligamento de emergência
Ontem, por volta das 15h, o fornecimento de energia foi interrompido no campus da Barra Funda, em função das fortes chuvas. A previsão de reparo informada pela AES Eletropaulo foi de 12h. Como esse tempo é superior a autonomia do nosso gerador, fomos obrigados a fazer um desligamento emergencial.
As operações foram restabelecidas hoje, 20/02/13, as 11h
Atualização OSG e Certificados novos
Os servidores pertencentes ao Grid foram atualizados para a versão mais recente: OSG 3.1.14
Certificados foram regerados para ANSPCA, se alguem tiver problemas com o myproxy-logon entrem em contato como suporte.
Problema no servidor de autenticação
Tivemos um problema no servidor de autenticação do GridUNESP durante um período de aproximadamente uma hora.
A situação já foi normalizada mas algumas transferências nesse intervalo podem ter sido comprometidas.
Problema do sistema de storage e rede interna
Ontem foi descoberto um problema no sistema de armazenamento do cluster central, que afetou simulações que requisitaram espaço adicional de armazenamento (LARGE_FILES) nas últimas duas semanas.
Também foi descoberta uma falha na rede interna que, embora não impedisse a execução de processos, fazia com que as simulações executassem com uma baixa performance. Essa falha afetou 25% dos servidores.
Ainda estamos observando o comportamento do sistema, mas acreditamos que ambas foram corrigidas.
Caso você tenha observado um comportamento errático ou uma diferença de desempenho nas últimas semanas, recomendamos reenviar as simulações.
Problemas na autenticação
Tivemos um problema no sistema de autenticação nessa madrugada em função de uma perda de sincronização entre os relógios dos servidores. A situação foi normalizada.
Also available in: Atom