Quarta-feira Mar 05, 2008

A maior nuvem de supercomputação do mundo

Eu não sabia que o telescópio Hubble podia ver apenas 12 bilhões de anos no passado.

Sinceramente, eu nunca pensei que os telescópios pudessem ver o passado, até que o Dr. Michael Norman, um pesquisador da UCSD, me deu uma lição básica sobre astronomia e me explicou que o Hubble vê corpos celestes cuja luz chega até nós somente agora. Mas ele pode ver "somente" 12 bilhões de anos no passado - e este é um véu através do qual ele gostaria de penetrar. (Eu perguntei a ele o que fazia para ganhar a vida e sua resposta foi: "Eu simulo o universo". Isso é que é descrição de cargo.)

A pergunta que ele estava interessado em responder era: "E os 1,7 bilhão de anos anteriores?" O universo tem aproximadamente 13,7 bilhões de anos e, devido às limitações do Hubble, ele estava usando um dos maiores supercomputadores do mundo, a plataforma Ranger, no TACC (Texas Advanced Computer Center), na Universidade do Texas em Austin, para simular os 1,7 bilhão de anos anteriores. (Mais tarde ele admitiu estar mais interessado nos 1,5 bilhão de anos anteriores, os primeiros 200-300 milhões eram caracterizados por nuvens de hidrogênio que ainda levariam muito tempo para se tornarem estrelas.)

Para celebrar a inauguração do Ranger, pediram que eu fizesse o discurso de abertura, e este foi apenas um exemplo da enxurrada de pesquisas básicas e científicas que serão executadas na maior plataforma de computação aberta do mundo. Aberta? O centro foi fundado pela National Science Foundation e tem como compromisso fornecer serviços de supercomputação em larga escala a qualquer pesquisador ou cientista dos Estados Unidos (envie sua proposta aqui). O Ranger é totalmente baseado em Sun - mergulhando no jargão técnico por um momento, aqui estão os detalhes:

  • Cerca de 600 metros quadrados de espaço de datacenter, com consumo inferior a 3 megawatts...
  • Mais de 4000 blades quad core Sun/Opteron, 120+ Tb de DRAM, rodando CentOS
  • Capacidade computacional de mais de 500 teraflops
  • Tarefas programadas pelo Grid Engine da Sun
  • Interconectado por dois switches Magnum não bloqueadores de 100 terabits (chifres opcionais)
  • Dados gerenciados pelo sistema de arquivo Lustre, em Thumpers
  • Mais de 2 petabytes de armazenamento
  • Gerenciado pelo nosso produto de gerenciamento de dados hierárquico SAM-FS, arquivado em plataformas de fita da Sun
  • Com sistemas gerais gerenciados e monitorados pelo xVM OpsCenter (a maior instalação do mundo).

Sua construção envolveu uma enorme quantidade de engenharia, assim como a tecnologia que está por trás dele, que agora a Sun pode replicar em todo o mundo em instalações menores (e maiores, claro) tanto públicas, como comerciais. Além de governos e instituições de pesquisa, diversos setores em todo o mundo estão optando pela computação de alto desempenho em busca de vantagem comercial, e não apenas para fins científicos. Este sistema consume uma fração da energia que era necessária há apenas alguns anos - o que o torna uma das instalações de supercomputação mais sustentáveis do mundo.

Para ter uma idéia da importância real do Ranger, dê uma olhada na tabela abaixo (clique para ir para a versão original):


A capacidade do Ranger supera a de todas as outras instalações de supercomputação do National Science Foundation juntas. No Texas, quando eles dizem "grande", eles querem dizer "realmente grande".

Como o diretor de infra-estrutura cibernética do NSF assinalou durante seu discurso de congratulações, a simulação computacional é atualmente considerada como um campo legítimo da exploração científica. Desde a descoberta de novas drogas à modelagem climática, da dinâmica de fluidos à simulação do universo, de epidemiologia à ciência de materiais - uma instalação deste porte vai revolucionar o mundo científico, tanto nos EUA como no mundo. Até o momento, já existem mais de 500 projetos de pesquisa utilizando o Ranger - ele já está mudando o mundo. E como ele faz parte do Teragrid da NSF, os resultados dos estudos serão compartilhados com o mundo todo. Aberto significa aberto. Jay Boisseau, diretor do TACC, afirmou que é bem provável que eles recebam mais solicitações de horas de uso do Ranger (eles têm cerca de 500 milhões de horas de cpu para alocar a cada ano, ou 125 mil/trimestre) do que há disponível. Para pessoas como Jay e o Dr. Norman, o aumento da capacidade aumenta o apetite - ao contrário do que acontece com a computação empresarial, onde o excesso geralmente é consolidado em outra coisa (o fundamento da teoria do "redshift" (desvio para o vermelho) de Greg).

Como surgiu o Ranger? Ele foi o resultado de um compromisso com a ciência básica do National Science Foundation, um grupo de pessoas entusiasmadas da Universidade do Texas, inspirado por Jay, um motivado líder técnico, e de compromissos da excepcional (realmente excepcional) equipe do TACC, funcionários da Sun e da AMD, com todos os três grupos numa correria louca para colocar tudo de pé em tempo recorde - como a maior instalação de supercomputação aberta do mundo. A maior do mundo, multiplicado por 4.

O Ranger transformará o mundo acadêmico, o setor e, por fim, a sociedade. Por que acredito nisso?

Como afirmei em meu discurso, houve um momento no qual a hidrelétrica das Cataratas do Niágara fornecia 30% da energia elétrica consumida nos EUA. Os esforços de engenharia e ciência básica ali utilizados são comparáveis ao necessário para construir o Ranger. Foi uma pesquisa verdadeiramente fundamental.

A eletricidade transformou a sociedade? Sem dúvida nenhuma. Saber o que houve nos primeiros 1,7 bilhão de anos do universo transformará nossas vidas? Ainda não sabemos. É isso que o Dr. Norman está tentando descobrir. Uma pergunta que a Sun, a AMD e o pesquisador da Universidade do Texas agora poderão ajudá-lo a responder. Com uma plataforma que a Sun passará a disponibilizar de modo geral ao mercado. (Eu ia escrever algo como "dissipando as nuvens da computação de nebulosas", mas até eu estremeci ao ler.)

__________________

(Para os interessados, aqui está um excelente resumo da visão do Dr. Norman sobre a astrofísica computacional - que, vale notar, assim como grande parte dos trabalhos que tenho visto em computação de alto desempenho em todo o mundo...

... é baseado em software gratuito e de fonte aberta.)

Share this post  del.icio.us | digg.com | slashdot.org | technorati.com | reddit | facebook | stumbleupon

No Comments

Post a Comment:
Comments are closed for this entry.