Rockport Networks lança tecido sem switch de 300 Gbps e revela 396
LarLar > Notícias > Rockport Networks lança tecido sem switch de 300 Gbps e revela 396

Rockport Networks lança tecido sem switch de 300 Gbps e revela 396

Jun 09, 2023

Por Tiffany Trader

27 de outubro de 2021

A Rockport Networks emergiu do sigilo esta semana com o lançamento de sua arquitetura de rede sem switch de 300 Gbps focada nas necessidades da computação de alto desempenho e do mercado de IA de escala avançada. Os primeiros clientes incluem o Texas Advanced Computing Center (TACC), que instalou a tecnologia de rede em parte de seu sistema Frontera, bem como a DiRAC/Durham University, que também está usando o equipamento de rede. O grupo de rede de alto desempenho da Ohio State também está envolvido com a Rockport, emprestando sua experiência com suporte a padrões.

A capacidade de comutação distribuída da Rockport é implementada por seu software patenteado rNOS, o sistema operacional de rede executado nas placas de rede. O software não requer nenhum recurso do servidor e é invisível para o servidor, exceto por uma placa de rede Ethernet de alto desempenho. As funções de rede são distribuídas para cada nó que são conectados diretamente uns aos outros por meio de cabeamento passivo. Existe um plano de controle distribuído e um plano de roteamento distribuído, mas os nós são autodescobertos, autoconfigurados e autocorrigidos, de acordo com Rockport. O software determina o melhor caminho pela rede para minimizar o congestionamento e a latência, enquanto divide os pacotes em pedaços menores (a Rockport chama esses FLITs) para garantir que as mensagens de alta prioridade não sejam bloqueadas por dados em massa.

Além do rNOS, a solução da Rockport Networks consiste em três partes:

O produto que está sendo comercializado atualmente é baseado em uma versão avançada do toro 6D, com alta diversidade de caminho, de acordo com o diretor de tecnologia da Rockport, Matt Williams. Atualmente, ele suporta até 1.500 nós, mas a arquitetura foi projetada para escalar para mais de 100.000 nós, aproveitando topologias como a Dragonfly, disse o CTO.

Para testar e validar sua solução, a Rockport Networks trabalha com o Texas Advanced Computing Center (TACC) em Austin há cerca de um ano. Sob os auspícios de seu novo Centro de Excelência Rockport, a TACC instalou recentemente a rede Rockport em 396 nós de seu supercomputador Frontera. (O sistema Dell de aproximadamente 8.000 nós, classificado em décimo lugar na lista Top500, usa Nvidia-Mellanox HDR InfiniBand como sua interconexão principal.) Os nós conectados a Rockport estão sendo aproveitados para ciência de produção em apoio à pesquisa de computação quântica, relacionada à pandemia pesquisa e computação de resposta urgente, abordando eventos climáticos perturbadores e outros desastres de grande escala.

"A TACC está muito satisfeita por ser um Rockport Center of Excellence. Executamos diversas cargas de trabalho de computação avançada que dependem de comunicação de alta largura de banda e baixa latência para sustentar o desempenho em escala", afirmou Dan Stanzione, diretor da TACC e vice-presidente associado de pesquisa na UT-Austin. "Estamos entusiasmados por trabalhar com uma nova tecnologia inovadora, como o design de rede sem comutação da Rockport.

"Nossa equipe está vendo resultados iniciais promissores em termos de controle de congestionamento e latência. Ficamos impressionados com a simplicidade da instalação e do gerenciamento. Esperamos continuar testando em cargas de trabalho novas e maiores e expandindo ainda mais a Rockport Switchless Network em nossos data center", acrescentou.

Williams relatou que a instalação Rockport no TACC levou apenas uma semana e meia para ser concluída. "É literalmente um processo de duas etapas", disse ele. "Conecte o cartão e conecte o cabo."

Williams disse à HPCwire que os clientes estão vendo uma melhoria média de 28% em relação ao InfiniBand e uma redução de 3 vezes na latência de ponta a ponta em escala, executando seus aplicativos sob carga. "Sob carga, temos o melhor desempenho geral e entregamos um tempo de conclusão de carga de trabalho consistentemente melhor. Cada carga de trabalho é diferente, nem sempre você verá 28%. às condições da rede. Mas, em média, estamos vendo cerca de 28 por cento."

Ele esclareceu que esses quatro testes (acima) compararam a solução Rockport com a rede InfiniBand de 100 Gbps, mas disse que estão vendo "resultados muito semelhantes" em testes internos com o InfiniBand de 200 Gbps. A carga de trabalho de HPC listada no topo emprega um código hidrodinâmico de malha móvel.