NVIDIA Adia Lançamento do Chip Rubin CPX, Busca Nova Solução com Tecnologia Feynman
NVIDIA adiou lançamento do chip Rubin CPX, sem mencionar na GTC deste ano. A empresa está trabalhando em uma solução similar com tecnologia Feynman para ser lançada futuramente. O foco agora é a bandeja LPX, que oferece largura de banda individual escalável até 150 TB/s e um rack completo entrega 640 TB/s
NVIDIA Adia Lançamento do Chip Rubin CPX e Busca por Nova Solução com Tecnologia Feynman
A NVIDIA anunciou recentemente uma mudança no seu roadmap tecnológico. O chip Rubin CPX, que era considerado um dos principais lançamentos da empresa para o segmento de inferência, foi adiado sem ser mencionado na GTC (Grafics Technology Conference) deste ano.
Segundo Ian Buck, vice-presidente executivo da NVIDIA, a ideia do Rubin CPX não foi abandonada. Em vez disso, a empresa está trabalhando em uma solução similar com tecnologia Feynman que será lançada futuramente. A decisão de adiar o chip é resultado das mudanças nas demandas de carga de trabalho para priorizar TTFT (Trabalho Transferido por Foco Terno).
A bandeja Rubin LPX, que apresenta as unidades LPU da Groq e se concentra na etapa de decodificação em cargas de trabalhos inferenciais, ganhou maior relevância. Com a parceria com a Groq, a NVIDIA está focada no desenvolvimento do desempenho impressionante de inferência.
A solução LPX oferece uma largura de banda individual escalável para 150 TB/s e um rack completo entrega 640 TB/s. A empresa decidiu manter essa bandeja em vez da Rubin CPX, sugerindo que a tecnologia Feynman será utilizada como base para o novo chip.
Além disso, relatos indicam que a NVIDIA está revisando o design do CPX e considera substituir a GDDR7 pela HBM (High-Bandwidth Memory), o que pode significar uma abordagem diferente na próxima geração de chips. A decisão da empresa também libera capacidade para outros projetos, incluindo soluções dedicadas aos gamers.
A NVIDIA se mantém como líder no segmento de inferência e busca manter essa posição com a parceria da Groq e o desenvolvimento do desempenho impressionante em cargas de trabalho.