Tenstorrent, Jim Keller Chip Company, lanzou o seu procesador de gusanos de última xeración para cargas de traballo de AI, que espera ofrecer un bo rendemento a un prezo accesible.A compañía ofrece actualmente dúas tarxetas PCIe adicionais que poden acomodar un ou dous procesadores de gusano, así como estacións de traballo TT-Loudbox e TT-Quietbox para desenvolvedores de software. Todos os anuncios de hoxe están dirixidos a desenvolvedores, non aqueles que usan taboleiros de gusano para cargas de traballo comerciais.
"Sempre é gratificante meter máis dos nosos produtos en mans dos desenvolvedores. Sistemas de desenvolvemento de liberación mediante as nosas tarxetas Wormhole ™ poden axudar aos desenvolvedores a escalar e desenvolver o software AI multi-chip", dixo Jim Keller, CEO de Tenstorrent.Ademais deste lanzamento, estamos entusiasmados de ver os progresos que estamos a facer coa cinta e a potencia do noso produto de segunda xeración, Blackhole. "

Cada procesador de buraco conteña 72 núcleos de tensix (cinco dos cales admiten núcleos RISC-V en varios formatos de datos) e 108 MB de SRAM, entregando 262 TFLOPs FP8 a 1 GHz cunha potencia de deseño térmico de 160W. A tarxeta de gusano N150 de chip de chip está equipada con memoria de vídeo de 12 GB GDDR6 e ten un ancho de banda de 288 GB/s.
Os procesadores de gusano proporcionan unha escalabilidade flexible para satisfacer as diversas necesidades de carga de traballo. Nunha configuración estándar de estacións de traballo con catro tarxetas N300 Wormhole, os procesadores pódense combinar nunha única unidade que aparece no software como unha rede de núcleo de Tensix Unified e Broad. Esta configuración permite que o acelerador xestione a mesma carga de traballo, divídese entre catro desenvolvedores ou funcione ata oito modelos de IA diferentes simultaneamente. Unha característica clave desta escalabilidade é que pode executar localmente sen necesidade de virtualización. Nun ambiente do centro de datos, os procesadores de buraco usarán PCIe para a expansión dentro da máquina ou Ethernet para a expansión externa.
En termos de rendemento, a tarxeta de gusano N150 de Tenstorrent (72 núcleos de tensix, frecuencia de 1 GHz, 108 MB SRAM, 12 GB GDDR6, 288 GB/s de ancho de banda) logrou 262 tflops FP8 a 160W, mentres que o taboleiro de 192 mb de frecuencia de 192, Agregado 24 GB GDDR6, 576 GB/s Ancho de banda) entrega ata 466 TFLOPs FP8 a 300W.
Para poñer en contexto 300W de 466 TFLOPs FP8, compárao co que o líder do mercado AI Nvidia ofrece neste poder de deseño térmico. A A100 de NVIDIA non admite FP8, pero admite INT8, cun rendemento máximo de 624 tops (1.248 tops cando escasa). En comparación, o H100 de NVIDIA admite o FP8 e alcanza o máximo rendemento de 1.670 TFLOPS a 300W (3.341 TFLOPS a escasa), que é significativamente diferente do buraco N300 de Tenstorrent.
Non obstante, hai un problema importante. O Wormhole N150 de Tenstorrent venda polo miúdo por 999 dólares, mentres que o N300 vende por 1.399 dólares. En comparación, unha única tarxeta gráfica NVIDIA H100 venda polo miúdo por 30.000 dólares, dependendo da cantidade. Por suposto, non sabemos se catro ou oito procesadores de gusano poden realmente ofrecer o rendemento dun único H300, pero os seus TDP son 600W e 1200W respectivamente.
Ademais das tarxetas, Tenstorrent ofrece estacións de traballo pre-construídas para desenvolvedores, incluíndo 4 tarxetas N300 na caixa TT-Loudbox con base en Xeon máis asequible con refrixeración activa, e o avanzado TT-Quietbox con Xiaolong baseado en EPYC).
Tempo de publicación: xul-29-2024