Ampere se asocia con Qualcomm para lanzar un servidor de IA basado en Arm

Ampere y Qualcomm no son los socios más obvios. Después de todo, ambos ofrecen chips basados ​​en Arm para ejecutar servidores de centros de datos (aunque el mercado más grande de Qualcomm sigue siendo móvil). Pero como las dos compañías anunciaron hoy, ahora están combinando fuerzas para ofrecer un servidor centrado en IA que utiliza las CPU de Ampere y los chips de inferencia Cloud AI 100 Ultra AI de Qualcomm para ejecutar, no entrenar, modelos.

Como cualquier otro fabricante de chips, Ampere busca sacar provecho del auge de la IA. Sin embargo, el enfoque de la compañía siempre ha estado en chips de servidor rápidos y energéticamente eficientes, por lo que si bien puede usar Arm IP para agregar algunas de estas características a sus chips, no es necesariamente una competencia central. Es por eso que Ampere decidió trabajar con Qualcomm (y SuperMicro para integrar las dos soluciones), me dice el CTO de Arm, Jeff Wittich.

“La idea aquí es que, si bien les mostraré un excelente rendimiento para las CPU Ampere que ejecutan inferencia de IA solo en las CPU, si desea escalar a modelos aún más grandes (modelos de múltiples 100 mil millones de parámetros, por ejemplo), como todos Para otras cargas de trabajo, la IA no es única para todos”, dijo Wittich a TechCrunch. “Hemos estado trabajando con Qualcomm en esta solución, combinando nuestras CPU Ampere súper eficientes para realizar muchas de las tareas de propósito general que se ejecutan junto con la inferencia, y luego usando sus tarjetas realmente eficientes, tenemos una solución a nivel de servidor”.

Créditos de imagen: Amperio

En cuanto a asociarse con Qualcomm, Wittich dijo que Ampere quería crear las mejores soluciones.

“[R]”La colaboración que hemos tenido con Qualcomm aquí es realmente buena”, afirmó. “Esta es una de las cosas en las que hemos estado trabajando, creo que compartimos muchos intereses muy similares, por lo que creo que esto es realmente convincente. Están creando soluciones realmente eficientes y en muchas partes diferentes del mercado. Estamos creando soluciones realmente eficientes en el lado de la CPU del servidor”.

La asociación con Qualcomm es parte de la actualización anual de la hoja de ruta de Ampere. Parte de esa hoja de ruta es el nuevo chip AmpereOne de 256 núcleos, construido mediante un moderno proceso de 3 nm. Esos nuevos chips aún no están disponibles en general, pero Wittich dice que están listos en la fábrica y deberían lanzarse a finales de este año.

Además de los núcleos adicionales, la característica definitoria de esta nueva generación de chips AmpereOne es la RAM DDR5 de 12 canales, que permite a los clientes del centro de datos de Ampere ajustar mejor el acceso a la memoria de sus usuarios según sus necesidades.

El argumento de venta aquí no es sólo el rendimiento, sino también el consumo de energía y el costo de ejecutar estos chips en el centro de datos. Esto es especialmente cierto cuando se trata de inferencia de IA, donde a Ampere le gusta comparar su rendimiento con el de las GPU A10 de Nvidia.

Créditos de imagen: Amperio

Vale la pena señalar que Ampere no eliminará ninguno de sus chips existentes en favor de estos nuevos. Wittich destacó que incluso estos chips más antiguos todavía tienen muchos casos de uso.

Ampere también anunció hoy otra asociación. La empresa está trabajando con NETIN para construir una solución conjunta que combine las CPU de Ampere con los chips de procesamiento de video de NETINT. Este nuevo servidor podrá transcodificar 360 canales de video en vivo en paralelo, todo mientras usa OpenAI. Susurro modelo de voz a texto para subtitular 40 transmisiones.

“Comenzamos este camino hace seis años porque está claro que es el camino correcto”, dijo la directora ejecutiva de Ampere, Renee James, en el anuncio de hoy. “Baja potencia solía ser sinónimo de bajo rendimiento. Ampere ha demostrado que eso no es cierto. Hemos sido pioneros en la frontera de la eficiencia de la informática y hemos ofrecido rendimiento más allá de las CPU heredadas en un entorno informático eficiente”.

Fuente