Cuarta paradigma lanza la solución integrada de modelo grande de inferencia SageOne IA

GoldenOctober2024

Datos de Jinshi el 26 de febrero, Fourth Paradigm (06682.HK) lanzó hoy la solución integrada de inferencia de modelos grandes SageOneIA, que reduce aún más el costo de la inferencia de modelos grandes. Por ejemplo, la versión Full Blood de DeepSeekV3/R1 solo requiere dos máquinas integradas para su uso. Además, la solución integrada también incorpora la tecnología inteligente de pooling de Potencia computacional, lo que permite a las empresas cambiar de forma flexible entre la versión Full Blood y varios modelos de destilación, mejorando la utilización de GPU en más del 30% y aumentando el rendimiento de inferencia en un promedio de 5-10 veces en base a modelos grandes como DeepSeekV3/R1, QWen2.5, LLama3.3, entre otros.

Ver originales
Aviso legal: La información de esta página puede proceder de terceros y no representa los puntos de vista ni las opiniones de Gate. El contenido que aparece en esta página es solo para fines informativos y no constituye ningún tipo de asesoramiento financiero, de inversión o legal. Gate no garantiza la exactitud ni la integridad de la información y no se hace responsable de ninguna pérdida derivada del uso de esta información. Las inversiones en activos virtuales conllevan riesgos elevados y están sujetas a una volatilidad significativa de los precios. Podrías perder todo el capital invertido. Asegúrate de entender completamente los riesgos asociados y toma decisiones prudentes de acuerdo con tu situación financiera y tu tolerancia al riesgo. Para obtener más información, consulta el Aviso legal.
Comentar
0/400
Sin comentarios