Datos de Jinshi el 26 de febrero, Fourth Paradigm (06682.HK) lanzó hoy la solución integrada de inferencia de modelos grandes SageOneIA, que reduce aún más el costo de la inferencia de modelos grandes. Por ejemplo, la versión Full Blood de DeepSeekV3/R1 solo requiere dos máquinas integradas para su uso. Además, la solución integrada también incorpora la tecnología inteligente de pooling de Potencia computacional, lo que permite a las empresas cambiar de forma flexible entre la versión Full Blood y varios modelos de destilación, mejorando la utilización de GPU en más del 30% y aumentando el rendimiento de inferencia en un promedio de 5-10 veces en base a modelos grandes como DeepSeekV3/R1, QWen2.5, LLama3.3, entre otros.
Ver originales
Esta página puede contener contenido de terceros, que se proporciona únicamente con fines informativos (sin garantías ni declaraciones) y no debe considerarse como un respaldo por parte de Gate a las opiniones expresadas ni como asesoramiento financiero o profesional. Consulte el Descargo de responsabilidad para obtener más detalles.
Cuarta paradigma lanza la solución integrada de modelo grande de inferencia SageOne IA
Datos de Jinshi el 26 de febrero, Fourth Paradigm (06682.HK) lanzó hoy la solución integrada de inferencia de modelos grandes SageOneIA, que reduce aún más el costo de la inferencia de modelos grandes. Por ejemplo, la versión Full Blood de DeepSeekV3/R1 solo requiere dos máquinas integradas para su uso. Además, la solución integrada también incorpora la tecnología inteligente de pooling de Potencia computacional, lo que permite a las empresas cambiar de forma flexible entre la versión Full Blood y varios modelos de destilación, mejorando la utilización de GPU en más del 30% y aumentando el rendimiento de inferencia en un promedio de 5-10 veces en base a modelos grandes como DeepSeekV3/R1, QWen2.5, LLama3.3, entre otros.