Básico
Spot
Opera con criptomonedas libremente
Margen
Multiplica tus beneficios con el apalancamiento
Convertir e Inversión automática
0 Fees
Opera cualquier volumen sin tarifas ni deslizamiento
ETF
Obtén exposición a posiciones apalancadas de forma sencilla
Trading premercado
Opera nuevos tokens antes de su listado
Contrato
Accede a cientos de contratos perpetuos
TradFi
Oro
Plataforma global de activos tradicionales
Opciones
Hot
Opera con opciones estándar al estilo europeo
Cuenta unificada
Maximiza la eficacia de tu capital
Trading de prueba
Introducción al trading de futuros
Prepárate para operar con futuros
Eventos de futuros
Únete a eventos para ganar recompensas
Trading de prueba
Usa fondos virtuales para probar el trading sin asumir riesgos
Lanzamiento
CandyDrop
Acumula golosinas para ganar airdrops
Launchpool
Staking rápido, ¡gana nuevos tokens con potencial!
HODLer Airdrop
Holdea GT y consigue airdrops enormes gratis
Launchpad
Anticípate a los demás en el próximo gran proyecto de tokens
Puntos Alpha
Opera activos on-chain y recibe airdrops
Puntos de futuros
Gana puntos de futuros y reclama recompensas de airdrop
Inversión
Simple Earn
Genera intereses con los tokens inactivos
Inversión automática
Invierte automáticamente de forma regular
Inversión dual
Aprovecha la volatilidad del mercado
Staking flexible
Gana recompensas con el staking flexible
Préstamo de criptomonedas
0 Fees
Usa tu cripto como garantía y pide otra en préstamo
Centro de préstamos
Centro de préstamos integral
Centro de patrimonio VIP
Planes de aumento patrimonial prémium
Gestión patrimonial privada
Asignación de activos prémium
Quant Fund
Estrategias cuantitativas de alto nivel
Staking
Haz staking de criptomonedas para ganar en productos PoS
Apalancamiento inteligente
New
Apalancamiento sin liquidación
Acuñación de GUSD
Acuña GUSD y gana rentabilidad de RWA
Lightbits, innovación en eficiencia de inferencia de IA para reducir los costos en la nube
El avance en la industria tecnológica está siendo acelerado por innovaciones en el campo de la inteligencia artificial (IA). Lightbits Labs ha lanzado recientemente una nueva arquitectura diseñada para resolver el cuello de botella de memoria en inferencias de IA a gran escala. Esta arquitectura, desarrollada en colaboración con ScaleFlux y FarmGPU, combina almacenamiento rápido de memoria no volátil, infraestructura de GPU para inferencias y el software de Lightbits, ayudando a los sistemas de IA a gestionar de manera más eficiente los datos en caché generados durante la inferencia.
En un contexto donde los operadores en la nube enfrentan presiones de costos al procesar tareas de inferencia, este lanzamiento se espera que sea una buena noticia. Los altos costos de las GPU se han convertido en una de las principales partidas de gasto operativo. Para mejorar esta situación, Lightbits ha establecido como objetivo optimizar la utilización de las GPU.
La nueva plataforma de Lightbits aumenta la cantidad de solicitudes que una sola GPU puede manejar, mejorando la eficiencia de la inferencia. Esto se traduce directamente en una reducción significativa en el costo por procesamiento. Según los resultados de pruebas de Lightbits, al triplicar la cantidad de solicitudes en la misma GPU, también lograron reducir en un 65% los costos de energía e infraestructura.
La clave de esta solución es el “KV cache”. Esta caché almacena vectores intermedios generados durante la inferencia, reutilizando resultados previos para evitar cálculos innecesarios. Sin embargo, a medida que los modelos crecen en tamaño, la capacidad de la caché también aumenta rápidamente. La demanda de memoria se duplica cada año, lo que requiere esfuerzos conjuntos a largo plazo para resolver este problema. Para ello, Lightbits ha introducido un método innovador que predice el movimiento de datos y proporciona la información necesaria a la GPU de antemano.
El sistema LightInferra puede gestionar y acelerar la transferencia de datos entre niveles de memoria, asegurando que la GPU no tenga que esperar por los datos. Este sistema garantiza un flujo de inferencia fluido sin superar la capacidad de memoria de la GPU. Los proveedores de servicios en la nube pueden aprovechar esta arquitectura para optimizar el uso de GPU o aumentar la capacidad de procesamiento en su infraestructura existente. Actualmente, esta arquitectura está en colaboración con NeoCloud y se planea poner en producción a partir de julio.