El modelo imita el procesamiento neuronal humano al activar selectivamente solo las rutas computacionales necesarias, en lugar de emplear toda la arquitectura de la red como ChatGPT.
Según un artículo técnico publicado en arXiv, SpikingBrain requiere menos del 2% de los datos de entrenamientoque normalmente necesitan los modelos de IA convencionales, mientras que logra rendimientos comparables en tareas de comprensión del lenguaje.
Los investigadores informaron que, al manejar secuencias ultralargas, una variante logró una mejora de velocidad de 26,5 veces sobre las arquitecturas Transformer al procesar contextos de millones de tokens.
El sistema funciona completamente sobre la plataforma de chips MetaX desarrollada en China, creada por ex ingenieros de AMD que fundaron la empresa con sede en Shanghái en 2020.
Esto representa un paso hacia la independencia tecnológica, ya que las restricciones de exportación de EE. UU. han limitado el acceso de China a chips avanzados y otros fabricantes estadounidenses.