El chatbot Grok de X pronto recibirá un modelo actualizado, Grok-1.5

X.ai, la startup de IA de Elon Musk, ha revelado su último modelo de IA generativa, Grok-1.5. Listo para impulsar el chatbot Grok de la red social X en un futuro no muy lejano (“en los próximos días”, escribe X.ai en un entrada en el blog), Grok-1.5 parece ser una mejora mensurable con respecto a su predecesor, Grok-1, al menos a juzgar por los resultados de las pruebas comparativas y las especificaciones que X ha publicado.

Grok-1.5 se beneficia de un “razonamiento mejorado”, según X.ai, particularmente en lo que respecta a codificación y tareas relacionadas con las matemáticas. El modelo duplica con creces la puntuación de Grok-1 en un popular punto de referencia de matemáticas, MATH, y obtiene una puntuación superior en más de diez puntos porcentuales en la prueba HumanEval de generación de lenguajes de programación y habilidades de resolución de problemas.

Por supuesto, es difícil predecir cómo se traducirán esos resultados en el uso real. Como escribimos recientemente, los puntos de referencia de IA de uso común, que miden cosas tan esotéricas como el desempeño en preguntas de exámenes de química a nivel de posgrado, no logran capturar cómo la persona promedio interactúa con los modelos en la actualidad.

Una mejora que debería Lo que conduce a ganancias observables es la cantidad de contexto que Grok-1.5 puede absorber en comparación con Grok-1.

Grok-1.5 tiene un contexto de 128.000 tokens: “tokens” que se refieren a fragmentos de texto sin formato (por ejemplo, la palabra “fantástico” se divide en “fan”, “tas” y “tic”). El contexto, o ventana de contexto, se refiere a los datos de entrada (en este caso, texto) que un modelo considera antes de generar resultados (más texto). Los modelos con ventanas de contexto pequeñas tienden a olvidar el contenido incluso de conversaciones muy recientes, mientras que los modelos con contextos más grandes evitan este problema y, como beneficio adicional, captan mejor el flujo de datos que reciben.

“[Grok-1.5 can] utilizar información de documentos sustancialmente más largos”, escribe X.ai en la publicación del blog antes mencionada. “Además, el modelo puede manejar indicaciones más largas y complejas y al mismo tiempo mantener su capacidad de seguir instrucciones a medida que se expande su ventana de contexto”.

Lo que históricamente distingue a los modelos Grok de X.ai de otros modelos de IA generativa es que responden a preguntas sobre temas que normalmente están fuera del alcance de otros modelos, como conspiraciones e ideas políticas más controvertidas. Los modelos también responden a las preguntas con “una vena rebelde”, como lo ha descrito Musk, y con un lenguaje francamente grosero si se les pide que lo hagan.

No está claro qué cambios, si los hay, trae Grok-1.5 en estas áreas. X.ai no alude a esto en la publicación del blog.

Grok-1.5 pronto estará disponible para los primeros probadores en X, dice X.ai, acompañado de “varias características nuevas”. Musk ha insinuado previamente que resumirá hilos y respuestas y sugerirá contenido para publicaciones; Veremos si llegan lo suficientemente pronto.

El anuncio de Grok-1.5 se produce después de que X.ai liberara Grok-1, aunque sin el código necesario para perfeccionarlo o entrenarlo aún más. Más recientemente, Musk dijo que más usuarios de X, específicamente aquellos que pagan el plan Premium de X de $8 por mes, obtendrían acceso a Grok, el chatbot, que anteriormente solo estaba disponible para los clientes de X Premium+ (que pagan $16 por mes).

Fuente