oogle ha presentado oficialmente Gemini 1.5, una innovación significativa en su línea de modelos de inteligencia artificial. Este nuevo modelo se caracteriza por una arquitectura avanzada denominada Mixture-of-Experts (MoE), diseñada para optimizar el procesamiento de tareas complejas. A través de esta arquitectura, Gemini 1.5 divide su estructura en múltiples redes neuronales menores, conocidas como “expertas”, que se activan selectivamente según el tipo de datos ingresados. Esta metodología no solo acelera el aprendizaje de tareas complejas manteniendo un alto nivel de calidad, sino que también hace que el entrenamiento del modelo sea más eficiente.
En una primera fase, Google lanzará Gemini 1.5 Pro, una versión mediana que se destaca por su capacidad para manejar contextos largos, ofreciendo inicialmente una ventana de contexto estándar de 128.000 tokens. Además, un grupo selecto de desarrolladores y clientes empresariales tendrán la oportunidad de experimentar con una ventana contextual ampliada hasta un millón de tokens, a través de AI Studio y Vertex AI. Esta característica permitirá al modelo procesar una cantidad impresionante de información simultáneamente, como una hora de vídeo, once horas de audio, bases de código de más de 30.000 líneas o textos que superen las 700.000 palabras.
El objetivo de esta expansión en la ventana de contexto es mejorar la latencia, la experiencia del usuario y reducir los requisitos de computación antes de su implementación a gran escala. Con estas mejoras, Gemini 1.5 Pro promete una comprensión y un razonamiento superiores, capaces de analizar, clasificar y resumir vastas cantidades de contenido de manera eficaz, además de abordar problemas complejos en bloques de código extensos.
Dato curioso: La arquitectura Mixture-of-Experts, utilizada en Gemini 1.5, representa un enfoque innovador en el desarrollo de modelos de inteligencia artificial. Al dividir el modelo en varias “expertas” especializadas, se logra una especialización más profunda en distintas tareas, lo que puede compararse con cómo un equipo de expertos en diferentes áreas trabajaría conjuntamente para resolver un problema complejo, cada uno aportando su conocimiento específico para alcanzar una solución más efectiva y eficiente.