OpenAI cerró el 2024 con broche de oro durante su evento “shipmas”, anunciando la llegada de su nueva familia de modelos: o3 y o3-mini.
🔹 ¿Qué es o3?
El modelo o3 es la evolución de los modelos de IA de OpenAI, diseñado para ofrecer rendimiento sin precedentes en programación, matemáticas y ciencias. Por otro lado, o3-mini es su versión optimizada, enfocada en tareas más específicas y ligeras.
🚀 Principales logros de o3:
- 💻 Programación: En el benchmark SWE-bench Verified, o3 alcanzó un 71.7%, superando en un 20% a los modelos previos.
- 📚 Ciencia y matemáticas:
- GPQA Diamond (nivel doctoral): 87.7%, aplastando el promedio de expertos con doctorado (70%).
- AIME 2024: 96.7%, saturando la dificultad de estas pruebas.
- 🌐 Adaptación a lo desconocido:
- ARC-AGI (test de adaptación): 87.5%, triplicando el rendimiento de su antecesor y dejando atrás el promedio (30-55%).
🧩 Razonamiento simulado: un cambio radical
o3 introduce la técnica de simulated reasoning o “cadena privada de pensamiento”, una habilidad que permite al modelo pausar y planificar antes de responder. Esto mejora su precisión en la resolución de problemas complejos, acercándolo aún más a un razonamiento humano.
✨ Curiosidad:
El rendimiento de o3 en ARC-AGI lo acerca a los niveles proyectados de IA general (AGI), abriendo el debate sobre cuánto falta realmente para alcanzar ese hito.