Una empresa 100% IA: el experimento que mostró que las máquinas aún no están listas para reemplazarnos

Investigadores de la Universidad Carnegie Mellon llevaron a cabo un experimento audaz: crearon una empresa ficticia, TheAgentCompany, compuesta exclusivamente por agentes de inteligencia artificial (IA) de empresas líderes como Google, OpenAI, Anthropic y Meta. Estos agentes asumieron roles diversos, desde desarrolladores de software hasta analistas financieros y gerentes de proyectos, interactuando en un entorno simulado con herramientas internas, sitios web y canales de comunicación similares a Slack.

El objetivo era evaluar si una empresa operada únicamente por IA podía llevar a cabo tareas laborales reales sin intervención humana. Los resultados fueron reveladores: el mejor desempeño provino del modelo Claude 3.5 Sonnet de Anthropic, que completó solo el 24% de las tareas asignadas. Otras IA, como Gemini 2.0 Flash de Google, lograron tasas de éxito aún menores. Las dificultades incluyeron desde la incapacidad para manejar tareas básicas, como cerrar ventanas emergentes, hasta malentendidos en la comunicación con otros agentes y errores en la ejecución de instrucciones simples.

Este experimento subraya las limitaciones actuales de la IA en entornos laborales complejos y dinámicos. Aunque las IA pueden ser herramientas valiosas para tareas específicas, aún dependen en gran medida de la supervisión y la intervención humanas para funcionar eficazmente en contextos empresariales reales.

A pesar de los avances en IA, este estudio sugiere que las máquinas todavía no están listas para reemplazar completamente a los trabajadores humanos. La colaboración entre humanos y IA sigue siendo esencial para aprovechar al máximo las capacidades de ambas partes en el entorno laboral moderno.