Chatgpt ahora razona a través de audio, visión y texto en tiempo real

La compañía líder en inteligencia artificial, OpenAI, ha dado un paso gigantesco hacia el futuro de la interacción humano-IA con el lanzamiento de su último modelo de lenguaje, que otorga voz al famoso chatbot ChatGPT. Esta innovadora actualización promete transformar por completo la manera en que los usuarios se comunican con la inteligencia artificial, permitiendo una interacción más fluida y natural.

Bajo el título “OpenAI le da voz a ChatGPT: el chatbot ahora hablará con los usuarios”, la noticia revela cómo esta nueva versión, denominada GPT-4o, ofrece una experiencia multimodal que abarca texto, voz e imágenes. Este hito fue presentado por la CTO de OpenAI, Mira Murati, durante un evento que destacó las mejoras significativas en velocidad y capacidades de la IA.

Una de las características más sobresalientes de GPT-4o es su capacidad “nativamente multimodal”, lo que significa que puede comprender y generar contenido en voz, texto e imágenes de manera integrada. Esta versatilidad abre un abanico de posibilidades en la interacción entre humanos y la IA, proporcionando una experiencia más intuitiva y personalizada.

Anteriormente, la interacción con ChatGPT se limitaba principalmente al texto, pero con la introducción de la voz, los usuarios ahora pueden comunicarse de manera más natural y espontánea. GPT-4o es capaz de procesar y generar respuestas en tiempo real, incluso captando la emoción en la voz del usuario y reproduciéndola en diferentes estilos, lo que añade una dimensión emocional a la conversación.

Además de la voz, GPT-4o también mejora las capacidades de ChatGPT en el ámbito de la visión, permitiéndole analizar imágenes o capturas de pantalla y proporcionar información relevante o respuestas a consultas específicas. Esta ampliación de capacidades no solo mejora la experiencia del usuario, sino que también la hace más poderosa y versátil.

La disponibilidad de GPT-4o será gratuita para todos los usuarios de ChatGPT, con usuarios premium disfrutando de capacidades ampliadas hasta cinco veces mayores que los usuarios gratuitos. Además, los desarrolladores podrán aprovechar la API de OpenAI para integrar la capacidad de voz en sus propias aplicaciones y sistemas, abriendo nuevas posibilidades en el desarrollo de aplicaciones de IA.

En resumen, OpenAI ha dado un salto cualitativo en la interacción humano-IA con el lanzamiento de GPT-4o, que otorga voz a ChatGPT y amplía significativamente sus capacidades. Esta innovadora actualización promete una experiencia más fluida, natural y poderosa para los usuarios, marcando un hito en el camino hacia la inteligencia artificial verdaderamente conversacional.

Estación del Siglo

Chatgpt ahora razona a través de audio, visión y texto en tiempo real

Universal Studios homenajeará a Ozzy Osbourne con una casa embrujada inspirada en su carrera

Tom Holland confesó que su primer día con Christopher Nolan fue de los más difíciles de su carrera

Tragedia, heavy metal y terror inmersivo: Ozzy Osbourne tendrá su propia atracción en Halloween Horror Nights

Recreaciones perfectas y estrategia pura: los videojuegos que convirtieron la historia universal en diversión masiva