Título de diariodecuyo.com.ar - 15/05/2024 09:30:57

Imagen

ChatGPT-4o: cómo acceder a la versión gratis y qué trae de …

El CEO de Open AI, Sam Altman, confirmó el lanzamiento de GPT-4o y dijo a través de sus redes sociales que estará disponible en el sitio oficial en las próximas semanas. La nueva versión del modelo permite procesar y crear textos, audios y videos. Además, el director de la empresa anunció un nuevo modo de voz y video. Desde el primer lanzamiento de ChatGPT en julio de 2018, fueron presentadas seis versiones diferentes del chatbot. Se trata de un sistema de chat basado en el modelo de lenguaje por Inteligencia Artificial. Según Open AI, la nueva versión representa una transición hacia una interacción persona-computadora mucho más fluida y natural. GPT-4o (“o” de “omni”) aceptará como entrada cualquier combinación de texto, audio e imagen, y es capaz de generar cualquier combinación de salidas de texto, audio e imagen a gran velocidad. Su velocidad de respuesta puede ser de tan solo 232 milisegundos, alcanzando un promedio de 320 milisegundos, tiempo similar a lo que tarda un humano para responder en una conversación normal frente a frente con otra persona. “Antes de GPT-4o, podías usar el modo de voz para hablar con ChatGPT con latencias de 2,8 segundos (GPT-3.5) y 5,4 segundos (GPT-4) en promedio. Para lograr esto, Voice Mode es una canalización de tres modelos separados: un modelo simple transcribe audio a texto; GPT-3.5 o GPT-4 toma texto y genera texto, y un tercer modelo simple convierte ese texto nuevamente en audio. Este proceso significa que la principal fuente de inteligencia, GPT-4, pierde mucha información: no puede observar directamente el tono, varios parlantes o ruidos de fondo y no puede emitir risas, cantar ni expresar emociones”, explicó Open AI en su web oficial. Esta nueva versión iguala el rendimiento de GPT-4 Turbo en texto en inglés y código, con una mejora significativa en texto en distintos idiomas, además de inglés. “Nuestro nuevo modelo GPT-4o, es el mejor que hemos hecho. Es inteligente, es rápido, es multimodal nativo”, declaró Altman. Otra de las grandes novedades de esta edición es la posibilidad de utilizar el ChatGPT-4o de forma gratuita, a diferencia de su predecesor (ChatGPT-4, que exige un pago mensual) además de que tendrá una versión de escritorio. “Queremos poner herramientas de IA geniales en las manos de todo el mundo”, concluyó Altman. Hasta el momento, OpenAI no fijo una fecha de lanzamiento exacta, pero las autoridades aseguraron que el nuevo modelo estará disponible en pocas semanas. No está claro si esa disponibilidad será para todo el mundo en una fecha única de lanzamiento o si será por distintas regiones del planeta. En el momento en que esté disponible la nueva versión del bot, los usuarios deberán entrar a la página oficial de Open AI e ingresar con el usuario y contraseña habitual. En caso de entrar por primera vez, será necesaria la creación de una cuenta. Una vez confirmado el acceso, el usuario deberá seleccionar la opción “ChatGPT-4o” cuando esté disponible y podrá comenzar a interactuar. La nueva versión se anunció un día antes del lanzamiento de Gemini, el motor de búsqueda de Google y la herramienta que competirá con ChatGPT. La carrera por ocupar el primer lugar entre distintas plataformas de inteligencia artificial llevó, por ahora, a Microsoft a convertirse en la mayor empresa del mundo por capitalización bursátil, arrebatando el primer puesto a Apple. Otros avances que incluye ChatGPT-4o son, por ejemplo, las mejoras en el tipeo de información y traducciones en tiempo real, participar de reuniones y crear un resumen de la misma, la posibilidad de cambiar el tono de voz para que el asistente suene más a un humano que a un robot y ayudar a aprender un idioma, entre otras funciones.

Ver noticia completa