jueves, 30 enero, 2025
InicioTecno"Operator", el nuevo agente de ChatGPT que navega y ejecuta tareas en...

«Operator», el nuevo agente de ChatGPT que navega y ejecuta tareas en internet: cómo probarlo

OpenAI mostró una vista previa de lo que será su agente de ChatGPT llamado Operator, que es capaz de navegar por la web y realizar indicadas por los usuarios. Esta nueva función usa su propio navegador para acceder a cualquier página e interactuar con ella, y se lanzará primero en Estados Unidos para aquellos usuarios suscritos a ChatGPT Pro, el nuevo plan premium de 200 dólares al mes.

Operator está basado en un modelo de «agente de uso informático» que combina las capacidades de visión del modelo 4.0 con un «razonamiento avanzado a través del aprendizaje de refuerzo» para poder interactuar con las GUI (Interfaces Gráficas de Usuario). Gracias a esta integración, el agente es capaz de comprender y manipular elementos visuales a través de capturas de pantalla, tomando decisiones de forma autónoma y utilizando las acciones que permiten un mouse y un teclado con un navegador.

Operator tendrá su propia consciencia para poder auto-corregirse y dejarle el control al usuario en caso de atascarse. Además, en otras situaciones también le cederá el control, como por ejemplo cuando un sitio web solicite que el usuario introduzca datos personales o las credenciales de inicio de sesión en algún sitio web.

No siempre funcionará de manera autónoma, ya que, por ejemplo, para enviar correos electrónicos debería pedir permiso, entre otras situaciones.

OpenAI también anunció que está trabajando con empresas como DoorDash, Instacart, OpenTable, Priceline, StubHub, Thumbtack y Uber para que Operator pueda cubrir necesidades del mundo real. Sin embargo, OpenAI también comentó que su agente tiene problemas con interfaces algo más complejas, como la creación de presentaciones o las apps de calendario.

El futuro de Operator es formar parte también de los planes Plus, Team y Enterprise, ya que por el momento solo está disponible para los suscriptores de ChatGPT Pro. Además, OpenAI quiere que Operator esté integrado en ChatGPT en el futuro. Mientras llega a los demás planes y a más países, OpenAI sigue mejorando su chatbot con la introducción de los Proyectos, una nueva forma de organizar los chats.

Qué son los agentes de inteligencia artificial

ChatGPT, pionero en IA. (Foto: Reuters)

Los gigantes tecnológicos OpenAI, Microsoft, Google y Salesforce se encuentran ahora acelerando el desarrollo de una nueva generación de inteligencia artificial basada en agentes.

Estos sistemas marcarán un antes y después en campos como la sanidad, la robótica y los videojuegos, dejando atrás la era de los chatbots para dar paso a herramientas capaces de realizar tareas complejas de forma autónoma.

Estos programas son desarrollados para percibir su entorno y tomar decisiones automáticas utilizando modelos de inteligencia artificial. Por lo tanto, no es una IA con la que un usuario puede interactuar como ChatGPT, sino programas diseñados para realizar tareas basándose en su entorno.

Un AI Agent puede utilizar diferentes métodos para vincularse con sus tareas, siempre dependiendo del objetivo con el que fue diseñado. A veces, puede hacerlo con personas mediante texto escrito, o bien una serie de preguntas para tener una mayor comprensión del contexto.

Pero también es posible que esté en un dispositivo tecnológico equipado con sensores de varios tipos que les permitan analizar sus alrededores, similar a cómo un termostato inteligente ajusta la temperatura o una aspiradora Roomba aprende la disposición de una habitación.

Los expertos distinguen tres niveles de sofisticación en estos agentes. La evolución es fascinante y progresiva: desde los agentes de reflejo simple como termostatos, pasando por los basados en objetivos como Roomba, hasta llegar a los más avanzados basados en utilidad, capaces de sopesar riesgos y beneficios antes de tomar decisiones, considerando incluso objetivos que puedan entrar en conflicto.

SL

Más Noticias