
OpenAI me dio una semana para probar su nuevo agente de IA, Operator, un sistema que puede realizar tareas por ti de forma independiente en Internet.
El Operator es lo más parecido que he visto a la visión de la industria tecnológica de agentes de IA: sistemas que pueden automatizar las partes aburridas de la vida, liberándonos para hacer lo que realmente amamos. Sin embargo, a juzgar por mi experiencia con el agente de OpenAI, los sistemas de IA realmente "autónomos" aún están fuera de alcance.
OpenAI capacitó un nuevo modelo para alimentar al Operator, que combina la comprensión visual de GPT-4o con las capacidades de razonamiento de o1.
Ese modelo parece funcionar bien para tareas básicas; Vi al Operator hacer clic en botones, navegar en menús de sitios web y completar formularios. La IA tuvo éxito ocasionalmente al tomar acciones de forma independiente, y funciona mucho más rápido que los agentes basados en la web que he visto de Anthropic y Google.
Pero durante mi prueba, me encontré asistiendo al agente de OpenAI más de lo que me hubiera gustado. Se sintió como si estuviera entrenando al Operator a través de cada problema, cuando lo que realmente quería era sacar ciertas tareas de mi plato por completo.
Con demasiada frecuencia durante mi prueba, tuve que responder varias preguntas, otorgar permisos, completar información personal y ayudar al agente cuando se quedaba atascado.
En términos automovilísticos, el Operator es como conducir un automóvil con control de crucero, ocasionalmente quitando el pie de los pedales y dejando que el auto se conduzca solo, pero está lejos de ser un piloto automático completo.
De hecho, OpenAI dice que las pausas frecuentes del Operator son intencionales.
La IA que alimenta al Operator, al igual que la IA que alimenta a los chatbots como el ChatGPT de OpenAI, no puede funcionar de manera confiable de forma independiente durante largos periodos de tiempo, y es propensa al mismo tipo de alucinaciones. Debido a eso, OpenAI no quiere otorgarle al sistema demasiado poder de toma de decisiones o información de usuario sensible. Tal vez sea una elección segura por parte de OpenAI, pero reduce la practicidad del Operator.
Dicho esto, el primer agente de OpenAI es una prueba impresionante de concepto, y una interfaz, para una IA que puede usar el frente de cualquier sitio web. Pero para crear sistemas de IA verdaderamente independientes, las empresas tecnológicas necesitarán construir modelos de IA más confiables que no requieran tanta dirección.
Un poco demasiado 'manos a la obra'
Mi prueba del Operator coincidió con la semana en la que me estaba mudando de apartamento, así que tuve la ayuda del agente de OpenAI con la logística de la mudanza.
Le pedí al Operator que me ayudara a comprar un nuevo permiso de estacionamiento. El agente de OpenAI me dijo: “Claro”, luego abrió una ventana en su navegador en la pantalla de mi PC.
Luego, el Operator realizó una búsqueda de un permiso de estacionamiento en San Francisco en el navegador, me llevó al sitio web de la ciudad correcto e incluso a la página correcta.
El Operator todavía te permite usar el resto de tu computadora mientras trabaja, algo que no se puede decir del Project Mariner de Google. Esto se debe a que el agente de OpenAI realmente no está trabajando en la computadora, sino más bien, en algún lugar de la nube.

Para mi permiso de estacionamiento, tuve que otorgarle al Operator permiso para iniciar diferentes procesos unas cuantas veces. También se detuvo para pedirme que completara formularios con información personal, como mi nombre, número de teléfono y dirección de correo electrónico. A veces, el Operator también se perdía, lo que me obligaba a tomar el control del navegador y guiar al agente de vuelta al rumbo.
En otra prueba, le pedí al Operator que me hiciera una reserva en un restaurante griego. Para su crédito, el Operator me encontró un lugar agradable en mi área con precios razonables. Pero tuve que responder más de una docena de preguntas a lo largo del proceso.

Si tienes que intervenir seis o más veces solo para reservar una mesa a través de un agente de IA, ¿en qué momento sería más fácil hacerlo tú mismo? Esa es una pregunta que me hice mucho mientras probaba el Operator.
Agente como plataforma
En algunas de mis pruebas, me encontré con sitios web que bloquearon al Operator por cualquier motivo. Por ejemplo, intenté reservar un electricista usando TaskRabbit, pero el agente de OpenAI me dijo que había encontrado un error, y me preguntó si podía usar un servicio alternativo en su lugar. Expedia, Reddit y YouTube también bloquearon al agente de IA para acceder a sus plataformas.
Sin embargo, otros servicios están abrazando al Operator con los brazos abiertos. Instacart, Uber y eBay colaboraron con OpenAI para el lanzamiento del Operator, permitiendo que el agente navegue por sus sitios web en nombre de los humanos.
Estas empresas se están preparando para un futuro en el que un subconjunto de interacciones de usuario sean facilitadas por un agente de IA.
“Los clientes utilizan Instacart a través de una variedad de puntos de entrada diferentes”, dijo Daniel Danker, director de producto de Instacart, en una entrevista con TechCrunch. “Vemos al Operator como, potencialmente, otro de esos puntos de entrada”.
Permitir que el agente de OpenAI use el sitio web de Instacart en nombre de una persona parece que separaría a Instacart de sus clientes. Sin embargo, Danker dice que Instacart quiere satisfacer a los clientes donde sea que estén.
“Realmente creemos, al igual que OpenAI, que los sistemas agentes tendrán un impacto importante en cómo los consumidores interactúan con las propiedades digitales”, dijo Nitzan Mekel-Bobrov, director de IA de eBay, en una entrevista con TechCrunch.
Incluso si los agentes de IA ganan popularidad, Mekel-Bobrov dice que espera que los usuarios siempre acudan al sitio web de eBay, señalando que “los destinos en línea no van a desaparecer”.
Problemas de confianza
Tuve algunos problemas para confiar en el Operator después de que alucinara algunas veces, y casi me costó varios cientos de dólares.
Por ejemplo, le pedí al agente que me encontrara un garaje de estacionamiento cerca de mi nuevo apartamento. Terminó sugiriendo dos garajes que según él tomarían solo unos minutos para caminar hasta ellos.

Además de estar muy por encima de mi presupuesto, los garajes en realidad estaban muy lejos de mi apartamento. Uno estaba a 20 minutos a pie, y el otro a 30 minutos. Resulta que el Operator había ingresado la dirección incorrecta.
Por eso mismo, OpenAI no le da a su agente tu número de tarjeta de crédito, contraseñas o acceso al correo electrónico. Si OpenAI no me hubiera permitido intervenir aquí, el Operator habría desperdiciado cientos de dólares en un lugar de estacionamiento que no necesitaba.
Alucinaciones como esta son un obstáculo clave para agentes autónomos realmente útiles, aquellos que pueden quitarte tareas molestas de encima. Nadie confiará en los agentes si son propensos a cometer errores básicos, especialmente errores con consecuencias del mundo real.
Con el Operator, OpenAI parece haber construido algunas herramientas impresionantes para permitir que los sistemas de IA naveguen por la web. Pero estas herramientas no serán mucho hasta que la IA subyacente pueda hacer de manera confiable lo que los usuarios le piden. Hasta entonces, los humanos estarán atascados asistiendo a los agentes, no al revés. Y eso realmente va en contra del propósito.