
El martes por la tarde, Anthropic lanzó Claude Plays Pokémon en Twitch, una transmisión en vivo del modelo de IA más nuevo de Anthropic, Claude 3.7 Sonnet, jugando a Pokémon Rojo. Se ha convertido en una especie de experimento fascinante, mostrando las capacidades de la tecnología de IA actual y las reacciones de las personas ante ellas.
Los investigadores de IA han utilizado todo tipo de videojuegos, desde Street Fighter hasta Pictionary, para probar nuevos modelos, a menudo más por diversión que por utilidad. Pero Anthropic dijo que Pokémon resultó ser un banco de pruebas útil para Claude 3.7 Sonnet, que puede "pensar" de manera efectiva a través de los tipos de acertijos que el juego contiene.
Como el o3-mini de OpenAI y el R1 de DeepSeek, Claude 3.7 Sonnet puede "razonar" a través de desafíos difíciles, como jugar a un videojuego diseñado para niños. Mientras que el predecesor no razonado del modelo, Claude 3.5 Sonnet, falló al comienzo mismo de Pokémon Rojo, al salir de la casa del jugador en Pueblo Paleta, Claude 3.7 Sonnet logró ganar tres medallas de líder de gimnasio.

El nuevo Claude sigue teniendo problemas. Horas después de la transmisión en Twitch, el modelo fue detenido por un muro de piedra, que no pudo atravesar sin importar cuánto lo intentara.
Un usuario de Twitch resumió la situación de esta manera: '¿quién ganaría, una IA de computadora con miles de horas dedicadas a programarla, o 1 muro de piedra?'
Finalmente, Claude se dio cuenta de que podía rodear el muro.
Por un lado, es frustrante ver a Claude recorrer Pokémon Rojo con la velocidad de un Slowpoke, razonando cada paso con una contemplación exasperante. Sin embargo, también es extrañamente cautivador. La izquierda de la transmisión muestra el 'proceso de pensamiento' de Claude, mientras que la derecha muestra la jugabilidad en tiempo real.
En un momento, Claude intentó ubicar al Profesor Oak dentro de su laboratorio, pero se confundió, porque había otros PNJ en la escena.
'Noté que apareció un nuevo personaje debajo de mí, un personaje con cabello negro y lo que parece ser un abrigo blanco en las coordenadas (2, 10)', escribió Claude. '¡Este podría ser el Profesor Oak! Déjame bajar a hablar con él.'
Luego, Claude procedió a hablar erróneamente con un PNJ que no era el Profesor, un PNJ con el que el modelo había hablado varias veces antes. Algunas de las mil personas en el chat de Twitch comenzaron a impacientarse. Otros, particularmente aquellos que habían estado viendo la transmisión durante más de unos minutos, estaban menos preocupados.
'Chicos, tranquilos', escribió una persona en el chat. 'Antes de salir e ingresar al laboratorio de Oak como 10 veces antes de entender cómo avanzar'.

Para los usuarios veteranos de Twitch, el formato de la transmisión de Anthropic podría resultar nostálgico. Hace más de una década, millones de personas intentaron jugar Pokémon Rojo al mismo tiempo en un experimento social en línea único llamado Twitch Plays Pokémon. Cada usuario podía controlar el personaje del jugador a través del chat de Twitch, lo que resultaba en una jugabilidad caótica y predecible.
Algunos investigadores de IA han citado Twitch Plays Pokémon como inspiración para su trabajo. En octubre de 2023, el ingeniero de software con sede en Seattle, Peter Whidden, publicó un video en YouTube detallando cómo entrenó un algoritmo de aprendizaje por refuerzo para jugar Pokémon. Su IA pasó más de 50,000 horas jugando el juego antes de aprender a navegar con éxito. Un desafío era que la IA prefería admirar el paisaje pixelado en lugar de jugar realmente el juego.
Las 'repeticiones' de Twitch Plays Pokémon con IA como las de Whidden y Anthropic son entretenidas, pero al mismo tiempo agridulces. La transmisión original fue un momento crucial en la historia de Twitch porque unió a las personas de una manera inesperada. Todos estábamos en el mismo equipo, trabajando hacia el objetivo de hacer que el personaje del jugador dejara de correr en círculos y realmente avanzara en el juego.
En 2025, parece que ya no somos compañeros de equipo, sino espectadores, observando a un modelo de IA intentando jugar un juego del que muchos de nosotros nos hicimos expertos cuando teníamos cinco años. Es un microcosmos impulsado por IA de una tendencia más grande: nuestras experiencias en línea están pasando de actividades compartidas y comunitarias a más solitarias.