Ultimas Noticias

El agente de ChatGPT Atlas me ha hecho la compra en Mercadona y ahora tengo la despensa llena de ajos

Hace una semana probé el nuevo ChatGPT Atlas, el nuevo navegador de OpenAI y, aunque tiene mucho que mejorar, me pareció toda una amenaza al dominio de Google con Chrome. Hoy he vuelto a ponerlo a prueba, esta vez con una suscripción Plus, y he querido comprobar si el modo agente es capaz de hacer la compra en Mercadona. 

Planteando la situación

Era la primera vez que usaba a ChatGPT para algo así y no quería simplemente darle una lista de la compra, por lo que primero le he pedido ideas para hacer recetas saludables, pero que sean ricas. Me ha ofrecido varias opciones y cuando me he decantado por una de ellas, he activado el modo agente y le he pedido que comprara los ingredientes en Mercadona.

Alerta ChatGPT Agente

 Ya hemos hablado de que los navegadores IA son vulnerables a ataques por inyección de prompts y OpenAI lo sabe. Antes de empezar, ha aparecido un mensaje alertándome de que usar el modo agente conlleva riesgos y podía usarlo con la sesión iniciada o sin ella. En mi caso he elegido la sesión iniciada porque quería verlo trabajar con más soltura, pero por precaución antes he eliminado mis datos de pago en la web de Mercadona.

Haciendo la compra

Una vez aceptados los riesgos, se ha activado el modo agente y el ratón ha empezado a moverse por la interfaz de la web de Mercadona. En la barra lateral va apareciendo  todo el proceso de pensamiento y toma de decisiones del modelo mientras compraba los ingredientes para hacer un curry de garbanzos. En el vídeo podéis ver todo el proceso de compra completo.

El agente ha ido tomando decisiones cuando se ha encontrado con varios artículos a elegir. Por ejemplo para la receta hacía falta una cebolla, pero ha decidido que era más práctico comprar un paquete de 1kg. Sin embargo, al elegir las espinacas ha decidido que era mejor un paquete de espinacas baby que el paquete grande que sale mucho más barato. Cuando ha terminado de elegir ingredientes me ha pedido que lo revisara y le he pedido que cambiara las espinacas. Lo ha hecho sin rechistar.

El proceso se ha parado cuando se ha topado con un obstáculo insalvable: llevaba solamente 10,28 euros y el pedido mínimo en la web de Mercadona es de 50 euros, así que le he pedido que incluyera también los ingredientes de otra de las recetas que me había sugerido al principio, una de salmón al horno. Como con esa tampoco llegaba al pedido mínimo, le he dicho que la quería hacer para cuatro personas y que por favor no me pusiera salmón congelado, sino fresco.

El agente ha ajustado las cantidades y ha cambiado el salmón por uno fresco, pero aún así no llegaba a los 50 euros, así que le he pedido algo más creativo: que me buscara los productos más virales de Mercadona recientemente y los añadiera a la cesta. 

La compra te la hace, pero tiene un problema

Cuando ha acabado, era momento de revisar la cesta. Me he encontrado con que me había añadido ajos y también ajos morados. Los ajos normales eran correctos, ¿pero los morados? He revisado la cadena de pensamiento y se había confundido buscando cebolla morada. Mercadona la llama «cebolla roja» y el agente ha decidido que era mejor añadir ajos morados porque coincidía el color, aunque fueran un ingrediente distinto. 

Sobre los productos virales, me ha elegido un calendario de adviento con maquillaje, queso raclette ahumado, turrón de cookies y bizcocho de pistacho. El importe total ha sido de 66 euros, es verdad que no le he dicho expresamente que se ajustara a los 50 euros, pero me parece que se ha excedido un poco.

El agente ha tomado el control del navegador y ha hecho exactamente lo que quería: hacerme la compra. Sin embargo hay un problema y es que es lentísimo. Yo tampoco he ayudado mucho. No haber previsto que había un pedido mínimo y las peticiones adicionales que le he ido haciendo, como que cambiara las cantidades o eligiera productos por sí mismo, ha hecho que aún fuera más lento. 

En total ha estado pensando casi 15 minutos, pero si tenemos en cuenta solamente la primera parte de la compra para el curry de garbanzos, ha tardado 2:14 minutos. Más de dos minutos para añadir ocho ítems al carro. Todo el tiempo he tenido la sensación de que yo ya tendría el pedido acabado y pagado.

Con respecto a la fiabilidad, he de decir que ha cometido menos errores de los que me esperaba, pero sigue siendo necesario revisar lo que ha añadido a la cesta al final porque puede colarte unos ajos en lugar de cebollas, y ya tengo bastantes ajos en la despensa.

Mucho más práctico en otros escenarios

Uno de los escenarios de uso que dio OpenAI en la presentación de su nuevo navegador fue precisamente hacer la compra. Tras probarlo, me queda claro que el modo agente de ChatGPT Atlas tiene mucho potencial, pero no para hacer la compra, por eso he probado otro escenario donde puede ser mucho más útil: organizar un viaje.

Le he pedido que me buscara lugares para irme de escapada en el puente de diciembre, que estuvieran a menos de 2 horas en coche desde Valencia, con un presupuesto concreto y que los buscara en Booking y Airbnb. En seis minutos me ha dado opciones para dos destinos distintos, organizadas en una tabla con precio por noche y puntos a destacar. Una vez me he decidido, sólo he tenido que darle los datos personales para completar la reserva.

ChatGPT Atlas modo agente

Para organizar un viaje sí que es práctico.

Hacer la compra es simplemente añadir cosas al carro, un proceso mucho más mecánico que podemos hacer manualmente en muy poco tiempo. Si además nos topamos con obstáculos como el pedido mínimo o no tenemos del todo claro lo que queremos, acabamos perdiendo más tiempo que ganándolo. 

Donde el agente sí que ofrece más potencial es para tareas más complejas que requieren de más pasos para filtrar información. Por ejemplo a la hora de organizar un viaje hay que hacer muchas más cosas; elegir destino, planificar rutas, buscar alojamientos, comprobar que se ajusten al presupuesto y mucho más. En este caso podemos dejar al modo agente pensando mientras nos dedicamos a otras cosas y sí que nos ahorra mucho tiempo.

Imágenes | Amparo Babiloni, Xataka

En Xataka | Unos investigadores crearon una empresa donde todos los empleados eran agentes IA. No hicieron ni una cuarta parte del trabajo

source

Mostrar más
Botón volver arriba