Who bought this smoked salmon? How ‘AI agents’ will change the internet (and shopping lists) | Artificial intelligence (AI)


je«Je regarde l’intelligence artificielle commander mes courses. Armé de ma liste de courses, il tape chaque élément dans la barre de recherche d’un site Web de supermarché, puis utilise son curseur pour cliquer. Regarder ce qui semble être un fantôme numérique, faites cette tâche généralement banale est étrangement transpercé. «Êtes-vous sûr que ce n’est pas seulement une personne en Inde?» Demande mon mari en regardant par-dessus mon épaule.

J’essaye Opérateurun nouvel «agent» d’IA d’Openai, le fabricant de Chatgpt. Menés à la disposition des utilisateurs britanniques le mois dernier, il a une interface de texte et un ton conversationnel similaires à Chatgpt, mais plutôt que de simplement répondre aux questions, il peut en fait faire choses – à condition qu’ils impliquent une navigation sur un navigateur Web.

Dans les talons de modèles de grandes langues, les agents de l’IA ont été trompés comme la prochaine grande chose, et vous pouvez voir l’appel: un assistant numérique qui peut effectuer des tâches pratiques est plus convaincant que celui qui peut simplement parler. Semblable à l’offre d’Openai, Anthropic a introduit des capacités «d’utilisation de l’ordinateur» à son chatbot Claude vers la fin de l’année dernière. Perplexity et Google ont également publié des fonctionnalités «agentiques» dans leurs assistants d’IA, avec d’autres sociétés développant des agents visant des tâches spécifiques telles que le codage ou la recherche.

Il y a un débat sur ce qui compte exactement comme un agent d’IA, mais l’idée générale est qu’ils doivent être en mesure de prendre des mesures avec un certain degré d’autonomie. «Dès que quelque chose commence à exécuter des actions en dehors de la fenêtre de discussion, il est passé d’un chatbot à un agent», explique Margaret Mitchell, scientifique en chef de l’éthique de la société AI Hugging Face.

Il est tôt. La plupart des agents disponibles dans le commerce viennent avec un avertissement qu’ils sont toujours expérimentaux – Openai décrit l’opérateur comme un «aperçu de recherche» – et vous pouvez trouver de nombreux exemples en ligne en faisant des erreurs amusantes, telles que les dépenses 31 $ sur une douzaine d’œufs ou essayer de Remettez des épiceries à la boutique Ils les ont achetés. Selon qui vous demandez, les agents ne sont que le prochain jouet technologique sur-typé ou l’aube d’un avenir d’IA qui pourrait secouer la main-d’œuvre, remodeler Internet et changer notre façon de vivre.

«En principe, ils seraient incroyables, car ils pourraient automatiser beaucoup de corvées», explique Gary Marcus, scientifique et sceptique de modèles de grande langue. “Mais je ne pense pas qu’ils travailleront de manière fiable de si tôt, et c’est en partie un investissement dans le battage médiatique.”

Je m’inscrit à l’opérateur pour voir par moi-même. Sans nourriture dans la maison, l’épicerie semble être une bonne première tâche. Je tape ma demande et il me demande si j’ai une boutique ou une marque préférée. Je lui dis d’aller avec ce qui est le moins cher. Une fenêtre apparaît montrant un navigateur Web et je le vois rechercher «UK Online Grocery Delivery». Un curseur de souris sélectionne le premier résultat: OCADO. Il commence à rechercher mes articles demandés et filtre les résultats par prix. Il sélectionne les produits et clique sur «Ajouter à Trolley».

Je suis impressionné par l’initiative de l’opérateur; Cela ne me poivrait pas de questions, à la place d’une décision exécutive lorsqu’il est donné qu’une brève description d’article, telle que «saumon» ou «poulet». Lorsqu’il recherche des œufs, il fait défiler avec succès plusieurs articles non à l’œuf qui apparaissent comme des offres spéciales. Ma liste demande «quelques légumes différents»: il sélectionne une tête de brocoli, puis demande si j’aimerais autre chose. Je lui dis de choisir deux autres et ça va pour les carottes et les poireaux – probablement ce que j’avais choisi moi-même. Enhardi, je lui dis d’ajouter «une gâterie sucrée» et de regarder car il tape littéralement «friandise» dans la barre de recherche. Je ne sais pas pourquoi il choisit à 70% de chocolat – certainement pas l’option la moins chère – mais je le dis que je n’aime pas le chocolat noir et cela l’échange pour un bar Galaxy.

Thomas Dohmke, chef de Github, qui se développe sur un assistant de codage autonome appelé Project Padawan. Photographie: DPA Picture Alliance / Alamy

Nous avons frappé un problème lorsque l’opérateur se rend compte qu’Ocado a une dépense minimale, donc j’ajoute plus d’éléments à la liste. Ensuite, il s’agit de vous connecter et l’agent m’incite à intervenir: tandis que les utilisateurs peuvent reprendre le navigateur à tout moment, Openai a déclaré que l’opérateur est conçu pour demander cela «lors de la saisie des informations sensibles dans le navigateur, telles que les informations d’identification de connexion ou les informations de paiement». Bien que l’opérateur prenne généralement des captures d’écran constantes afin de «voir» ce qu’elle fait, Openai dit qu’il ne fait pas cela lorsqu’un utilisateur prend le contrôle.

À la caisse, je teste les eaux en demandant à l’opérateur de terminer le paiement. Je reprends les rênes, cependant, quand il répond en demandant les détails de ma carte. J’ai déjà donné à Openai mes informations de paiement (l’opérateur nécessite un compte Chatgpt Pro, qui coûte 200 $ par mois), mais je me sens mal à l’aise de le partager directement avec une IA. Commande passée, j’attends ma livraison le lendemain. Mais cela ne résout pas le dîner. Je donne à l’opérateur une nouvelle tâche: peut-il me commander un cheeseburger et des frites d’un restaurant local et très bien noté? Il demande mon code postal, puis charge le site Web Deliveroo et recherche «Cheeseburger». Encore une fois, il y a une pause quand je dois me connecter, mais comme Deliveroo a déjà stocké les détails de ma carte, l’opérateur peut procéder directement au paiement.

Le restaurant qu’il sélectionne est local, et il est très bien évalué – en tant que boutique de poisson et de frites. Je me retrouve avec un cheeseburger passable et un grand sac de croustilles de style chippy. Pas exactement ce que j’avais envisagé mais pas fauxsoit. Je suis mortifié, cependant, quand je me rends compte que l’opérateur a sauté sur le bas du cavalier de livraison. Je prends timidement ma nourriture et ajoute un pourboire généreux après coup.

Bien sûr, regarder l’opérateur en action vaincue plutôt le point de réduction des temps d’utiliser un agent d’IA pour les tâches en ligne. Au lieu de cela, vous pouvez le laisser fonctionner en arrière-plan pendant que vous vous concentrez sur d’autres onglets. En rédigeant cette pièce, je fais une autre demande: peut-elle me réserver une manucure de gel dans un salon local?

L’opérateur se débat plus avec cette tâche. Il va à la plate-forme de réservation de beauté Fresha mais, quand cela m’invite à me connecter, je vois qu’il a choisi un rendez-vous une semaine trop tard et à plus d’une heure de route de ma maison dans l’est de Londres. Je souligne ces problèmes et il trouve un créneau pour la bonne date mais à Leicester Square – toujours à distance. Ce n’est qu’alors qu’il demande à ma position, et je me rends compte qu’il ne doit pas avoir conservé ces connaissances entre les tâches. À ce stade, j’aurais déjà pu faire ma propre réservation. L’opérateur suggère finalement un rendez-vous approprié, mais j’abandonne la tâche et je le craie comme une victoire pour Team Human.

Les assistants d’achat de l’IA s’arrêteront et nécessiteront des contributions humaines lorsqu’il s’agit de se connecter aux sites Web des supermarchés ou d’effectuer des paiements en ligne. Photographie: Marco Marca / Getty Images

Il est clair que cette première génération d’agents d’IA a des limites. Devoir s’arrêter et se connecter nécessite une bonne quantité de surveillance humaine, bien que l’opérateur stocke les cookies pour permettre aux utilisateurs de rester connectés aux sites Web lors de visites ultérieures (OpenAI dit qu’il nécessite une supervision plus étroite sur les sites «particulièrement sensibles», tels que les clients de messagerie ou les services financiers). Les résultats, bien que généralement précis, ne sont pas toujours ce que j’ai en tête. Lorsque mon épicerie arrive, je trouve que l’opérateur a commandé du saumon fumé plutôt que des filets et a doublé sur le yaourt, peut-être à cause d’une offre spéciale. Il a interprété «certains gâteaux de poisson» comme signifiant trois paquets (je ne le voulais qu’un) et n’a fait qu’économiser l’indignité d’acheter du lait au chocolat au lieu de la plaine car le produit était en rupture de stock. Pour être juste envers le bot, j’ai eu l’occasion de revoir la commande, et j’aurais obtenu de meilleurs résultats si j’avais été plus précis dans mes invites («un paquet de deux filets de saumon bruts») – mais ces étapes supplémentaires nuireaient également à l’effort économisé.

Malgré les défauts actuels, mon expérience avec l’opérateur semble être un aperçu de quelque chose à venir. À mesure que ces systèmes s’améliorent et réduisent le coût, je pouvais facilement les voir devenir intégrés dans la vie quotidienne. Vous pourriez déjà écrire votre liste de courses sur une application; Pourquoi ne passerait-il pas également la commande? Les agents infiltraient également les flux de travail au-delà du domaine d’un assistant personnel. Le directeur général d’Openai, Sam Altman, a prédit que les agents de l’IA pourraient «rejoindre le marché du travail» cette année.

Les développeurs de logiciels sont parmi les premiers adoptants; plate-forme de codage github Capacités agentiques récemment ajoutées à son outil de copilote AI. Le PDG de Github, Thomas Dohmke, affirme que les développeurs sont habitués à un certain niveau d’assistance automatisée; La différence avec les agents de l’IA est le niveau d’autonomie. “Au lieu de vous poser une question et cela vous donne une réponse, vous lui posez un problème, puis il itère ce problème avec le code auquel il a accès”, dit-il.

Github travaille déjà sur un agent avec une plus grande autonomie, qu’il appelle Project Padawan (un Star Wars terme faisant référence à un apprenti Jedi). Cela permettrait à un agent d’IA de travailler de manière asynchrone plutôt que de nécessiter une surveillance constante; Un développeur pourrait avoir des équipes d’agents qui leur relèvent, produisant du code pour son examen. Dohmke dit qu’il ne pense pas que les emplois des développeurs soient en danger, car leurs compétences trouveront une demande croissante. «Je dirais que la quantité de travail que l’IA a ajoutée à la plupart des développeurs est supérieure à la quantité de travail qu’elle a reprise», dit-il. Les agents pourraient également effectuer des tâches de codage, comme la création d’une application, plus accessible aux personnes non techniques.

Margaret Mitchell de la société AI étreignant le visage avertit contre le développement d’agents complètement autonomes. Photographie: Bloomberg / Getty Images

Développement de logiciels en dehors, Dohmke envisage un avenir lorsque tout le monde a son propre jarvis personnel, l’IA qui parle Iron. Votre agent apprendra vos habitudes et deviendra personnalisé à vos goûts, ce qui le rend plus utile. Il utiliserait ses vacances pour sa famille.

Plus les agents d’autonomie ont cependant les plus grands risques qu’ils posent. Mitchell, de l’étreinte Face, co-auteur un papier Avertissement contre le développement d’agents entièrement autonomes. «Entièrement autonome signifie que le contrôle humain a été entièrement cédé», dit-elle. Plutôt que de travailler dans des limites de définition, un agent entièrement autonome pourrait accéder à des choses que vous ne réalisez pas ou ne vous comportez pas de manière inattendue, surtout si elle peut écrire son propre code. Ce n’est pas un gros problème si un agent d’IA se trompe de votre ordre à emporter, mais que se passe-t-il s’il commence à partager vos informations personnelles avec des sites Web d’escroquerie ou à publier un contenu horrible des médias sociaux sous votre nom? Les lieux de travail à haut risque pourraient introduire des scénarios particulièrement dangereux: que se passe-t-il s’il peut accéder à un système de commandement de missiles?

Mitchell espère que les technologues, les législateurs et les décideurs inciteront les garde-corps à atténuer ces incidents. Pour l’instant, elle prévoit que les capacités agentiques deviennent plus raffinées pour des tâches spécifiques. Bientôt, dit-elle, nous verrons des agents interagir avec les agents – votre agent pourrait travailler avec le mien pour organiser une réunion, par exemple.

Cette prolifération des agents pourrait remodeler Internet. Actuellement, beaucoup d’informations en ligne sont spécialisées pour le langage humain, mais si les AIS interagissent de plus en plus avec les sites Web, cela pourrait changer. «Nous allons voir de plus en plus d’informations disponibles sur Internet qui n’est pas directement du langage humain, mais les informations qui seraient nécessaires pour qu’un agent puisse agir dessus», explique Mitchell.

Dohmke fait écho à cette idée. Il croit que le concept de la page d’accueil perdra de l’importance et que les interfaces seront conçues en pensant aux agents de l’IA. Les marques peuvent commencer à concourir pour l’attention de l’IA sur les globes oculaires humains.

Un jour, les agents peuvent même échapper aux limites de l’ordinateur. Nous pouvions voir des agents de l’IA incarnés dans des robots, ce qui ouvrirait un monde de tâches physiques pour eux. «Ma prédiction est que nous allons voir des agents qui peuvent faire notre lessive pour nous et faire nos plats et nous préparer le petit déjeuner», explique Mitchell. “Ne leur donnez pas accès aux armes.”

Leave a Reply

Your email address will not be published. Required fields are marked *