28/01/2025

Web

OpenAI lance Operator, un agent IA capable d’effectuer des tâches en autonomie

OpenAI a lancé "Operator", un outil d'automatisation web qui s'appuie sur un nouveau modèle d'IA appelé Computer-Using Agent (CUA). Ce système, capable de contrôler un navigateur web de manière visuelle et interactive, vise à simplifier les tâches répétitives ou complexes pour les utilisateurs.

Un agent virtuel qui imite l’humain

Operator utilise une interface de navigation virtuelle (comme si c'était son propre navigateur Web) et exécute des actions en simulant des clics et des frappes au clavier, comme le ferait un utilisateur devant son PC. Sauf que là, tout est automatisé ! Le modèle analyse des captures d’écran de son interface pour comprendre l’état du navigateur, prendre des décisions et effectuer des actions. Cette conception permet à l’agent IA de s’adapter à des tâches variées, à partir du moment où elles sont réalisables avec un navigateur Web.

Operator s'appuie sur un nouveau modèle d'intelligence artificielle nommé Computer-Using Agent, que l'on peut traduire par "agent utilisant un ordinateur". Ainsi, il combine de nouvelles capacités avec celles de vision par ordinateur de GPT-4o.

Actuellement, Operator montre une véritable efficacité pour répéter des tâches. Il est notamment performant pour effectuer des tâches comme la création de listes ou la navigation sur des sites simples. Par contre, il y a des difficultés avec des interfaces complexes comme les tableaux et les calendriers, ou des tâches de modification avancée de texte.

OpenAI a testé Operator dans le cadre de plusieurs benchmarks avec des outils comme WebVoyager, WebArena et OSWorld.

L'agent Operator a atteint un taux de succès de 87 % sur le benchmark WebVoyager, qui teste des sites en direct comme Amazon et Google Maps. À l'inverse, il a obtenu seulement un score de 58,1 % sur WebArena (sites hors ligne pour les agents autonomes). Pour les tâches liées aux systèmes d’exploitation, il a établi un record de 38,1 % de réussite sur le benchmark OSWorld, surpassant d’autres modèles, mais restant en deçà des performances humaines (72,4 %).

Operator, un agent IA qui travaille à votre place
Source : OpenAI

Qui peut accéder à Operator ?

La bonne nouvelle, c'est qu'Operator est dès à présent accessible via l'adresse operator.chatgpt.com ! La mauvaise nouvelle, c'est que vous devez disposer d'un abonnement à ChatGPT Pro, un abonnement facturé 200 dollars par mois. Autre condition à respecter : être aux États-Unis (ou utiliser un VPN).

OpenAI prévoit de l'étendre ultérieurement à ses autres abonnés, notamment ceux qui ont un abonnement ChatGPT Plus, ChatGPT Team ou Enterprise. Sans surprise, les abonnés à ChatGPT Pro ont accès en avant-première à cette innovation. OpenAI devrait intégrer ces fonctionnalités directement dans ChatGPT et rendre accessible Operator via son API pour les développeurs.

Pour le moment, Operator est encore en développement puisque c'est une préversion qui est accessible.

Sécurité et confidentialité : des enjeux majeurs

Operator étant un agent IA qui peut naviguer seul sur Internet (qui est une vraie jungle), OpenAI a intégré des contrôles de sécurité pour éviter les abus. Il y a notamment les précautions suivantes :

  • Environnement virtuel sécurisé : toutes les activités restent confinées à Operator.
  • Actions sensibles supervisées : les utilisateurs doivent valider les actions sensibles, comme les paiements ou l’envoi d’e-mails.
  • Restrictions de navigation : accès interdit à des catégories de sites, comme les contenus adultes ou les jeux d’argent.

Pour contrer les tentatives de "jailbreaks" (injections de prompts), Operator est équipé de systèmes de détection en temps réel. Cependant, certains experts, comme Simon Willison, restent sceptiques. "J'imagine que nous verrons toutes sortes de nouvelles attaques réussies de type "prompt injection" contre ce modèle lorsque le reste du monde commencera à l'explorer.", a-t-il écrit sur son blog.

En complément, OpenAI a intégré à l'interface des options pour garantir la confidentialité des utilisateurs :

  • Possibilité de désactiver l’utilisation des données pour l’entraînement des modèles.
  • Suppression rapide des données de navigation via un bouton dédié.
  • Mode "prise de contrôle" activé lors de l’entrée d’informations sensibles, suspendant la collecte de captures d’écran.

Tout cela est à suivre de près. 2025 s'annonce déjà comme l'année des agents IA...

Source

author avatar
Florian BURNEL Co-founder of IT-Connect
Ingénieur système et réseau, cofondateur d'IT-Connect et Microsoft MVP "Cloud and Datacenter Management". Je souhaite partager mon expérience et mes découvertes au travers de mes articles. Généraliste avec une attirance particulière pour les solutions Microsoft et le scripting. Bonne lecture.
Partagez cet article Partager sur Twitter Partager sur Facebook Partager sur Linkedin Envoyer par mail

Laisser un commentaire

Votre adresse e-mail ne sera pas publiée. Les champs obligatoires sont indiqués avec *

Ce site utilise Akismet pour réduire les indésirables. En savoir plus sur comment les données de vos commentaires sont utilisées.