Rejoignez nos newsletters quotidiennes et hebdomadaires pour les dernières mises à jour et du contenu exclusif sur la couverture de l’IA de pointe. Apprendre encore plus
Si 2023 était l’année des chatbots et de la recherche génératifs basés sur l’IA, 2024 était entièrement consacrée aux agents IA. Ce qui a commencé avec Devin plus tôt cette année est devenu un phénomène à part entière, offrant aux entreprises et aux particuliers un moyen de transformer leur façon de travailler à différents niveaux, de la programmation et du développement aux tâches personnelles telles que la planification et la réservation de billets pour des vacances.
Parmi ces applications très variées, nous avons également assisté cette année à l’essor des agents de données, des agents basés sur l’IA qui gèrent différents types de tâches au sein de la pile d’infrastructure de données. Certains ont effectué un travail d’intégration de données de base tandis que d’autres ont géré des tâches en aval, telles que l’analyse et la gestion dans le pipeline, rendant les choses plus simples et plus faciles pour les utilisateurs de l’entreprise.
Les avantages ont été une efficacité accrue et des économies de coûts, ce qui a amené beaucoup de gens à se demander : comment les choses vont-elles changer pour les équipes de données dans les années à venir ?
Les agents Gen AI ont pris en charge les tâches de données
Alors que les capacités agentiques existent depuis un certain temps, permettant aux entreprises d’automatiser certaines tâches de base, l’essor de l’IA générative a fait passer les choses à un niveau supérieur.
Grâce aux capacités de traitement du langage naturel et d’utilisation des outils de la génération AI, les agents peuvent aller au-delà du simple raisonnement et des réponses pour planifier des actions en plusieurs étapes, en interagissant de manière indépendante avec les systèmes numériques pour mener à bien des actions tout en collaborant avec d’autres agents et personnes en même temps. Ils apprennent également à améliorer leurs performances au fil du temps.
Devin de Cognition AI a été la première offre agentique majeure, permettant des opérations d’ingénierie à grande échelle. Ensuite, de plus grands acteurs ont commencé à proposer des agents d’entreprise et personnels plus ciblés, alimentés par leurs modèles.
Lors d’une conversation avec VentureBeat plus tôt cette année, Gerrit Kazmaier de Google Cloud a déclaré avoir entendu des clients dire que leurs praticiens des données étaient constamment confrontés à des défis, notamment l’automatisation du travail manuel pour les équipes de données, la réduction du temps de cycle des pipelines et des analyses de données et la simplification de la gestion des données. Essentiellement, les équipes ne manquaient pas d’idées sur la manière de créer de la valeur à partir de leurs données, mais elles manquaient de temps pour mettre en œuvre ces idées.
Pour résoudre ce problème, a expliqué Kazmaier, Google a réorganisé BigQuery, son offre d’infrastructure de données de base, avec Gemini AI. Les capacités agentiques qui en résultent offrent non seulement aux entreprises la possibilité de découvrir, de nettoyer et de préparer les données pour les applications en aval (en éliminant les silos de données et en garantissant la qualité et la cohérence), mais elles prennent également en charge la gestion et l’analyse des pipelines, permettant ainsi aux équipes de se concentrer sur des tâches à plus forte valeur ajoutée.
De nombreuses entreprises utilisent aujourd’hui les capacités agentiques de Gemini dans BigQuery, notamment la société de technologie financière Julo, qui a exploité la capacité de Gemini à comprendre des structures de données complexes pour automatiser son processus de génération de requêtes. La société informatique japonaise Unerry utilise également les capacités de génération Gemini SQL dans BigQuery pour aider ses équipes chargées des données à fournir des informations plus rapidement.
Mais découvrir, préparer et aider à l’analyse n’était qu’un début. À mesure que les modèles sous-jacents évoluaient, même les opérations de données granulaires – lancées par des startups spécialisées dans leurs domaines respectifs – ont été ciblées par une automatisation plus poussée pilotée par les agents.
Par exemple, AirByte et Fastn ont fait la une des journaux dans la catégorie intégration de données. Le premier a lancé un assistant qui créait des connecteurs de données à partir d’un lien de documentation API en quelques secondes. Parallèlement, cette dernière a amélioré son offre plus large de développement d’applications avec des agents générant des API de niveau entreprise, que ce soit pour lire ou écrire des informations sur n’importe quel sujet, en utilisant simplement une description en langage naturel.
Altimate AI, basée à San Francisco, a pour sa part ciblé différentes opérations de données, notamment la documentation, les tests et les transformations, avec une nouvelle technologie DataMates, qui utilisait l’IA agentique pour extraire le contexte de l’ensemble de la pile de données. Plusieurs autres startups, dont Redbird et RapidCanvas, ont également travaillé dans la même direction, prétendant proposer des agents d’IA capables de gérer jusqu’à 90 % des tâches de données requises dans les pipelines d’IA et d’analyse.
Agents qui alimentent RAG et plus encore
Au-delà des opérations de données à grande échelle, les capacités agents ont également été explorées dans des domaines tels que la génération augmentée par récupération (RAG) et l’automatisation des flux de travail en aval. Par exemple, l’équipe derrière la base de données vectorielles Weaviate a récemment discuté de l’idée d’un RAG agentique, un processus permettant aux agents d’IA d’accéder à un large éventail d’outils — comme la recherche sur le Web, une calculatrice ou une API logicielle (comme Slack/Gmail/CRM) — pour récupérer et valider les données provenant de plusieurs sources pour améliorer l’exactitude des réponses.
De plus, vers la fin de l’année, Snowflake Intelligence est apparu, offrant aux entreprises la possibilité de configurer des agents de données capables d’exploiter non seulement les données de business intelligence stockées dans leur instance Snowflake, mais également les données structurées et non structurées via des outils tiers cloisonnés, tels que comme les transactions de vente dans une base de données, les documents dans des bases de connaissances comme SharePoint et les informations dans des outils de productivité comme Slack, Salesforce et Google Workspace.
Grâce à ce contexte supplémentaire, les agents font apparaître des informations pertinentes en réponse à des questions en langage naturel et prennent des mesures spécifiques autour des informations générées. Par exemple, un utilisateur pourrait demander à son agent de données de saisir les informations obtenues dans un formulaire modifiable et de télécharger le fichier sur son Google Drive. Ils pourraient même être invités à écrire dans les tables Snowflake et à apporter des modifications aux données si nécessaire.
Beaucoup plus à venir
Même si nous n’avons peut-être pas couvert toutes les applications d’agents de données vues ou annoncées cette année, une chose est assez claire : la technologie est là pour rester. À mesure que les modèles d’IA de génération continuent d’évoluer, l’adoption des agents d’IA progressera à plein régime, la plupart des organisations, quel que soit leur secteur ou leur taille, choisissant de déléguer les tâches répétitives à des agents spécialisés. Cela se traduira directement par des gains d’efficacité.
Pour preuve, dans une récente enquête menée par Capgemini auprès de 1 100 responsables technologiques, 82 % des personnes interrogées ont déclaré qu’elles avaient l’intention d’intégrer des agents basés sur l’IA dans leurs piles au cours des trois prochaines années, contre 10 % actuellement. Plus important encore, entre 70 et 75 % des personnes interrogées ont déclaré qu’elles feraient confiance à un agent d’IA pour analyser et synthétiser les données en leur nom, ainsi que pour gérer des tâches telles que la génération et l’amélioration itérative du code.
Ce changement piloté par les agents entraînerait également des changements importants dans le fonctionnement des équipes de données. Actuellement, les résultats des agents ne correspondent pas à ceux de la production, ce qui signifie qu’un humain doit prendre le relais à un moment donné pour affiner le travail en fonction de ses besoins. Cependant, avec quelques progrès supplémentaires au cours des années à venir, cet écart disparaîtra très probablement, offrant aux équipes des agents d’IA qui seraient plus rapides, plus précis et moins sujets aux erreurs habituellement commises par les humains.
Ainsi, pour résumer, les rôles des scientifiques et des analystes de données que nous observons aujourd’hui sont susceptibles de changer, les utilisateurs pouvant éventuellement se déplacer vers le domaine de la surveillance de l’IA (où ils pourraient garder un œil sur les actions de l’IA) ou vers des tâches à plus forte valeur ajoutée que le système. pourrait avoir du mal à performer.