Mappage de données alimenté par l’IA dans MapForce
Les modèles actuels d’IA ont le potentiel d’améliorer les tâches d’intégration de données de nombreuses façons. Quelques-unes des avancées les plus importantes pertinentes au mappage de données et ETL reposent sur des capacités de classification alimentées par l’IA.
Que ce soit la classification des entrées du langage humain naturel ou d’autres données non structurées telles les images et l’audio, les systèmes alimentés par l’IA excellent en ce qui concerne les tâches de catégorisation historiquement défiantes, longues et exposées aux erreurs. Les interfaces IA basées sur les LLM (modèles linguistiques importants) sont capables d’analyser de grandes quantité de données de formation requises pour apprendre les modèles, contextes et nuances complexes du langage requis afin de « comprendre » la parole et le contenu générés par l’homme.
À leur tour, les systèmes IA capables de classifier les entrées dans divers domaines peuvent aider les organisations à apporter une valeur ajoutée à leurs données de manière significative. Ceci s’applique en particulier pour améliorer les données écrites dans une base de données ou d’autres stockages de données au cours de l’intégration de données ou processus ETL, là où les données fournies par l’IA proposent des signaux supplémentaires pour informer la prise de décision professionnelle.
Puisque de nombreux systèmes IA sont disponibles via API, comme OpenAI’s GPT-4, il est immédiatement possible d’intégrer leur fonctionnalité dans les projets de transformation des données dans MapForce.
En utilisant des outils intégrés, no-code pour définir les requêtes de services web dans MapForce, il est facile de définir des appels vers une API, y compris OpenAI API, Azure OpenAI API, AWS AI Services, etc., pour permettre un traitement de données alimenté par l’IA dans tout projet de mappage de données.
Les étapes générales pour configurer une fonctionnalité IA dans MapForce sont comme suit :
Les applications suivantes décrivent les mises en œuvre « real-world » utilisant l’IA pour classifier les données durant ETL ou les processus d’intégration de données.
Automatiser l’analyse de sentiment du langage naturel a toujours été une source d’irritation pour les analystes de données, puisque les machines n’étaient pas dotées de la compréhension nécessaire requise des aspects moins concrets de la parole humaine tels le contexte, le sarcasme, l’ambiguïté et le jargon.
Puisque l’IA a largement surmonté ces limitations, elle peut analyser les données de texte, telles que les commentaires des clients ou les publications des médias sociaux, afin de déterminer le sentiment exprimé dans le texte, à savoir s’il est positif, négatif ou neutre. Cette classification peut aider les entreprises à comprendre le retour des clients, mesurer l’opinion publique, et prendre des décisions pilotées par les données basées sur les résultats de l’analyse de sentiment.
Le projet de mappage de données ci-dessous utilise l’IA pour analyser les enregistrements entrants dans une base de données de prise en charge et détermine automatiquement si une entrée est positive, négative, constitue un rapport de bogue, ou devrait être considérée comme requête de la fonction. Les résultats sont ensuite écrits dans la base de données Retour des clients (Customer Feedback).
Cet article décrit les étapes requises pour construire ce type de fonctionnalité ETL alimentée par l’IA dans MapForce.
Semblable à la classification de texte, la classification d’image alimentée par l’IA a des années-lumière d’avance sur les plus anciennes technologies. Par exemple, dans l’e-commerce, l’IA peut automatiquement catégoriser les images de produits dans différentes catégories ou identifier des objets spécifiques au sein des images. Cette classification peut aider la gestion d’inventaire, l’optimisation de recherche, l’organisation de contenu, etc.
Dans l’exemple de mappage des données ci-dessous, une base de données catalogue de produits est améliorée avec la classification d’image alimentée par l’IA pour ajouter des balises descriptives aux listes de produits. Ceci est particulièrement utile quand le nom du produit est ambigu (par ex., « Mongoose », qui est un vélo) ou qu’il n’y a pas de description.
Le mappage appelle Microsoft Azure Cognitive Services Computer Vision API pour analyser les images de produits et renvoyer une liste de balises qui seront ajoutées à la base de données. Par exemple, lorsque vous analysez l’image du produit appelé Yellow Watermelon – qui s’avère être un leurre de pêche – les balises retournées sont « appât, objet en métal ».
Apprenez comment créer ce projet d’intégration de données en utilisant l’IA pour classifier les images dans cet article.
Les possibilités d’utiliser la classification basée sur l’IA afin d’ajouter de la valeur aux données mappées sont nombreuses. En plus de la classification d’image et de sentiment décrite ci-dessus, les développeurs peuvent utiliser des outils no-code, alimentés par l’IA dans MapForce pour automatiser :
Pour commencer, lisez comment nous avons créé le projet ETL d’analyse de sentiment ou le mappage de données de classification d’image alimentée par l’IA décrit ci-dessus. Vous pouvez tester cette fonctionnalité dans vos projets d’intégration des données quand vous téléchargez un essai entièrement fonctionnel à titre gratuit de MapForce.