Capitaliser sur un patrimoine de 100 millions de document avec l’IA Générative
Quel était le besoin ?
Artelia est un groupe d’ingénierie et de conseil dans les domaines de la construction, des infrastructures, de l’eau, de l’industrie et de l’environnement. Le groupe compte 8 900 salariés pour un chiffre d’affaires de 934M€ en 2022. Opérant à l’international, la société s’appuie sur l’expertise technique, la gestion de projet et l’innovation pour répondre aux défis complexes de ses clients. Dans ce contexte, l’intérêt d’Artelia pour l’intelligence artificielle (IA) générative s’inscrit dans une démarche d’optimisation et d’innovation, en particulier pour la gestion de sa vaste bibliothèque de documents.
Face à la digitalisation croissante et à la complexité des projets d’ingénierie, ARTELIA se trouve confrontée à un défi de taille : la gestion et l’exploitation d’un patrimoine documentaire colossal, s’élevant à plus de 100 millions de documents. Cette immense bibliothèque comprend une variété de formats et de types de données, allant des plans techniques et rapports d’étude à des correspondances et documents administratifs, reflétant la richesse et la complexité des projets menés par le groupe.
La solution d’IA Générative apportée
En l’espace de 5 mois, une interface conversationnelle en langage naturelle (LLM) a été développé par JEMS et SNOWFLAKE. Cet outil permet de questionner le corpus documentaire de manière dynamique et d’obtenir des résultats en temps réel. Le chatbot s’appuie sur des algorithmes de précision qui ont été entraînés spécifiquement pour comprendre et traiter les demandes liées à ces documents non structurés.
L’application pratique de cette technologie a donné lieu à deux cas d’usage principaux
- La recherche instantanée de preuves documentaires, en particulier dans le domaine juridique, où l’accès rapide et précis à des informations spécifiques peut être crucial. Grâce à l’IA générative, les
utilisateurs peuvent retrouver des documents pertinents sans avoir à naviguer manuellement à travers des millions de fichiers. - La génération automatique de nouveaux contenus pour les appels d’offres, en utilisant des modèles entraînés sur des données historiques, telles que les Cahiers des Clauses Techniques Particulières
(CCTP) de projets antérieurs. Cela permet non seulement de gagner du temps dans la création de nouveaux documents mais également d’assurer une certaine cohérence et qualité, en se basant sur des
précédents bien établis.
Ces solutions apportées ont permis d’améliorer significativement l’efficacité et la qualité des processus métiers chez ARTELIA, en exploitant la puissance de l’IA générative pour transformer un corpus documentaire massif et non structuré en une ressource vivante, facilement accessible et exploitable.
Technologies utilisées
- Snowflake : Une plateforme de données cloud qui facilite la gestion, le partage et l’analyse sécurisée des données à grande échelle.
- Streamlit : Un outil qui permet de créer des applications de données en Python rapidement et avec peu de code.
Durée du projet
- 8 mois avec 3 ETP
Missions réalisées
- La réalisation d’un Proof of Value (POV) pour le chatbot basé sur l’IA générative, pour démontrer concrètement les avantages de cette solution avant un déploiement plus large.
- La mise en place d’une architecture Data Centric, centrée sur les données, qui favorise l’intégration, la qualité, et la disponibilité des données pour une utilisation optimale dans les processus décisionnels.
- L’implémentation de deux cas d’usages, qui ont validé l’efficacité de l’approche et l’utilité du chatbot dans les opérations quotidiennes d’ARTELIA.