Emile Marzolf Profile picture
Tech Reporter @POLITICOEurope (Paris). Ex @ActeursPublics Membre @AJTransparence. Compte sur pause, je suis là : https://t.co/dR8YJ5VNwr 🩋

Apr 24, 2024, 32 tweets

đŸ€–Je vois que l’IA gĂ©nĂ©rative “Albert” de l’Etat fait beaucoup parler, intĂ©resse et est aussi critiquĂ©e/moquĂ©e. On retrace la genĂšse de ce projet, aujourd’hui testĂ© Ă  petite Ă©chelle auprĂšs d’une soixantaine de conseillers des maisons France Services —

Rappelons les bases : Albert n’est pas un grand modĂšle de langue créé de toutes piĂšces, mais une adaptation de Llama 2 (puis de Mistral), rĂ©entrainĂ©e sur des donnĂ©es administratives, pour en faire un modĂšle plus spĂ©cialisĂ© pour le service public mais toujours trĂšs gĂ©nĂ©raliste.

Par ailleurs, il n'a Ă  voir avec le modĂšle Bert de Google.

Albert, c'est un socle technologique qui permet de dĂ©cliner des LLM sur des cas d‘usages spĂ©cifiques de chaque administration, rééentrainĂ©s ou branchĂ©s sur des bases documentaires (RAG). Pour en faciliter la diffusion dans l'administration.

Cette approche a le mĂ©rite d’amĂ©liorer la fiabilitĂ© des rĂ©ponses et de limiter les hallucinations. Et aussi le mĂ©rite de la “frugalitĂ©â€ : pas besoin d'immenses modĂšles de langue trĂšs gourmands en puissance de calcul, les GPU n'Ă©tant pas donnĂ©s.

Albert est prĂ©sentĂ© comme une “IA souveraine, libre et ouverte”, c’est bien joli mais ça veut dire quoi ? Que l’Etat a repris des modĂšles ouverts, s’est fait la main et dĂ©veloppĂ© toute une couche par-dessus pour utiliser des LLM open source dans le public, quel que soit le LLM.

Ca veut aussi dire que tout est mis sur des infrastructures sécurisées internes. Pas de risque de fuite de données confidentielles chez OpenAI ou chez Microsoft. L'Etat reste néanmoins dépendant des modÚles existants.

Le projet a commencĂ© il y a un an environ, quand la vague ChatGPT avait dĂ©jĂ  bien dĂ©ferlĂ©. Les datascientists de l’Etat ont commencĂ© Ă  jouer avec des LLM ouverts et avec GPT. Puis le projet Albert a pris forme pour construire un socle techno mutualisĂ© et rĂ©utilisable.

En parallĂšle un autre projet fait beaucoup plus de bruit : c’est l'expĂ©rimentation sur la plateforme ServciesPublics+. Le but, c’est de prĂ©-rĂ©diger des rĂ©ponses aux avis laissĂ©s par les usagers sur ce TripAdvisor du service public. Toujours avec la validation de l’agent.

Voyez les rĂ©sultats par vous-mĂȘmes, rien d’extraordinaire, mais c’est le cas d’usage qui veut ça. Ça a le mĂ©rite d’ĂȘtre facile Ă  dĂ©velopper/entraĂźner, de n’utiliser que des donnĂ©es publiques et anonymes, et de tester l’appĂ©tence des agents.
plus.transformation.gouv.fr/experiences/43



Et mine de rien, les rĂ©sultats sont positifs : dĂ©lais de rĂ©ponse rĂ©duits de 19 jours Ă  3,3 jours en moyenne en quelques mois, et satisfaction des usagers supĂ©rieure pour les rĂ©ponses gĂ©nĂ©rĂ©es par IA (de 11 points). L'outil va ĂȘtre ouvert aux 6 000 agents chargĂ©s de rĂ©pondre.

De son cĂŽtĂ©, la DSI de l’Etat continue donc le dĂ©veloppement d’Albert : elle rĂ©entraĂźne des (petits) modĂšles sur des corpus de textes administratifs et construit toute la tuyauterie pour reprendre ces modĂšles et les spĂ©cialiser.

La Dinum travaille surtout avec l'Agence des territoires sur un premier cas d’usage bien dĂ©fini : son utilisation en appui des conseillers des maisons France Services. L’enjeu est d’aider ces conseillers Ă  naviguer dans une masse d’informations - fiables - sur les dĂ©marches.

Albert introduit, et c’est important, la rĂ©fĂ©rence directe aux sources des informations, contrairement Ă  ChatGPT (et Ă  SP+). Ce qui permet de rassurer les conseillers d’une part, et d’aller vĂ©rifier l’info au besoin. Au final, ça en fait un super moteur de recherche.

La Dinum fait donc des ateliers avec les conseillers, embauche une designer pour observer leurs pratiques et voir oĂč est-ce qu’une IA gĂ©nĂ©rative pourrait leur ĂȘtre utile. Une premiĂšre version test est mise Ă  dispo mi-janvier. Ce n’est pas encore une IA conversationnelle.

Une deuxiĂšme version a dĂ©jĂ  Ă©tĂ© mise en ligne mi-avril, justement pour devenir plus conversationnelle, et permettre aux conseillers d’interagir avec le chatbot pour affiner ses rĂ©ponses. La V2 permet aussi de mieux collecter le feedback des agents.

Pour l’heure, la DINUM elle-mĂȘme reconnaĂźt “transpirer” ne serait-ce que pour dĂ©montrer son “impact”. “On gagne quelques minutes ici et lĂ , on amĂ©liore quelques rendez-vous”. Pas de quoi rĂ©volutionner le quotidien des conseillers, Ă  ce stade en tout cas, car tout bouge trĂšs vite.

Rien ne dit que l’outil va rencontrer son public. D’ailleurs, une conseillĂšre FS testeuse dit constater encore des erreurs et inventions, et m’a confiĂ© ne pas y voir d’utilitĂ©, pour elle en tout cas, mais plutĂŽt pour les nouveaux conseillers.

Comme d’habitude, et plus encore que d’habitude, la DINUM prĂŽne donc l’agilitĂ© et l’itĂ©ration : commencer tout petit, tester, amĂ©liorer, tester etc. Pour ĂȘtre sĂ»r de ne pas investir trop d’efforts et d’argent dans un outil inutile ou inutilisable.

Ca tombe bien l’IA gĂ©nĂ©rative s’y prĂȘte bien : facile Ă  tester pour se faire une idĂ©e de l’intĂ©rĂȘt, beaucoup moins pour “industrialiser” un cas d’usage.

Les deux expérimentations SP+ et Albert se sont faites en parallÚle mais pourraient converger : la DITP voudrait faire des tests avec Albert pour voir si les résultats sont équivalents à ceux de Claude et Mistral.

Selon la DINUM, plusieurs dizaines d’administrations se sont dites intĂ©ressĂ©es pour tester son IA, sans prĂ©ciser sur quels cas d’usages. Elle leur met tout Ă  dispo, et propose au besoin un dĂ©veloppement sur-mesure.

Albert va ainsi ĂȘtre ouvert en API pour permettre aux administrations de tester l’IA gĂ©nĂ©rative facilement sur les infrastructures de la DINUM avant d’éventuellement investir. Sans passer par OpenAI et consorts.

Pour l’heure cette infra n’est adaptĂ©e que pour les dĂ©marches exploratoires, pas pour l'industrialisation. A ce niveau rien n’est arbitrĂ© cĂŽtĂ© financements, et c’est d’ailleurs ce qui freine certaines administrations, comme les ImpĂŽts.

Enfin, l’Etat veut lancer un chatbot Albert directement sur l’appli de messagerie Tchap pour le rendre accessible Ă  tous ses agents, et Ă©viter le “Shadow GPT”. Mais lĂ  aussi, il y a 2-3 dĂ©tails Ă  rĂ©gler pour tenir la charge de plusieurs centaines de milliers d’agents...

Concernant les réutilisations d'Albert, rien n'est encore trÚs clair. Je sais juste que la DILA, l'envisage pour ressusciter son projet de chatbot sur le site . L'Assurance retraite aussi pour créer un genre d'assistant RH pour les entreprises.service-public.fr

Pareil pour la DRH de l'Etat, la DGAFP, qui envisage de créer un assistant sur les rÚgles RH, pour faciliter la tùche des gestionnaires de proximité de l'Etat territorial. (Mais pas pour le mettre directement au contact des agents "lambda")

La MSA aussi est intéressée, certaines collectivités aussi, comme Montpellier et Lille.

Ce qu'il faut retenir, c'est qu'entre les grandes annonces gouvernementales et la rĂ©alitĂ© des cas d'usages, il y a encore un gros gap, mĂȘme s'il y en a Ă  peu prĂšs partout. Les administrations naviguent encore Ă  vue et ne savent pas du tout si leurs expĂ©s porteront leurs fruits.

C'est, comme je le disais, l'avantage de l'IA générative : on peut la tester trÚs rapidement, pour pas cher : 100 000 euros ont été investis pour développer l'outil "Albert France Services". Si ça rate, pas bien grave, et l'expertise acquise servira à d'autres expés.

Pour ceux que ça intéresse :
- le code Albert :
- le code Albert Tchap : github.com/etalab-ia/albe

github.com/etalab-ia/albe


Une précision utile : sur la 20aine d'administrations à qui j'ai parler IAG, pratiquement aucune ne compte mettre de chatbots au contact des usagers. Selon elles, c'est parce qu'elles ne veulent pas déshumaniser, mais aussi et surtout parce l'IAG est encore bien trop imparfaite.

Share this Scrolly Tale with your friends.

A Scrolly Tale is a new way to read Twitter threads with a more visually immersive experience.
Discover more beautiful Scrolly Tales like this.

Keep scrolling