Emile Marzolf Profile picture
Apr 24 ‱ 32 tweets ‱ 6 min read ‱ Read on X
đŸ€–Je vois que l’IA gĂ©nĂ©rative “Albert” de l’Etat fait beaucoup parler, intĂ©resse et est aussi critiquĂ©e/moquĂ©e. On retrace la genĂšse de ce projet, aujourd’hui testĂ© Ă  petite Ă©chelle auprĂšs d’une soixantaine de conseillers des maisons France Services —
Rappelons les bases : Albert n’est pas un grand modĂšle de langue crĂ©Ă© de toutes piĂšces, mais une adaptation de Llama 2 (puis de Mistral), rĂ©entrainĂ©e sur des donnĂ©es administratives, pour en faire un modĂšle plus spĂ©cialisĂ© pour le service public mais toujours trĂšs gĂ©nĂ©raliste.
Par ailleurs, il n'a Ă  voir avec le modĂšle Bert de Google.
Albert, c'est un socle technologique qui permet de dĂ©cliner des LLM sur des cas d‘usages spĂ©cifiques de chaque administration, rĂ©Ă©entrainĂ©s ou branchĂ©s sur des bases documentaires (RAG). Pour en faciliter la diffusion dans l'administration.
Cette approche a le mĂ©rite d’amĂ©liorer la fiabilitĂ© des rĂ©ponses et de limiter les hallucinations. Et aussi le mĂ©rite de la “frugalitĂ©â€ : pas besoin d'immenses modĂšles de langue trĂšs gourmands en puissance de calcul, les GPU n'Ă©tant pas donnĂ©s.
Albert est prĂ©sentĂ© comme une “IA souveraine, libre et ouverte”, c’est bien joli mais ça veut dire quoi ? Que l’Etat a repris des modĂšles ouverts, s’est fait la main et dĂ©veloppĂ© toute une couche par-dessus pour utiliser des LLM open source dans le public, quel que soit le LLM.
Ca veut aussi dire que tout est mis sur des infrastructures sécurisées internes. Pas de risque de fuite de données confidentielles chez OpenAI ou chez Microsoft. L'Etat reste néanmoins dépendant des modÚles existants.
Le projet a commencĂ© il y a un an environ, quand la vague ChatGPT avait dĂ©jĂ  bien dĂ©ferlĂ©. Les datascientists de l’Etat ont commencĂ© Ă  jouer avec des LLM ouverts et avec GPT. Puis le projet Albert a pris forme pour construire un socle techno mutualisĂ© et rĂ©utilisable.
En parallĂšle un autre projet fait beaucoup plus de bruit : c’est l'expĂ©rimentation sur la plateforme ServciesPublics+. Le but, c’est de prĂ©-rĂ©diger des rĂ©ponses aux avis laissĂ©s par les usagers sur ce TripAdvisor du service public. Toujours avec la validation de l’agent.
Voyez les rĂ©sultats par vous-mĂȘmes, rien d’extraordinaire, mais c’est le cas d’usage qui veut ça. Ça a le mĂ©rite d’ĂȘtre facile Ă  dĂ©velopper/entraĂźner, de n’utiliser que des donnĂ©es publiques et anonymes, et de tester l’appĂ©tence des agents.
plus.transformation.gouv.fr/experiences/43



Image
Image
Image
Et mine de rien, les rĂ©sultats sont positifs : dĂ©lais de rĂ©ponse rĂ©duits de 19 jours Ă  3,3 jours en moyenne en quelques mois, et satisfaction des usagers supĂ©rieure pour les rĂ©ponses gĂ©nĂ©rĂ©es par IA (de 11 points). L'outil va ĂȘtre ouvert aux 6 000 agents chargĂ©s de rĂ©pondre.
De son cĂŽtĂ©, la DSI de l’Etat continue donc le dĂ©veloppement d’Albert : elle rĂ©entraĂźne des (petits) modĂšles sur des corpus de textes administratifs et construit toute la tuyauterie pour reprendre ces modĂšles et les spĂ©cialiser.
La Dinum travaille surtout avec l'Agence des territoires sur un premier cas d’usage bien dĂ©fini : son utilisation en appui des conseillers des maisons France Services. L’enjeu est d’aider ces conseillers Ă  naviguer dans une masse d’informations - fiables - sur les dĂ©marches.
Albert introduit, et c’est important, la rĂ©fĂ©rence directe aux sources des informations, contrairement Ă  ChatGPT (et Ă  SP+). Ce qui permet de rassurer les conseillers d’une part, et d’aller vĂ©rifier l’info au besoin. Au final, ça en fait un super moteur de recherche.
La Dinum fait donc des ateliers avec les conseillers, embauche une designer pour observer leurs pratiques et voir oĂč est-ce qu’une IA gĂ©nĂ©rative pourrait leur ĂȘtre utile. Une premiĂšre version test est mise Ă  dispo mi-janvier. Ce n’est pas encore une IA conversationnelle.
Une deuxiĂšme version a dĂ©jĂ  Ă©tĂ© mise en ligne mi-avril, justement pour devenir plus conversationnelle, et permettre aux conseillers d’interagir avec le chatbot pour affiner ses rĂ©ponses. La V2 permet aussi de mieux collecter le feedback des agents.
Pour l’heure, la DINUM elle-mĂȘme reconnaĂźt “transpirer” ne serait-ce que pour dĂ©montrer son “impact”. “On gagne quelques minutes ici et lĂ , on amĂ©liore quelques rendez-vous”. Pas de quoi rĂ©volutionner le quotidien des conseillers, Ă  ce stade en tout cas, car tout bouge trĂšs vite.
Rien ne dit que l’outil va rencontrer son public. D’ailleurs, une conseillĂšre FS testeuse dit constater encore des erreurs et inventions, et m’a confiĂ© ne pas y voir d’utilitĂ©, pour elle en tout cas, mais plutĂŽt pour les nouveaux conseillers.
Comme d’habitude, et plus encore que d’habitude, la DINUM prĂŽne donc l’agilitĂ© et l’itĂ©ration : commencer tout petit, tester, amĂ©liorer, tester etc. Pour ĂȘtre sĂ»r de ne pas investir trop d’efforts et d’argent dans un outil inutile ou inutilisable.
Ca tombe bien l’IA gĂ©nĂ©rative s’y prĂȘte bien : facile Ă  tester pour se faire une idĂ©e de l’intĂ©rĂȘt, beaucoup moins pour “industrialiser” un cas d’usage.
Les deux expérimentations SP+ et Albert se sont faites en parallÚle mais pourraient converger : la DITP voudrait faire des tests avec Albert pour voir si les résultats sont équivalents à ceux de Claude et Mistral.
Selon la DINUM, plusieurs dizaines d’administrations se sont dites intĂ©ressĂ©es pour tester son IA, sans prĂ©ciser sur quels cas d’usages. Elle leur met tout Ă  dispo, et propose au besoin un dĂ©veloppement sur-mesure.
Albert va ainsi ĂȘtre ouvert en API pour permettre aux administrations de tester l’IA gĂ©nĂ©rative facilement sur les infrastructures de la DINUM avant d’éventuellement investir. Sans passer par OpenAI et consorts.
Pour l’heure cette infra n’est adaptĂ©e que pour les dĂ©marches exploratoires, pas pour l'industrialisation. A ce niveau rien n’est arbitrĂ© cĂŽtĂ© financements, et c’est d’ailleurs ce qui freine certaines administrations, comme les ImpĂŽts.
Enfin, l’Etat veut lancer un chatbot Albert directement sur l’appli de messagerie Tchap pour le rendre accessible Ă  tous ses agents, et Ă©viter le “Shadow GPT”. Mais lĂ  aussi, il y a 2-3 dĂ©tails Ă  rĂ©gler pour tenir la charge de plusieurs centaines de milliers d’agents...
Concernant les réutilisations d'Albert, rien n'est encore trÚs clair. Je sais juste que la DILA, l'envisage pour ressusciter son projet de chatbot sur le site . L'Assurance retraite aussi pour créer un genre d'assistant RH pour les entreprises.service-public.fr
Pareil pour la DRH de l'Etat, la DGAFP, qui envisage de créer un assistant sur les rÚgles RH, pour faciliter la tùche des gestionnaires de proximité de l'Etat territorial. (Mais pas pour le mettre directement au contact des agents "lambda")
La MSA aussi est intéressée, certaines collectivités aussi, comme Montpellier et Lille.
Ce qu'il faut retenir, c'est qu'entre les grandes annonces gouvernementales et la rĂ©alitĂ© des cas d'usages, il y a encore un gros gap, mĂȘme s'il y en a Ă  peu prĂšs partout. Les administrations naviguent encore Ă  vue et ne savent pas du tout si leurs expĂ©s porteront leurs fruits.
C'est, comme je le disais, l'avantage de l'IA générative : on peut la tester trÚs rapidement, pour pas cher : 100 000 euros ont été investis pour développer l'outil "Albert France Services". Si ça rate, pas bien grave, et l'expertise acquise servira à d'autres expés.
Pour ceux que ça intéresse :
- le code Albert :
- le code Albert Tchap : github.com/etalab-ia/albe

github.com/etalab-ia/albe

Une précision utile : sur la 20aine d'administrations à qui j'ai parler IAG, pratiquement aucune ne compte mettre de chatbots au contact des usagers. Selon elles, c'est parce qu'elles ne veulent pas déshumaniser, mais aussi et surtout parce l'IAG est encore bien trop imparfaite.

‱ ‱ ‱

Missing some Tweet in this thread? You can try to force a refresh
 

Keep Current with Emile Marzolf

Emile Marzolf Profile picture

Stay in touch and get notified when new unrolls are available from this author!

Read all threads

This Thread may be Removed Anytime!

PDF

Twitter may remove this content at anytime! Save it as PDF for later use!

Try unrolling a thread yourself!

how to unroll video
  1. Follow @ThreadReaderApp to mention us!

  2. From a Twitter thread mention us with a keyword "unroll"
@threadreaderapp unroll

Practice here first or read more on our help page!

More from @emile_marzolf

Aug 17, 2022
Retour de congĂ©s oblige : petit rattrapage de l’actu du numĂ©rique public de l’étĂ©. On commence par les nominations de conseillers ministĂ©riels “numĂ©riqueâ€đŸ§”:
Chez le ministre dĂ©lĂ©guĂ© au numĂ©rique, Jean-NoĂ«l Barrot, tout d’abord, 6 nominations dans son cabinet dirigĂ© par Renaud Vedel (ex-Monsieur IA de l’Etat) :
Ils rejoignent donc :
- Mélanie Przyrowski (ex-DGE) : conseillÚre télécoms
- Hugo Levy-Heidmann (ex-Bercy) : conseiller économie numérique et financement innovation
- Baltis MĂ©janĂšs (ex-cheffe de cab d’Adrien Taquet et collab d’Olivia GrĂ©goire) : cheffe de cabinet.
Read 24 tweets
Apr 25, 2022
Publication de la liste des autoritĂ©s administratives indĂ©pendantes pouvant solliciter l'appui des experts en donnĂ©es et algos du PEREN, le pĂŽle d'expertise de la rĂ©gulation numĂ©rique. L'arrĂȘtĂ© dĂ©crit aussi les mĂ©thodes de collecte de donnĂ©es. legifrance.gouv.fr/jorf/id/JORFTE

Le décret (pardon) liste donc les AAI pouvant demander un appui du Peren :
Dans le cadre de ses missions d'audit, le PEREN est autorisé à collecter des données en accÚs libre sur les plateformes, qu'il doit informer au préalable :
Read 4 tweets
Apr 28, 2021
Dans une circulaire, le Premier ministre demande aux ministres de “s’impliquer personnellement” pour faire de la politique de la donnĂ©e, des algorithmes, et des codes sources “une prioritĂ© stratĂ©gique de l’État”.
acteurspublics.fr/articles/une-n

Des indicateurs de pilotage seront mis en place pour Ă©valuer la bonne mise en Ɠuvre de cet engagement par les directeurs d’administrations centrales et dĂ©concentrĂ©es.
Jean Castex dit vouloir porter “une ambition renouvelĂ©e en matiĂšre d’exploitation, d’ouverture et de circulation des donnĂ©es, des algorithmes et des codes sources publics au profit des usagers, des chercheurs, des innovateurs et de l’ensemble de nos concitoyens”.
Read 10 tweets
Apr 28, 2021
🔮Le Premier ministre a signĂ© hier la circulaire sur la "politique publique de la donnĂ©e, des algorithmes et des codes sources" faisant suite aux recommandations du rapport Bothorel. Stay tuned !
Petit teasing : "L’annĂ©e 2021 doit poser les fondements d’une politique ambitieuse de la donnĂ©e, des algorithmes et des codes sources dans chacun de vos ministĂšres", Ă©crit Jean Castex aux membres du gouvernement et aux prĂ©fets de rĂ©gion.
DeuxiĂšme teasing : "La politique de la donnĂ©e doit constituer une prioritĂ© stratĂ©gique de l’État dans ses relations avec tous ses partenaires, notamment les collectivitĂ©s territoriales et les acteurs privĂ©s"
Read 4 tweets
Apr 26, 2021
Le dĂ©tail de la mission confiĂ©e au dĂ©putĂ© Jean-Michel Mis sur l'usage des technologies dans le domaine de la sĂ©curitĂ©, des drones Ă  l’analyse automatisĂ©e des donnĂ©es. Tout en en limitant "le caractĂšre intrusif".
acteurspublics.fr/nomination/le-

Le Premier ministre demande au député de réfléchir aux "opportunités" qui s'offrent à l'Etat dans l'usage des nouvelles technologies (analyse de données, d'images, drones...) et à définir le cadre pour "préserver les libertés individuelles et publiques".
"La mission indiquera si les moyens de contrÎle actuels lui paraissent suffisants, ou s'il conviendrait d'en mettre en place de nouveaux pour accompagner le développement des usages"
Read 6 tweets
Jun 23, 2020
Point d'Ă©tape #StopCovid par CĂ©dric O : c'est parti !—
Interviendront le secrĂ©taire d'Etat, les directeurs de l'Anssi et de l'Inria, ainsi que le directeur gĂ©nĂ©ral adjoint de la SantĂ©, une directrice de recherches Ă  l’Inserm, et un Ă©pidĂ©miologiste de l'Institut Pasteur.
"Cet outil n’est pas magique, nous avons toujours pris garde de rejeter toute forme de solutionnisme technologique en la a matiĂšre, et il est important de comprendre qu’il s’inscrit dans une stratĂ©gie sanitaire globale ".
"Si je devais avoir un regret, c’est l’absence d'interopĂ©rabilitĂ© europĂ©enne" (et non pas le fait d'avoir su dĂ©velopper une appli "souveraine" avant "tous les autres")
Read 18 tweets

Did Thread Reader help you today?

Support us! We are indie developers!


This site is made by just two indie developers on a laptop doing marketing, support and development! Read more about the story.

Become a Premium Member ($3/month or $30/year) and get exclusive features!

Become Premium

Don't want to be a Premium member but still want to support us?

Make a small donation by buying us coffee ($5) or help with server cost ($10)

Donate via Paypal

Or Donate anonymously using crypto!

Ethereum

0xfe58350B80634f60Fa6Dc149a72b4DFbc17D341E copy

Bitcoin

3ATGMxNzCUFzxpMCHL5sWSt4DVtS8UqXpi copy

Thank you for your support!

Follow Us!

:(