[⛳️Recherche] "Dis, tu m'expliques ... ?": l'explicabilité des algorithmes et de l'#IA en quelques questions, articles de recherche et exemples d'application #openalgo#explainability#thread 👇
📍Comment par le contexte: l'explicabilité est de plus en plus présentée comme un objectif, une qualité (attendue) des systèmes algorithmiques, en particulier l'#IA. Or les techniques les plus performantes sont aussi les moins explicables 🤕
🔥 Les sciences sociales ont beaucoup à raconter sur la notion d'explication. L'étude de Tim Miller (2018) souligne l'importance des contrefactuels: on va chercher à expliquer pourquoi le résultat A plutôt que le résultat B ? (explanations are contrastive) arxiv.org/pdf/1706.07269…
🙃 L'autre enseignement est que les explications sont sociales et forcément contextuelles. "Pourquoi cette voiture est-elle rouge ?" peut appeler de multiples réponses, tout aussi valables... L'explication retenue dépendra du contexte 👇
🤘[Commentaire] Comme tous les parents peuvent le constater, la réponse "parce que je te le demande" n'est pas une réponse appropriée à l'enfant qui demande "mais pourquoi je dois ranger ma chambre". Le contexte, toujours :)
📍Passons maintenant aux questions, avec la première: ⭐️POURQUOI ⭐️expliquer ? Le droit à l'explication est parfois reconnu par la loi, cf. RGPD et plus récemment la loi pour une République numérique (pour les algorithmes publics): etalab.github.io/algorithmes-pu…
🧐L'autre question, intiment lié à la première est ⭐️QUOI ⭐️expliquer ? On peut chercher à expliquer un système (vue macro) ou un résultat particulier (micro). On parlera alors d'explication "globale" vs. explication "locale"
Donnons un premier #exemple d'explication globale: les algorithmes de classement. Les sites comment à fournir des explications, par exemple @Booking qui explique que le classement des résultats dépend par ex. de la rapidité de paiement de la commission 😏
😎Et un autre exemple: @HomelidaysFR qui donne des explications assez détaillées sur les données d'entrée: "les critères pris en compte par l'algorithme". Mais rien sur leur pondération, par exemple
🚅 Et un dernier, @ouisncf qui explique ne classer les offres qu'avec un seul critère: l'horaire de départ. Mais bon ... le site ne propose que des offres associés à un seul opérateur ;)
D'autres commencent à explorer des explications locales. Par exemple @Twitter et @Facebook vous proposent une option, "pourquoi je vois ce message ?". Là on m'explique que le post de @AntonioCasilli est mis en avant (entre autres) à cause d'@hubertguillaud et @btincq 👇
Next question: ⭐️ QUAND⭐️expliquer: l'explicabilité (globale ou locale) peut être utile à toutes les étapes, pas uniquement en phase de production. On peut avoir besoin d'expliquer un système à son financeur, par exemple
🔥Corollaire, la question du ⭐️POUR QUI ⭐️expliquer: les "destinataires" de l'explication ne sont pas seulement les utilisateurs d'un système... La société, par exemple peut avoir envie de demander des comptes ;)
😻Pour finir, une série d'exemples qui tournent autour de l'explicabilité et de ceux qui tentent de la mettre en oeuvre pour les systèmes algorithmiques 👇
Les simulateurs permettent aux individus de "jouer" avec un système 👉 Cf. par exemple le simulateur du calcul de la taxe d'habitation développé par @PaclotMetalab.gouv.fr/temoignage-peu…
L'explication peut aussi fournie par l'extérieur, pas uniquement par celui qui opère l'algo 👉 Comment fonctionne l'algorithme de pricing dynamique d'@Uber ? Cf. Le Chen, Mislove & Wilson (2015) ftc.gov/system/files/d… poke @15marches
[Thread🎁] 215 pages 🔥! Le rapport remis ce matin par @ebothorel au Premier ministre dresse un bilan riche et inédit sur la politique publique de la donnée 🙋♂️Je vous propose une visite guidée en moins de 100 tweets #opendata#dig#codesource#ia
Commençons par le périmètre, et il est très large. Conformément à la commande du PM, la mission s’intéresse aussi bien à l’ouverture des données - sous toutes ses formes: #opendata mais pas que - aux codes sources, à l’intelligence artificielle et aux données d’intérêt général
Le rapport est dense. Ceux qui sont pressés liront, à profit, la synthèse (6 pages) et la liste d’une trentaine de recommandations. Cela vous donnera déjà le ton: “notre pays a besoin de davantage d’ouverture, sous toutes ses formes”.
[Carnet de voyage 🐻] Depuis hier, je suis à #Berlin pour rencontrer des acteurs de la data et de l'innovation publique en 🇩🇪 Je vous partage quelques impressions 🙋♂️Suivez le guide ! (1/n)
[1er arrêt] Direction Tempelhof à la rencontre du @citylabberlin hébergé au sein de la Technologie Stiftung Berlin (@TSBBerlin). Un mot d'ambiance: le bâtiment est classé, c'est l'ancien mess des officiers de l'US Air Force qui géraient l'aéroport pendant la guerre froide (2/n)
Là, nous avons rendez-vous avec Tori Boeck (@DoriDykes) qui est chargée de projet #opendata. La Technologie Stiftung Berlin est une équipe d'une 40aine de personnes, indépendante du gouvernement local mais majoritairement financé sur fonds publics (Sénat)
🇪🇺 [A dérouler] Données d'intérêt général: 88% des répondants à la consultation de @EU_Commission sont favorables au principe d'accès à des données détenues par le secteur privé au nom de l'intérêt général. Mais cela masque des positions très différentes. Revue des arguments:
🇬🇧 2 - Pour le gouvernement britannique il est urgent de ne pas légiférer sur les données d'intérêt général, une opposition qui semble plutôt être une exception au niveau européen (data-brexit ?)
🇦🇽 3 - La Norvège est plutôt favorable aux données d'intérêt général, vue comme une extension du domaine des données publiques