Les resultats sont très intéressants.
Certain d'entre vous ont reconnu la référence a la situation réelle, mais je pense que la plupart ont malgré tout sincèrement répondu a l'énoncé exacte.
Mon dessin était pourtant très ressemblant. 😁
Il me semble en effet que ce n'est pas une question de "confiance" ou de "crédibilité",
10 essais c'est vraiment peu.
Si ca se trouve les autres machines font beaucoup mieux.
Il faut bien sur évaluer TOUTES les machines pour pouvoir choisir.
⮞ Les Bandits a plusieurs bras.
fr.wikipedia.org/wiki/Bandit_ma…
C'est un dilemme de type exploration / exploitation
Il y a énormément d’applications concrètes.C'est exactement le probleme qui correspond au projet de recherche Discovery
⚠️ (C'est ce tweet le plus important du thread !)
Les stratégies que j'ai proposée se sont donc limitées a une étape d'exploration puis une étape d'exploitation.
72% des twittos ont bien compris que il faut une grosse phase d'exploration.
@le_science4all fait des calculs ici :
Ils développent aussi pleins de variantes interessantes du probleme.
arxiv.org/pdf/1904.07272…
En particulier les algorythmes de type UCB.
researchers.lille.inria.fr/~munos/master-…
⚠️ pour les matheux !
le secret de la performance est d'introduire exprès un biais dans le choix de la machine suivante (une sorte de paramètre un peu aléatoire)
Ça devrait faire réfléchir les sceptiques bornés qui chassent les biais systématiquement partout où ils se trouvent. 😄
Ça consiste pas a choisir la machine qui a la meilleur crédence, mais de tirer au sort la machine, selon des probabilités proportionnelles aux crédences.
🤩📈