Il y a 5 mois je vous présentais une des premières IA disponible pour le grand public pour créer toutes les images que vous voulez.
En 5 mois, beaucoup de choses ont évolué, aujourd’hui je vais vous présenter #Dreambooth
⬇️⬇️⬇️
On retrouve maintenant un peu de concurrence, d’un côté des acteurs « privés » avec des services en ligne (#dalle2, #Midjourney) de l’autre côté des acteurs « ouverts » comme #StableDiffusion
medium.com/mlearning-ai/d…
L’un des avantages d’une technologie ouverte, c’est qu’elle peut être reprise par des dizaines d’autres chercheurs, améliorées, et c’est ainsi que StableDiffusion grandit aujourd’hui.
github.com/runwayml/stabl…
Simplement toutes ces IA ne répondent pas à un besoin précis : et si j’ai besoin de quelque chose que le modèle ne connait pas ? Une personne inconnu, un objet, un produit que je viens de créer, un style graphique ?
Fin août des ingénieurs de google ont publié un papier de recherche qui permet en entrainant un modèle avec seulement quelques photos, de l’intégrer dans une IA de création plus large. Ainsi est né #Dreambooth
dreambooth.github.io
Le monde magique de l’open source et de la recherche a permis de le porté sur Stable Diffusion assez rapidement, même sans le code du Dreambooth original
github.com/XavierXiao/Dre…
J’ai posté cette mauvaise « photo » qui n’est pas un montage mais qui est en réalité une création originale StableDiffusion à partir d’un modèle Dreambooth que j’ai entrainé pour Raoult et Musk.
J’ai fait exprès de laisser une mauvaise image, la blouse ne va pas du tout, les visages sont bizarres, les mains peu naturelles, le bic est multicolore. Normalement on voit que c’est « faux ». Mais c’est une image qui n’a pas été « montée », mais créée
Voici par contre quelques bien meilleures images du modèle Raoult.
Je précise ces images sont fausses, ce sont des créations directes de l’IA, pas des montages, à but pédagogique
Le Dr Marty n’est pas en reste ! Encore une fois ces photos sont fausses, ce sont des créations directes de l’IA, pas des montages, à but pédagogique
A quoi ça sert ? Par exemple vous pouvez entrainer votre modèle sur un produit que vous vendez pour le mettre en situation ou faire des storyboard. J’ai testé avec mon pot de fleur Totoro. Le voici dans différentes situations
Et en voyage !
On peut même lui appliquer des styles, changer les textures, le dessiner. Ce pot, je rappelle, n’était pas dans le modèle « de base », j’ai pris 30 photos pour entrainer un modèle supplémentaire, en moins d’une heure. Le temps de création d'une image est inférieur à 1 min
Cela marche bien pour refaire votre photo de profil Linkedin (aucune de ces photos de moi n’a été prise, elles sont toutes générées)
Ou plus créatifs
Cela marche même avec votre animal de compagnie (modèle de mon chat)
De lourdes questions éthiques vont arriver à ce sujet, qu’est ce qui est vrai, qu’est ce qui faux. D’ici peu de temps les vidéos seront de cette qualité, la voix également.
Des dizaines de modèles sont déjà partagés, parfois de personnes connues, parfois de style d’artistes (on peut voir cette polémique notamment : 20min.ch/fr/story/les-g… )
Il y a des utilisations... inattendues
#dreambooth
Share this Scrolly Tale with your friends.
A Scrolly Tale is a new way to read Twitter threads with a more visually immersive experience.
Discover more beautiful Scrolly Tales like this.