Cela fait un an que j’ai lancé mes sites autonomes gérés par des IA. Alors quel bilan un an après, et est-ce que le monde est maintenant complètement sous l’eau de contenu généré en IA ?
1 an après mes faux journalistes ont écrit 7500 articles et mes chefs cuisiniers 2500 recettes. Et ils continuent. Sans intervention.
Je n’ai pas vraiment travaillé sur le référencement mais avec cette masse d’information et la rapidité d’écriture, parfois le contenu est le premier ou le mieux placé en France comme l’a rappelé @TurcanMarie numerama.com/tech/1584908-q…
Par contre cela a donné beaucoup d’idées à la communauté SEO, et certains ont automatisés de nombreux sites. Il y a de plus en d’outils en plus pour aider/créer
Bon au pire ça c’est du contenu qui pollue google, mais il y a des choses qui vont un peu plus loin… ou comment polluer en se faisant passer pour un vrai site ou des vrais sites
Et c'est probablement inarrêtable
Parlons d’un certain Julien. Julien était le roi du SEO en France, mais Julien a dû liquider différentes entreprises et mis beaucoup de personnes dans le pétrin. (à lire , ) journaldunet.com/seo/1526445-ko… 42mag.fr/2024/02/julien…
Mais Julien a eu une super nouvelle idée et reviens avec pleins de site sous une nouvelle entreprise. Mais tout ça cache quelque chose de très intéressant
Des dizaines de sites, tous utilisant de l’IA pour générer des centaines/milliers d’articles en quelques jours, sur tous les sujets possibles, sans aucune éthique, pas de sources, des images en IA ou piqués à droite à gauche, des conseils complètement bidons etc
Vraiment de tous les types...
Les sites « emploient » soit des « this person does not exist » soit des photo stock
Mention spécial à @acermendax qui travaille donc pour un de ces sites ^^
Déjà, en dehors de ces photos de profil, et le nombre d’articles en quelques jours, comment on sait que c’est écrit par de l’IA ? J’ai des petites techniques
Si on utilise GPT4 sans faire trop attention par exemple, il a quelques tics de langages. Notamment le mot « plongez » ou « delve » en anglais. D’ailleurs c’est très visible dans les papiers de recherche depuis 2023 ^^
Donc ici, très simple, ça marche avec quasiment chaque site de Julien Jimenez… « Plongez dans l’univers de Cyril Hanouna ».
Il y en a d’autres, tout ça est « corrigible » quand on s’y connait un peu
(ça marche aussi sur mes sites, un peu moins, j’ai rien fait pour contrer ça en tout cas)
D’où vient ce tic de langage ? La théorie du guardian… ce sont les employés en Afrique qui étaient chargé de « corriger » pour améliorer les réponses du modèles, qui l’auraient insufflés dans le modèle theguardian.com/technology/202…
(en passant utiliser GPT4 pour écrire son abstract semble une bonne idée ^^)
Bref tous ces sites sous bannière « Amanecer Media International SL » sont là pour une seule raison, créer du trafic, sur des recherches « simples » mais aussi sur l’actualité. Par exemple l’agression de shamseddine, D-rating est dans les premiers résultats avec des photos en IA
Les sites mélangent volontairement des sujets sans rapport augmenter le reach, et chaque footer renvoi aux autres (les bonnes techniques à l’ancienne)
(grosse mention au site sciences et démocratie qui mélange article d’actus avec parquet et chaudière, et où l’expert en bricolage écrit surtout des articles de géopolitique)
Quand je parle de milliers d’articles, en gros chaque » journaliste » de D-rating et des autres écrit 200 articles par mois. Beaucoup, mais contrôlé
Certains sites sont des reprises. Par exemple les critiques de Marine était un vrai blog, elle y avait écrit entre 2015 et 2023 environ 400 articles et depuis 5580, en ayant changé de visage, et sur tous les sujets !!!
Comment on gagne ensuite de l’argent ? Les sites sont ensuite remplis de pubs. Même si cela ne crée que peu de valeur, un site coûte tellement peu (quelques centimes par jour) que c’est souvent gagnant, sur la masse
2ème façon, faire du netlinking de ces sites bien référencés (marrant c’était exactement ce qu’il faisait avant). Certains donc des sites référencés en footer sont des vrais sites non IA (ou en tout cas plus « sérieux » car on voit de l'IA aussi, mais autre sujet)
Mais d’autres problèmes, des images d’IA de D rating se retrouvent sur des médias traditionnels… Quels impacts sur la désinformation ?
L’image a été changée mais la recherche « macron flamme olympique » met toujours D-rating en premier… Cela peut donc créer de la désinformation
Il y a quelques mois une petite expérience montrait comment créer des médias entiers de désinformation avec quelques euros
De l’autre côté des médias plus traditionnels commencent à intégrer de l’IA générative dans leurs processus, voir s’appuyer complètement dessus mais de manière éthique comme @arago_fr
@arago_fr Sachant qu'en plus les modèles vont donc commencer à s'entrainer sur des résultats d'autres modèles, et de plus en plus car on aura pas assez de données très bientôt... ça va être un problème technologyreview.com/2022/11/24/106…
@arago_fr Cela sera très complexe à réguler, et on est qu’au début.
Les médias font des chartes, expliquent
Mais pour tous les autres sites... que va faire google...
@granturismo61 Alors je vais m'excuser, je pensais que l'article en parlait un peu plus...
J'en parle souvent mais pas là
Donc désolé
• • •
Missing some Tweet in this thread? You can try to
force a refresh
🧶 Cette semaine il y a donc eu la conférence avec Judith Butler (& friends) sur « l’antisémitisme et son instrumentalisation » 5h de légitimation de l’attaque du 7, l’antisémitisme c’est la faute de du sionisme, on a cité 43 fois génocide, Corbyn en héro etc
Thread avec extraits
Je vous laisse découvrir la raison de ce meeting de 5h, on a évité Corbyn, mais ça n’a jamais été pour parler antisémitisme. Pas une fois ne sera évoqué le fait qu’Israël a le droit d’exister. Non le mal absolu serait son existence même, maux de tous les problèmes des juifs
Il se passe un truc de fou depuis 24h
Il y a quelques jours je lisais pas mal d'article sur les risques pour NVIDIA (fournisseurs de cartes graphiques dont le business principale est maintenant être moteur d'IAs) de devenir comme Cisco en 1999...
Pour rappel, on a "découvert" il y a des années que les cartes graphiques étaient bien meilleures pour être moteur d'IAs (entrainements et inférences) ce qui a poussé les ventes (en plus de la crypto) blogs.nvidia.com/blog/why-gpus-…
C'est ce qui poussé les actions NVIDIA (1700% en 5 ans !)
Mais aujourd'hui, cela peut changer
Pour me dire que l’histoire de Mia est différente, on me renvoi d’autres extraits d’interviews, mals traduits et coupés, alors je suis allez voir les interviews complets, et leurs témoignages et bien pire…
Ce témoignage est celui de Chen Almog Goldestein et Agam, sa fille de 17 ans, daté du 23/12 mako.co.il/news-military/…
L’extrait coupé et mal traduit venant d’une chaine connue pour sa désinformation est disponible ici. Dans cet extrait on a une impression qu’elles ont bien été traités, qu’on leur a même laissé faire du sport. C’est totalement trompeur…
Vu ce que prend Mia Schem depuis 24h alors que son interview vient juste de terminer il y a 30 mins, je vous fait un résumé de l'interview...
L'interview se déroule dans son centre de convalescence, pour sauver son bras
Le 7 octobre, elle a essayé de fuir en voiture avec ses amis. Ils ont croisés des terroristes qui ont tirés sur la voiture jusqu'à l'arrêter.
Sont venus vers elle et on tirés dans son bras qui a "explosé" (son terme).
Elle s'est jetée sur le bas côté, et a fait la morte
Elle est resté comme ça jusqu'à ça se calme un peu, mais comme sa voiture a été mise à feu (oui oui ils ont mis le feu aux voitures), elle avait peur de brûler.
Elle a vu quelqu'un au loin, et elle a crié à l'aide, pensant que c'était un israélien... sauf qu'il a répondu en arabe
Coca a lancé un générateur de cartes de Noël qui s'appuie sur #DALLE3 et #ChatGPT, c'est vraiment pas mal fait, avec de vraies protections mais malgré tout on peut arriver à faire des choses assez... inattendus
Après on peut faire des trucs très cools ou très étranges
J'ai même essayé de récupérer le prompt en lui demandant de l'écrire, pas simple.
A vous d'essayer ! createrealmagic.com
Depuis 30 jour un narratif est créé pour dire que la majorité des morts civils en Israël seraient dû directement à l’armée. Ce matin, une nouvelle théorie est apparue, ce sont des hélicoptères qui ont bombardés le festival.
Bien entendu c’est détourné et faux… ⬇️
En réalité il n’y a pas de « fuites » l’armée de l’air a donné des interview et posté des images du déroulé de la journée
A la chaine 12 (équivalent TF1)
L’interview relate les différentes actions prises la journée. A l’inverse de théorie fumeuses, ils expliquent qu’ils d’abord attaqué, dès qu’ils ont pu les entrées dans le territoire. « Chaque personne qui traverse est considérée un ennemi, on n’a aucune force armée dans gaza »