Cela fait un an que j’ai lancé mes sites autonomes gérés par des IA. Alors quel bilan un an après, et est-ce que le monde est maintenant complètement sous l’eau de contenu généré en IA ?
1 an après mes faux journalistes ont écrit 7500 articles et mes chefs cuisiniers 2500 recettes. Et ils continuent. Sans intervention.
Je n’ai pas vraiment travaillé sur le référencement mais avec cette masse d’information et la rapidité d’écriture, parfois le contenu est le premier ou le mieux placé en France comme l’a rappelé @TurcanMarie numerama.com/tech/1584908-q…
Par contre cela a donné beaucoup d’idées à la communauté SEO, et certains ont automatisés de nombreux sites. Il y a de plus en d’outils en plus pour aider/créer
Bon au pire ça c’est du contenu qui pollue google, mais il y a des choses qui vont un peu plus loin… ou comment polluer en se faisant passer pour un vrai site ou des vrais sites
Et c'est probablement inarrêtable
Parlons d’un certain Julien. Julien était le roi du SEO en France, mais Julien a dû liquider différentes entreprises et mis beaucoup de personnes dans le pétrin. (à lire , ) journaldunet.com/seo/1526445-ko… 42mag.fr/2024/02/julien…
Mais Julien a eu une super nouvelle idée et reviens avec pleins de site sous une nouvelle entreprise. Mais tout ça cache quelque chose de très intéressant
Des dizaines de sites, tous utilisant de l’IA pour générer des centaines/milliers d’articles en quelques jours, sur tous les sujets possibles, sans aucune éthique, pas de sources, des images en IA ou piqués à droite à gauche, des conseils complètement bidons etc
Vraiment de tous les types...
Les sites « emploient » soit des « this person does not exist » soit des photo stock
Mention spécial à @acermendax qui travaille donc pour un de ces sites ^^
Déjà, en dehors de ces photos de profil, et le nombre d’articles en quelques jours, comment on sait que c’est écrit par de l’IA ? J’ai des petites techniques
Si on utilise GPT4 sans faire trop attention par exemple, il a quelques tics de langages. Notamment le mot « plongez » ou « delve » en anglais. D’ailleurs c’est très visible dans les papiers de recherche depuis 2023 ^^
Donc ici, très simple, ça marche avec quasiment chaque site de Julien Jimenez… « Plongez dans l’univers de Cyril Hanouna ».
Il y en a d’autres, tout ça est « corrigible » quand on s’y connait un peu
(ça marche aussi sur mes sites, un peu moins, j’ai rien fait pour contrer ça en tout cas)
D’où vient ce tic de langage ? La théorie du guardian… ce sont les employés en Afrique qui étaient chargé de « corriger » pour améliorer les réponses du modèles, qui l’auraient insufflés dans le modèle theguardian.com/technology/202…
(en passant utiliser GPT4 pour écrire son abstract semble une bonne idée ^^)
Bref tous ces sites sous bannière « Amanecer Media International SL » sont là pour une seule raison, créer du trafic, sur des recherches « simples » mais aussi sur l’actualité. Par exemple l’agression de shamseddine, D-rating est dans les premiers résultats avec des photos en IA
Les sites mélangent volontairement des sujets sans rapport augmenter le reach, et chaque footer renvoi aux autres (les bonnes techniques à l’ancienne)
(grosse mention au site sciences et démocratie qui mélange article d’actus avec parquet et chaudière, et où l’expert en bricolage écrit surtout des articles de géopolitique)
Quand je parle de milliers d’articles, en gros chaque » journaliste » de D-rating et des autres écrit 200 articles par mois. Beaucoup, mais contrôlé
Certains sites sont des reprises. Par exemple les critiques de Marine était un vrai blog, elle y avait écrit entre 2015 et 2023 environ 400 articles et depuis 5580, en ayant changé de visage, et sur tous les sujets !!!
Comment on gagne ensuite de l’argent ? Les sites sont ensuite remplis de pubs. Même si cela ne crée que peu de valeur, un site coûte tellement peu (quelques centimes par jour) que c’est souvent gagnant, sur la masse
2ème façon, faire du netlinking de ces sites bien référencés (marrant c’était exactement ce qu’il faisait avant). Certains donc des sites référencés en footer sont des vrais sites non IA (ou en tout cas plus « sérieux » car on voit de l'IA aussi, mais autre sujet)
Mais d’autres problèmes, des images d’IA de D rating se retrouvent sur des médias traditionnels… Quels impacts sur la désinformation ?
L’image a été changée mais la recherche « macron flamme olympique » met toujours D-rating en premier… Cela peut donc créer de la désinformation
Il y a quelques mois une petite expérience montrait comment créer des médias entiers de désinformation avec quelques euros
De l’autre côté des médias plus traditionnels commencent à intégrer de l’IA générative dans leurs processus, voir s’appuyer complètement dessus mais de manière éthique comme @arago_fr
@arago_fr Sachant qu'en plus les modèles vont donc commencer à s'entrainer sur des résultats d'autres modèles, et de plus en plus car on aura pas assez de données très bientôt... ça va être un problème technologyreview.com/2022/11/24/106…
@arago_fr Cela sera très complexe à réguler, et on est qu’au début.
Les médias font des chartes, expliquent
Mais pour tous les autres sites... que va faire google...
@granturismo61 Alors je vais m'excuser, je pensais que l'article en parlait un peu plus...
J'en parle souvent mais pas là
Donc désolé
• • •
Missing some Tweet in this thread? You can try to
force a refresh
Pour tout ceux inquiet d'une reconnaissance d'un État Palestinien, rappelez vous qu'en 47 la France avait déjà reconnu le droit à un Etat Arabe Palestinien indépendant par le vote de la résolution 181, rien "d'anormal" mais ce qu'on voit ces derniers jours n'est pas une...
... vraie reconnaissance, en tout cas pas comme il le faudrait. Et c'est même dommage pour les Palestiniens eux-mêmes.
Les derniers pays (UK/Australie...) qui ont communiqué dessus indique tous ne pas aujourd'hui ouvrir de relation diplomatiques avec l'autorité palestinienne...
...sans qu'elle fasse de réformes en profondeur
Notamment le "pay for slay", arrêter la haine dans l'éducation, devenir une vraie démocratie etc.
Pas d'ambassade ou de relations sans conditions...
C'est un peu un piège...
On vit dans une ère de post vérité complète
Que quelqu'un comme elle soit toujours écoutée est délirant, une hallucination collective.
Sur 5 chiffres, 3 sont totalement faux, mais pire ils sont juste irréalistes
Et pourtant les gens l'écoutent...
Le Hamas lui-même indique moins de 50% de femmes et d'enfants dans sa liste de 65000
Et le chiffre de 380 000 est supérieur au nombre d'enfants de 5 ans total dans la bande de Gaza.
Elle ne devrait plus pouvoir parler à l'ONU avec ce type de délires...
J'avais pas envie de "debunk" le rapport des 3 personnes de la commission de l'ONU (dont plusieurs ont déjà été attaqué par leur antisémitisme, même par l'Etat français) car c'est inaudible (personne ne l'a lu) mais on y retrouve exactement les mêmes inepties...
J'en ai debunk des vidéos longues d'Idriss Aberkane ou Raoult
Mais l'interview de thinkerview de Rima Hassan ça prendrait des jours...
C'est fascinant d'approximations et de fake saupoudré de militantisme et quelques vérités
J'ai enfin terminé
Ce qui est étonnant c'est que les extraits que l'on voit tourner ne sont pas les pires... Je vais reprendre quelques points juste pour le montrer mais ça serait contre productif de tout faire tellement rien ne va...
Ce qui me dérange c’est pas qu’elle pense que le CRIF contrôle le ministère de l’intérieur, ou Jésus le palestinien, non ce qui me dérange c’est qu’elle dit n’importe quoi sur des éléments historiques ou des chiffres…
Quelques exemples
Cette « enquête » de radio France n’est malheureusement pas vraiment une enquête, mais il y a un point extrême intéressant qu’un journaliste aurait dû creuser et qui m’a clairement interrogé.
Alors parlons d’une grosse agence et d’une histoire peut-être peu connue ⤵️
(Rappelle : Je ne légitime aucune attaque contre aucun journaliste, ni contre aucun civil, ni pour ses opinions. Par contre lier Aljazeera et certaines de ces personnes au terme « journaliste » me dérange énormément, on y reviendra)
Alors si je vous dis que AP, la plus grosse agence de presse du monde à l’époque, collaborait avec les Nazis est possiblement responsable propagande ? theguardian.com/world/2016/mar…
Et si Luc Julia avait raison, « les IA » se trompent dans 46% des cas ! @MonsieurPhi vous aurait menti ? 😱
(spoiler : oui mais non) ⤵️
J’ai pu croiser Luc Julia il y a quelques années sur un sujet autre que l’IA, dans le cadre du travail quand il était chez Samsung et c’était très différent des sorties publiques, sur des sujets d'objets connectés, qui est comme il le rappelle dans la vidéo, son domaine
Mais la vidéo de @MonsieurPhi est tout à fait réaliste sur le n’importe quoi de ses réponses sur l'IA actuellement
Par contre ça permet de parler de quelques sujets qui peuvent être mal compris
Surréaliste, 2 journaux français @libe et @le_Parisien montrent qu'ils ne comprennent pas comme un modèle de langage fonctionne
Spoiler : ce n'est probablement pas la raison mais surtout l'IA n'en sait rien
Par contre c'est hyper intéressant sur l'usage de la data par l'IA ⤵️
Grok a donc été suspendu brièvement il y a 2 jours.
Les raisons ? On sait pas.
Mais le problème d'un modèle de langage c'est qu'il aime bien parler, alors il a donné toutes sortes de raisons allant du racisme, vidéos nsfw à "l'affaire" Brigitte Macron