Discover and read the best of Twitter Threads about #StendhalGPT

Most recents (1)

Depuis 2 semaines je travaille sur une application pour identifier les faux textes générés par #ChatGPT, voit ci StendhalGPT.
Après avoir utilisé le modèle de #GPT-2 (qui est absolument obsolète), je me dois de présenter à #Twitter une piste de solutions avec un petit exemple :
Avant toute chose définissons la méthode :
#GPTZero se sert du hasard pour tenter de mesurer si un texte est généré ou non (perplexity), #StendhalGPT est parti sur la richesses lexicale d'un texte. (Les deux méthodes sont par essence différentes mais ce sera un autre sujet.)
Qu'est-ce que la richesses lexicale ?
C'est tout simple la variété de mots que possède un texte, elle se calcule en divisant le nombre de types (mots uniques) par le nombre de tokens (mots total) dans un texte. Ce qui donne un nombre entre 0 et 1.
Read 12 tweets

Related hashtags

Did Thread Reader help you today?

Support us! We are indie developers!


This site is made by just two indie developers on a laptop doing marketing, support and development! Read more about the story.

Become a Premium Member ($3.00/month or $30.00/year) and get exclusive features!

Become Premium

Too expensive? Make a small donation by buying us coffee ($5) or help with server cost ($10)

Donate via Paypal Become our Patreon

Thank you for your support!