Discover and read the best of Twitter Threads about #gensim

Most recents (2)

NLP Roadmap 2022 with free resources.
This is what you need to build real-world NLP Projects and a Good Foundation. A Thread 🧵👇
🎯 Text Pre-Processing (Use #spacy):
👉 Tokenization
👉 Lemmatization
👉 Removing Punctuations and Stopwords etc.

🎯 Text Representation Techniques (Feature Engineering):
👉 Bag of Words, Count Vector - #Sklearn
👉 TFIDF - #Sklearn
👉 Word2Vec - #Gensim

Read 18 tweets
1. Hello. Aujourd'hui, je m'attaque à un gros morceau

Les transformers

en particulier la partie self-attention qui en constitue la partie la plus intéressante

Après avoir lu ce thead, j'espère que vous aurez compris les mécanismes en jeu

Ready?

#MachineLearning #DataScience
2. Je vais détailler le fonctionnement des transformers dans le contexte du NLP, qui est le domaine où le premier papier a été publié en 2017 ("Attention is all you need")

A noter que les transformers s'attaquent désormais à d'autres domaines (Vision, Time Series, ...)
3. First things first

Rappelons que dans le NLP, les algorithmes ne comprennent pas "directement" les mots

Il faut que ces mots soient transformés en nombres.

C'est le boulot des algorithmes de "word embedding", qui donc transforment les mots en vecteurs de nombres
Read 37 tweets

Related hashtags

Did Thread Reader help you today?

Support us! We are indie developers!


This site is made by just two indie developers on a laptop doing marketing, support and development! Read more about the story.

Become a Premium Member ($3.00/month or $30.00/year) and get exclusive features!

Become Premium

Too expensive? Make a small donation by buying us coffee ($5) or help with server cost ($10)

Donate via Paypal Become our Patreon

Thank you for your support!