علی آقو Profile picture
Apr 16, 2023 19 tweets 7 min read Read on X
#رشتوی تمیز و ساده! :)
یه مدل زبانی مثل ChatGPT چطور کار می کنه؟

با شروع سال ۲۰۲۳! تب هوش مصنوعی رفت بالا و خیلی ها حتی بدون اینکه آگاهی داشته باشن که این مدل ها چطور کار می کنن افتادن تو یه چیزی به نام چت بات!

الان میخوام یه سرو گوشی آب بدیم ببینم پشتش چه خبره 👇 Image
یه تاریخچه ریز بریم:‌تحلیلگرا میگن که بازار NLP ( یا پرداز زبان انسانی) از 11 میلیارد دلار (2020) به + 35 میلیارد دلار (2026) میرسه.اندازه مدل و تعداد پارامترهای درگیر نیز زیاده.تو این نمودار میبینید که چطور اندازه مدل های LLM تو چند سال گذشته زیاد شده Image
توضیح LLM یا مدل زبان بزرگ نوعی مدل یادگیری ماشینیه که برای پردازش و تولید متن زبان طبیعی طراحی شده .این مدل‌ها معمولاً مبتنی بر تکنیک‌های یادگیری عمیق هستن و بر روی مقادیر عظیمی از داده‌های متنی آموزش داده میشن تا الگوها و روابط در زبان را یاد بگیرن.
مدل‌های زبان بزرگ را میشه برای انواع وظایف پردازش زبان طبیعی، مانند ترجمه زبان، خلاصه‌سازی متن، پاسخ‌گویی به سؤال و تولید متن استفاده کرد. تا دیروز
GPT-3 (Generative Pre-trained Transformer 3)
قوی ترین مدل بود OpenAI بود که 175 میلیارد پارامتر داشت. حالا GPT4 را ببینید! 🤯 Image
همه اینایه الگوی ساده(قابل فهم)و درعین حال پیچیده ای دارن
ورودی ->پردازش-> خروجی
تصور کنید یک مدل محاسبه گر اون وسطه که بر اساس ورودی داره بهتون خروجی میده و جالبه که جوابی که میده( جملات)دنباله ای از کلماتن که پشت سر هم محاسبه میشن و تولید میشن.عین هدفگیری با تفنگ دوربین داره Image
اگه تو بازی های شوتر دیده باشید شما چند ثانیه زمان میخواید که رو هدفتون فیکس کنید. اینم همین جوری میاد و شروع به تولید زنجیره ای از کلمات می کنه تا به نزدیک ترین جواب برسه و اون جواب نهایی را به شما تحویل میده.
این پست را اگه تا آخرش دوام بیارید متوجه میشید چی به چیه:)
حالا این زنجیره جلمات از کجا میان؟ #شبکه_عصبی
این یک ساختار شبکه ای هست که توش اعداد از یک طرف وارد میشن و بر اساس احتمالات هی جمله ها را سورت می کنند. برای کلمات از LLMs یا Large Language Models استفاده میشه که یه کم روش استفاده اش متفاوته
داخل LLMs ها یک ساختاری استفاده میشه به نام ترانسفورماتور که پتانسیل های بسیار زیادی را به مدل های زبانی میده. در واقع ترانسفورماتور خودش یک مدل یادگیری عمیقه که مکانیسم توجه به خودش را انتخاب می کنه و به طور متفاوت به هر بخش از ورودی (که شامل خروجی بازگشتیه) یه وزن میده. Image
بیاید یه کم ملسموس تر و به طور خاص روی «کلمات» صحبت کنیم.
توی مدلهای زبانی به جای اینکه هر کلمه یه ورودی باشه، میتونیم کلمه ها را به نشانه هایی تقسیم کنیم که می تونن کلمات، زیرکلمه ها، کاراکترها یا نمادها باشن. توجه کنید که تو این ساختار حتی فضاهای بین کلمات هم حسابن!
اما این که بیایم کاملا همه کلمات رو صرفا با اعداد نشونه گذاری( یا همون Tokenize) کنیم و هر وقت مدل مون نیاز به یه چیزی برای پر کردن جمله داشت بریم سراغ کلمات و بکشیمشون بیرون میشه همون مدل های خل و چل قدیمی!
حالا کار جهادی :) یعنی کاری که بچه های OpenAi کردن چی بود؟ این که اومدن از embedding یا سیستم تعبیه گذاری کلمات با معانی مشترک تو یه بردار چند بعدی استفاده کردن.

تو عکس می بینید نسبت و فاصله سگ و گربه نسبت به اتاق و خونه چطوریه! این جایی هست که معنا درگیر میشه Image
حالا فقط نزدیکی کلمات مشابه نیست. Embeddings یه سری مقیاس بندی هم میکنه. مثلا پاپی و سگ و گربه یه فاصله معناداری با هم دارن.
اگه همین تعبیه گذاری را برای جمله سازی استفاده کنیم چی میشه؟ Image
روی این جمله ای که تو تصویر میبینیم چه اتفاقی میفته تو پروسه ما؟

اول ترانسفورماتور میاد ورودی ما را توی این نمودار کد گذاری می کنه.

بعد یه فرایندی به نام ( attention‌)‌ یا توجه میاد و یه مقدار معنای بیشتری ( Context‌) به ساختار ما میده. Image
میخوام Attention را باز کنم. تصور کنید رفتید بانک و میخواید وام بگیرید. اون چیزی که باعث میشه جمله صحیح را انتخاب کنید میشه توجه به کانتکست:
- وام منو بده جیگر
- توله سگ وام منو بده
- اگه مقدوره با وام بنده موافقت کنید
- من وام میخواهم،‌آن را به من اعطا بفرمایید
حالا این embeddings یا تعبیه گذاری گیر این هست همیشه که چه کلمه ای انتخاب کنه بده به شما.
bank of the river ( ساحل رودخانه )
Money in the bank ( پول در بانک )
مثل ما آدما، وقتی قرار هست که یک معنا درک بشه از بانک به سایر قسمت های جمله هم باید توجه بشه. پول و رودخانه مهمن اینجا Image
فرآیند توجه از طریق جمله برای کلماتی که زمینه را برای بانک کلمه فراهم می کنن، به گذشته هم نگاه می کنه

بعد میاد جاسازی را دوباره وزن می کنه تا کلمه بانک از نظر معنایی به کلمه "رودخونه" یا "پول" نزدیکتر بشه. تو عکس میبینید که برای مقایسه هر دو جمله چطور عمل می کنه Image
حالا این یه جمله ساده هست. همین فرایند را چندین ( چند صد) بار تو پردازش های سریع اتفاق میفته تا برسه به یه جمله نسبتا صحیح. بعد این را میندازه تو یه مدل عصبی ( عصبی مثل ایرانی ها نه)‌ تا احتمالات ممکن برای پیوستگی جملات و همچنین صحیح بودن نسبت به تاریخچه استفاده اش مشخص بشه
مثلا روی اون داده Train ( یا تمرین ) داده شده اگه هیچ وقت نتونه : توله سگ من وام میخوام را پیدا کنه، احتمال جواب دادن با این فرمت هم بسیار کم میشه. در واقع مدلهای زبانی یا LLMs برای فهمیدن و تولید یک داده اولیه نیاز دارن که پردازش زبانی درستی پیدا کنند.
این یک توضیح بسیار ساده شده از ChatGPT بود که من بخش های خیلی زیادی از اون را حذف کردم تا قابل فهم برای عوام بشه. توی این لینک کامل تر و بهترش توضیح داده برید بخونید عش کنید

writings.stephenwolfram.com/2023/02/what-i…

• • •

Missing some Tweet in this thread? You can try to force a refresh
 

Keep Current with علی آقو

علی آقو Profile picture

Stay in touch and get notified when new unrolls are available from this author!

Read all threads

This Thread may be Removed Anytime!

PDF

Twitter may remove this content at anytime! Save it as PDF for later use!

Try unrolling a thread yourself!

how to unroll video
  1. Follow @ThreadReaderApp to mention us!

  2. From a Twitter thread mention us with a keyword "unroll"
@threadreaderapp unroll

Practice here first or read more on our help page!

More from @aliagho

Dec 30, 2023
به مناسبت پایان ۲۰۲۳ دوست داشتم به چیز به درد بخور اینجا شیر کنم که ۱۱ جمله کلیدی زندگی فکر می کنم به اندازه یه رشته توییت بتونه مفید باشه

( بعضیاش اونقدر قشنگ هستند که خوراک بکگراند گوشیه)

۱- مهم نیست چقدر ارزشمندی وقتی که جای درستی نباشی 👇 Image
تا به خودت اطمینان نداشته باشی؛ رویا بی رویا Image
نشخوار ذهنی خوشبختیت را نابود می کنه Image
Read 6 tweets
Jun 12, 2023
#رشتو #ریتوییت :)
با یه پرامپت خفن و ساده با ChatGPT شروع می کنیم!

برای اینکه بهترین نتیجه را بتونیم بگیریم خیلی ساده باید از خود حضرت کمک بگیریم... مثلا تصور کنید میخوایم بهترین ماشین موجود با بخریم!
این را باید بنویسیم : دستم بگیر تا بتوانم بیشترین خروجی را از تو بگیرم 👇👇 Image
I'll give you a prompt, and your goal will be to improve it by asking me questions. Once I answer the questions, write the new prompt and ask me new questions. Is it OK? Image
تو متن گفتم که من میخوام یه پرامپت بنویسم و تو از من یه سری سوال کن که بهترین پرامپت را بنویسم . در جواب تو عکس میگه اوکی من سعی می کنم برات پرامت بنویسم. سوالت را بپرس حالا 👇
Read 7 tweets
Jun 12, 2023
به نظر میاد اپل، به جای منفعت کاربر میخواسته بیشتر یه چیز( ٣۵٠٠$x اعضای خانواده) بکنه تو پاچه کاربر! شما ببین چقدر اقتصادی تر و تمیز تر‌میتونست اپل تیوی را با چارتا سنسور به یه محصول انقلابی تبدیل کنه! ولی بجاش باید ۴ تا چیز داشته باشیم 👇👇 ImageImageImage
این یه کانسپت ساده اما بسیار کاربردی است که میتونه قابلیت دستیار‌بودن HomePod، حرکات Vision Pro و tvOS را با FaceTime ترکیب ‌کنه و بجای این همه پردازش و ردیابی الکی چشم‌ها، دست‌ها را ردیابی کنه و با جسچر موس را رو تصویر تکون بده و همه این کارا رو یکجا انجام بده!
مثلا برای انتخاب یا کلیک انگشتان خود را روی هم بزنید. موقع تماشای محتوا، دستتون را بالا بیارید تا کنترل پنل تصویر را ببینید و صدتا جسچر دیگه! همچنین به این معنیه که دیگه نیازی به جنگیدن برای کنترل از راه دور نیست. همه افراد حاضر در اتاق می تونن تلویزیون را کنترل کنن
Read 4 tweets
Apr 16, 2023
#رشتوی کوتاه و غمگنانه 💦

با تو تشنه تر میشیم ای ChatGPT🙁

در حالیکه تو این توییت از توانمندی هاش گفتم و کل اینترنت پر شده از پرامت و کامند ChatGPT بیاید به یه بعد دیگه ماجرا فکر کنیم👇 Image
این همه محاسبه که‌گفتیم چطور اتفاق میفته؟
مثلا ChatGPT 4 هزاران میلیارد پارامتر داره یعنی چی؟
اول که برق فراوون میخواد
پردازنده قوی میخواد که این محاسبات را انجام بده
خنک سازی پردازنده ها هم کولینگ میخواد که باید آب داشته باشه!

فقط همین آب را بریم جلو پشماتون بریزه:
بررسی کردن دیدن ابی که برای خنک کردن مراکز پردازش داده‌های OpenAI و
فقط GPT-3، حدود 185000 گالن آب لازمه.
این مقدار معادل مقدار آب مورد نیاز برای خنک کردن یک راکتور هسته ای است😑
Read 6 tweets
Jun 10, 2022
اگه میخواید بیاید #هلند یه #اصطلاح_اداری ساده هست که خوبه بدونید:
Visa
Residence permit
Work permit
BSN
DigiD
Banking
Dutch citizenship
Dutch passport
Driving license
Pensions & Retirement

تو #رشتو ترجمه و توضیح خلاصه میدم که بهتربتونید کارهاتون را هندل کنید ->
#ویزا شما برای اینکه بتونید توی یک کشوری وارد بشید به ویزا نیاز دارید. براساس کشور مبدا شما احتمالا پروسه ویزای راحت یا سختی دارید. طبیعتا حدس میزنید که به عنوان یه ایرانی چه پاسپورت معتبر و یَکی داریم!
به صورت کلی برای ورود به هلند شما به یکی از این ویزاها نیاز دارید:
ویزای ترانزیت فرودگاهی
اگر در حال انتقال به پروازدیگری در فرودگاه هلند هستید، ممکنه به ویزای ترانزیت فرودگاهی نیازداشته باشید.

ویزای کوتاه مدت
ویزای کوتاه مدت (ویزای شینگن) به شما امکان میده حداکثر 90 روز توی هلند بمونید. علاوه بر هلند، در سایر کشورهای شینگن نیز معتبره ->
Read 20 tweets
Jun 7, 2022
spots4you.com/en/nl/spaces/l…

stoit.nl/en

بعضی هاشون مثل کمرنت ۲۶ تا ۳۶ یورو برای یک ماه باید حق عضویت بدید که بتونید با مالک ارتباط بگیرید که طبیعتا منبع درامد سایت هست. ->
اگه میخواید خونه تمام فرنیش بگیرید این شرکت را هم در نظر بگیرید که خیلی مجموعه بزرگ، معتبر، ارزون و محبوبی برای مهاجرا هست
holland2stay.com
->
Read 11 tweets

Did Thread Reader help you today?

Support us! We are indie developers!


This site is made by just two indie developers on a laptop doing marketing, support and development! Read more about the story.

Become a Premium Member ($3/month or $30/year) and get exclusive features!

Become Premium

Don't want to be a Premium member but still want to support us?

Make a small donation by buying us coffee ($5) or help with server cost ($10)

Donate via Paypal

Or Donate anonymously using crypto!

Ethereum

0xfe58350B80634f60Fa6Dc149a72b4DFbc17D341E copy

Bitcoin

3ATGMxNzCUFzxpMCHL5sWSt4DVtS8UqXpi copy

Thank you for your support!

Follow Us!

:(