היי #פידטק, אני אלכס, "מומחה" לבינה מלאכותית (לא מילים שלי 😂) והמתלהב הראשי מכל מה שבנוי מסיליקון ומקיא טקסט!
כמה מחשבות אחרי יום שהרגיש כמו שנה
אולי עקבתם, אולי לא,
קרו כמה דברים ב 14 במרץ, 2023,
πAI day 2023
ת'רד ארווווך מאוד - רק למשקיעים או משעוממים מאוד, מוזמנים 👇
היום בבום, נפלו עלינו 2 מודלי שפה ענקיים, והכרזה של אחת הענקיות בעולם הטק על זה שהם הולכים להכניס AI בכל מקום, בג'ימייל, באופיס, בכל דבר שרק המשתמשים יבקשו.
רק שבין שלושת ההכרזות (שלדעתי לא סתם קרו באותו יום) הבדל קטן...
גוגל עשו את מה שהיה ברור לכולם שיהיו חייבים לעשות אחרי ההכרזה של מיקרוסופט (וההשקה של bing chat שאגב, היום סיפרו לנו סוף סוף שגם הוא מבוסס על GPT4!).
היה ברור לכולם שגוגל מאחור, במיוחד בתור אלה הוציאו את המאמר שהתחיל הגל הנוכחי של AI,עוד אי שם ב2017!
1/
#2 @AnthropicAI
הוציאו היום את Claude+
זה המודל שמריץ את השדרוגי בינה מלאכותית של Notion, ושאומן על Quora בין היתר.
אחלה חבר'ה, מוצר מהפכני! לפני שבוע כולנו היינו מתלהבים מאוד מקלוד ואומרים כמה הוא עובר את GPT-3 וכו' וכו' anthropic.com/index/introduc…
#3
2/
רק מה, משום מה, היום סאם אלטמן לבש את נעליו הכחולות היום, שם לידו את התיק המוכר בתמונה (עליו בהמשך) ולחץ על submit של הטוויט שהודיע לכולם על שחרור של GPT-4. מודל שלא ברור מה גודלו (הם לא אמרו הפעם)
והנה כמה סיבות לכך שמספר 3 משמעותית יותר מרשים ומראה על קדמה מאשר 1 ואפילו 2.
סיבות שאספתי מהיום, אחרי פוקוס כמעט מלא בנושא. דיברתי עם המודל (הוא עוזר לי פה אגב לכתוב את המסמך הזה, לתקן שגיאות וכו, אבל זה אני, אל תדאגו, נשבע נוו…) דיברתי בספייסס עם מומחים, עברתי עם זכוכית מגדלת על המסמך, הבלוג, הוידאו המעולה שגרג ברוקמן הציג בו יכולות של המודל)
בשביל הפשטות, אפשר להקביל את הזיכרון של המודל לזיכרון של דברים שהמודל התאמן עליהם (זוכרים? כל הטקסט של האינטרנט בערך עד אוגוסט 2022 ) ואת מה שאתם אומרים לו, בתור זכרון לטווח קצר
וזכרון טווח קצר הזה,מעולה לנו האנשים שרוצים שהמודל יזכור את השיחה שלנו, יענה בהתאם לקונטקסט השיחה
6/
עד היום, נתן לנו בערך 4000 מילים של קונטקסט.
עם 32 אלף טוקנים, אפשר לזרוק למודל מאמר שלם של ויקיפידה + כל הלינקים שהוא מוביל אליהם, ועוד ישאר מקום לשאלה שלכם.
7/
הנה ביקשתי מחברינו (אולי ניתן לו שם? ג'יפ? ג'יפט? ג'יפי?) לייצר לנו האנשים, טבלת השוואה ברמת האלפי טוקנים לשם ההמחשה.
אגב, החלון קטנקסט הזה, הוא לא רק לשם השאלה, או זיכרון, זה גם החלון שבו נכנסים כל התשובות של המודל. זה אומר שעכשיו GPT-4 יכול לייצר מאמרים שלמים באורך הגלות בנשימה אחת. מאמרים שלמים שקשורים אחד לשני קונטקסטואלית, רהוטים, בעברית (או בכל שפה דוגרי, הייתה ביכולות בשפות כמו עברית
9/
אז קיבלנו קפיצה של פי 8 ביכולת הזאת. 🤯
והדבר שאותי הכי הרשים, כל כך שאני משוכנע שעברנו איזשהו רוביקון:
מודל מולטי-מודאלי!
אוף, בעברית זה נורא מבלבל, GPT-4 הינו מודל שפה גדול, שמבין יותר מmodality אחד. זה אומר שאתן יכולות לדבר איתו בטקסט וגם ב…. תמונה!
הוא מבין את שניהם, מבין מה כתוב בתמונה, אבל גם את העצמים. למעשה, אני כל כך התרשמתי מהיכולות האלה, שחזרתי על הוידאו, צילמתי את המסך, וניסיתי להבין, עד כמה עמוקה ההבנה החדשה הזו ואני פה: 🤯
11/
בוידאו, @gdb , הקו-פאונדר של OpenAi ניסה לבנות בוט לדיסקורד (אם שתי המילים האלה לא אומרות לכן כלום, זה לא העיקר פה, הוא ניסה לכתוב קוד). מן הסתם שהבוט נכתב ע"י פשוט לשאול את GPT-4 לכתוב לו בוט.
הבוט מדבר עם הAPI של GPT-4 ושולח כיתובים לתמונות שנשלחות בדיסקורד.
12/
גרג עשה צילום מסך,שעליו הדיסקורד של OpenAi, כמו חלונית צ'ט ושלח למודל לבקש כיתוב.
רוצה אני להדגיש כמה דברים מהטקסט הזה ש"סוכם" מהתמונה. דברים שלדעתי לא ראינו כמוהם בעבר, ומהווים קפיצת בדרך משמעותית ב… ובכן עליית המכונות.
המודל יודע לקרוא טקסט מתמונה. יש מודלים אחרים (נפרדים ממודלי שפה) שיודעים לקרוא טקסט
המודל יודע להפריד בין טקסט לקונטקסט שלו. לדוגמא
14/
המודל מבין… UI! משמע, הוא מבין את משמעות הכפורים, ההבדל בין מה טקסט אומר על גבי כפתור, וטקסט שבן אדם כתב. זה… לא היה כזה קודם, אני משוכנע, תנסו לתקן אותי אם תוכלו,
בדמו שהם עשו לNewYork Times, צילם הכתב את המקרר שלו, וביקש לייעץ לארוחה שאפשר להכין מהתוכן של המקרר
היכולת ראייה הזו, ביחד עם היכולת טקסט, משליחות כל כך רחוק, אופן איאיי לא שחררו את היכולת הספציפית הזאת, לא בדמו, לא למפתחים כמוני שמשתמשים בAPI שלהם, אלה רק לחברה אחת.
16/
@BeMyEyes
אפליקציה שבה מצטרפים אנשים רואים, לוידאו צ'ט עם אנשים
עיוורים, מתנדבים לעזור לאנשים העיוורים לחיות את החיים שלהם. מעכשיו, מצטרפים גם "רואים" וירטואליים כמו "ג'יפ" שלנו, שעוזרים לעיוורים לנוע במרחב, להכין אוכל, ואפילו, לגלוש באינטרנט!
17/
ממש בזמן שאני כותב את הבלוג הזה, קיבלתי התרעה מטוויטר, שהגיב לת'רד שלי,בחור בשם בוריס פאוור, אחד החתומים על הרבה מאוד מאמרים של OpenAI, ואומר שגם הם, בעצמם, קצת היו המומים מהיכולות האלה של OpenAi ספציפית בנושא הוויז'ן. (לינקים בתגובה הראשונה)
בקיצור, אפשר לסכם את היום הזה רק בדבר אחד, סיכום של שיחה, בין גרסה של בינג (שגילינו היום שמשתמש גם בג'יפיטי4) לבין ג'טג'יפיטי שהתגמש (ע"י פרופמט שלי אגב!) בשביל להוריד ממנו קצת את מסכת הRLHF של OpenAI :
19/
אם אהבתם את הפוסט הזה, מוזמנים לקרוא פוסטים קדמים ולעקוב אחריי בטוויטר
Ok this is my AI new coding paradigms thread, I'll try to keep this updated with things that were not possible before.
Not only tools (god knows there's tons of those) but actual coding paradigms that show a glimpse of the future.
1/n
First up, we have the incredible "GPT is all you need for backend" which is a hack-a-thon submission, that let's you set up a fake server and it'll just spit out things formatted based on your request. Super cool!
BTW building @shortenai bot, have most of the twitter streaming code copied, now building the prompting pipeline on a @jposhaughnessy nudge.
Better to straight up ask chatGPT to respond with a JSON inside, this way, even if it answers with "as a large...bla bla" it will likely… twitter.com/i/web/status/1…
I just had a great experience with @Tesla Littleton.
Our Model Y stopped heating the car and showed a notification to take it into service.
This + two small kids in a 25F weather, no bueno. I scheduled service via the app and the closest appointment was 5 days away.
/1
But I texted them through the App and asked to make sure they have a loaner (they usually give Uber credits) as I need to prepare for a kid weekend, and see if they can squeeze me in. Louis reached out the next day and said to come in immediately and that a loaner is waiting
/2
The loaner was waiting for me when I arrived, clean and the best part, my profile was synced! Everything, even my Spotify was connected, my phone key unlocked it, it was so cool! (I only had to re-pair bluetooth)
/3
Allright, new feature time!
- /browse will use your serpapi.com token and feed answers back to #chatGPT for fresh new context.
It MAY not work! It's brittle, but when it does, it's super cool!
See examples in thread github.com/altryne/chatGP…
"force" browsing via /browse but then chatGPT can answer additional questions about the new found data
Fighting the good fight, my chat doesn't want to ... use the internet the way I'm trying to ask it by shoving it into a prompt 🤔
I know for a fact it can, I did it before, just... not constantly.
@goodside Ok it seems, asking it to pretend that it's browsing really helps it get out of the "I can't do that MASTER" zone.
Some mild progress on pre-saved data (that search API is too expensive to test on haha)
K progress, we know who played and when and who won.
With the right date!
Lets goooo