Jakub Mrugalski 🔥 Profile picture
Jan 8, 2023 15 tweets 4 min read Read on X
OpenAI podaje, że wiedza ChatGPT kończy się 'gdzieś' w 2021 roku, a wiedza GPT-3 'gdzieś' w 2020.

Tylko "gdzieś" to jednak mało konkretna odpowiedź 🤔

Postanowiłem to zbadać.

Wątek 🧵 ↓
Na pierwszy ogień poszedł ChatGPT, ponieważ jest on bardziej gadatliwy.

Niestety, nie można mu zadać pytania o aktualną datę, a pytania na meta-poziomie o zakres danych są niestety zbywane...
Zapytałem więc o losowe wydarzenie z maja 2022 roku, czyli spoza zakresu bazy deklarowanego przez OpenAI.

ChatGPT Twierdzi, że maj 2022 to przyszłość.
Kolejne kroki eksperymentu polegały na schodzenie z datami o 1 miesiąc: kwiecień, marzec, styczeń. Cały czas Twierdził, że to przyszłość.

Dopiero w grudniu 2021 ChatGPT uznał, że to zbyt ogólne pytanie (ale już nie przyszłość!).
Dla pewności zapytałem jeszcze o listopad, czerwiec, kwiecień itp. Odpowiedzi były identyczne.

Gdy miałem już miesiąc, testowałem dni.

Wniosek? Świadomość ChatGPT kończy się teoretycznie 31 grudnia 2021 😎
Druga fala testów wycelowana była w GPT-3. Tutaj już nie było tak łatwo, bo model Davinci-003 często odpowiadał na pytania o wydarzenia, mówiąc po prostu 'nie wiem' 🤷‍♂️

Eksperymentowałem ze zwiększoną liczbą tokenów, zmienną temperaturą wypowiedzi itp., ale wynik były podobne.
Postanowiłem drastycznie uprościć zapytanie dla GPT-3, czyniąc je prostym pytaniem z ograniczonym zakresem odpowiedzi.
Testowałem różne lata, zarówno idąc od roku 2016 w górę, jak i od 2022 w dół.

Wyniki były dość zaskakujące, bo cały rok 2020 zwracał odpowiedź "przyszłość".
Ta odpowiedź mnie zaskoczyła 🤔
Kilka miesięcy temu??
Eksperymentowałem z miesiącami, jak i dniami miesiąca. Doszedłem do granicznej daty 🎉
Dlaczego granicznej? Bo 10 listopada to przeszłość, ale 11 listopada, to już przyszłość 😃

Nie miałem już ochoty eksperymentować z godzinami...
Można więc uznać, że model Davinci w wersji 003 twierdzi, że posiada świadomość czasu na poziomie 11 listopada 2017 roku.

Niby sprawa jasna, ale nie pokrywa się to z deklaracjami OpenAI.

Do tego ta odpowiedź wszystko miesza:
OK. Mindfuck zaliczony, ponieważ model ma świadomość czasu na poziomie roku 2017, OpenAI mówi o roku 2020 oraz pytanie o datę zwraca 2020, aleee...

Model posiada dostęp do wiedzy z 2021 roku 😃
Ostatecznie nie mam pojęcia, jaki jest realny zakres wiedzy dla GPT-3 🤷‍♂️

Zakładam, że model jest po prostu systematycznie doszkalany i niezwykle trudno jest określić jego realny zakres.

Bardzo zaciekawiła mnie jednak kwestia samoświadomości modelu, jeśli chodzi o czas.
Ten eksperyment wydał mi się ciekawy, więc postanowiłem się nim tutaj podzielić.

Podobało się? 🤔

To zalajkuj lub udostępnij wątek ⬇️

• • •

Missing some Tweet in this thread? You can try to force a refresh
 

Keep Current with Jakub Mrugalski 🔥

Jakub Mrugalski 🔥 Profile picture

Stay in touch and get notified when new unrolls are available from this author!

Read all threads

This Thread may be Removed Anytime!

PDF

Twitter may remove this content at anytime! Save it as PDF for later use!

Try unrolling a thread yourself!

how to unroll video
  1. Follow @ThreadReaderApp to mention us!

  2. From a Twitter thread mention us with a keyword "unroll"
@threadreaderapp unroll

Practice here first or read more on our help page!

More from @uwteam

Feb 11
Mówi się, że modele językowe (LLM) dają lepsze wyniki, gdy pozwolimy im "myśleć na głos". Wiemy, że LLM-y słabo radzą sobie z matematyką.

Postanowiłem więc zrobić prosty test...
Matematyczny oczywiście 😈 🧵 ↓ Czy modele językowe "myślą, gdy piszą?"
Wybrałem do testu 5 modeli LLM:
- Claude Sonnet 4.5
- Claude Opus 4.6
- LLama 4 Meverick
- GPT-4.1
- Gemini 3 Flash Preview

Tak, mogłem wybrać jeszcze z 5, ale te mnie interesowały :)
Każdy model otrzymał proste matematyczne zadanie do wyliczenia:

2^(5+5)+4*16/2-0.2*50/10

To tylko potęgowanie, dodawanie, odejmowanie, mnożenie i dzielenie.
Brak skomplikowanych operacji matematycznych.
Dodałem tam dla utrudnienia ułamek dziesiętny i nawiasy.
Read 13 tweets
Jan 23
Od wielu lat, co tydzień w piątek wysyłam do dziesiątek tysięcy odbiorców newsletter unknowNews. Obecny zespół "szperaczy" wyszukujących treści składa się z dwóch zatrudnionych osób + z automatu wyławiającego słowa kluczowe z RSS-ów. Na końcu łańcucha jestem ja - czytaj dalej 🧵 ↓Image
Treści zbierane są przez 6-7 dni, a redagowane przeze mnie w piątki rano.

Wstaję o 5:20 i mniej więcej do 11:00-11:30 tworzę newsletter. To około 5-6 godzin pracy (sam byś to zrobił w godzinę? To zapraszam do współpracy - poważnie!).

Trochę tej pracy jest...
Od około roku nie ma jednak tygodnia, w którym ktoś nie skomentowałby, że newsletter jest generowany w 5 minut przez LLM, opisy są pisane przez AI itp.

Kiedyś już o tym pisałem, ale powoli odechciewa mi się tworzenia czegokolwiek do sieci.
Read 11 tweets
Nov 3, 2025
AI miało sprawdzać zadania domowe 24h/7 i dawać natychmiastowy feedback. Genialny pomysł... który zaczął kosztować ~$300 dziennie 😱

Co poszło niezgodnie z planem? 🧵 ↓ Wspomnienia z optymalizacji - czasy AI_Devs 1.0
Gdy z Adamem Gospodarczykiem ruszaliśmy z pierwszą edycją szkolenia AI Devs, postawiliśmy na automatyczną weryfikację zadań przez LLM.

Kursanci natychmiast dostawali feedback, czy rozwiązanie jest ok.
Nie musieli czekać na człowieka.

To spoko działało przy ~1000 uczestnikach.
Przyszła druga edycja. Dołączył do nas Mateusz Chrobok, a liczba kursantów podskoczyła do prawie 3x. I tutaj zaczęły się schody.

Zadania domowe były naprawdę trudne. Większość osób nie rozwiązywała ich za pierwszym razem, a dopiero po 10-20 próbach.
Read 14 tweets
Oct 7, 2025
Boty, które próbują włamać się na serwery to dla mnie codzienność, bo w końcu prowadzę hosting serwerów VPS 🤷‍♂️

Używam prostej metody, aby odsiać pewien promil internetowych agresorów 🧵 ↓ Jak pozbyć się abuserów atakujących serwery (iptables + ipset)
Środowisko Mikrusa () to ponad 10 tysięcy serwerów VPS.

Nie ma szans, aby admini platformy zabezpieczyli każdego z użytkowników, tym bardziej że każdy z nich ma prawa roota i może konfigurować serwer, jak zechce.

Chcemy jednak blokować intruzów.mikr.us
Pierwsza linia obrony to klasyka, czyli wycięcie Rosji, Chin i Indii na portach TCP związanych z usługą SSH. To obniżyło liczbę udanych włamań o jakieś 80-90%.

Ale przecież nie tylko z tych krajów przychodzą ataki, a całego świata przecież nie wytniemy — choć można próbować ;)
Read 11 tweets
Jun 19, 2025
Od około tygodnia po kilka godzin dziennie tworzę nowy projekt.

Na 18 tysięcy wygenerowanych linii kodu, musiałem interweniować i poprawiać coś ręcznie dosłownie kilkanaście razy.

To taki 'niemal vibe coding' w Cursorze 😉

Kilka wniosków z eksperymentu 🧵 ↓ Statystyki z Cursor AI
Czy taka praca wymaga wiedzy z programowania i tworzenia architektury? TAK i to bardzo dużo.

Pomysły, na które wpada AI, przeważnie są "OK", ale ludziom bym tego nie pokazał...

Wyjaśnienie dokładnie JAK coś należy zrobić, a nie tylko CO należy zrobić działa u mnie lepiej.
Rozwalenie całego projektu jest dziecinnie proste — piszę z doświadczenia 🫣

Skrajnie ważną umiejętnością dla 'vibecodera' jest obsługa GIT-a, bo AI zupełnie nie radzi sobie z cofaniem swoich zmian.

Przeważnie nie używałem GITa pracując bez zespołu.
Teraz to jest must-have.
Read 10 tweets
Jun 2, 2025
Wczoraj głośno było o serwisie "Poland Elects" 🇵🇱
Wspominali o nim Make Life Harder, OficjalneZero, Wykop, pojawiły się tysiące wzmianek w social mediach...

Ponad 43 miliony odsłon w godzinach od 20:00 do północy.
Dlaczego o tym piszę? Strona była hostowana na Mikrusie 😎

Czytaj dalej 🧵 ↓Poland Elcts — serwis hostowany na Mikrusie
Autorem projektu jest Piotr Deda @PiotrDeda.

Stworzona przez niego strona jest niemal statyczna. Wykonuje co prawda co pewien czas zapytania do zewnętrznego storage w celu odświeżenia prezentowanych danych, ale w praktyce składa się z trzech plików:
HTML+CSS+JS.
Aplikacja została umieszczona początkowo na VPS Mikrus 2.1, a w trakcie wieczoru wyborczego autor zaktualizował VPS-a do wersji 3.0.

Były to odpowiednio parametry:
Mikrus 2.1 = 1GB RAM + 10GB dysku
Mikrus 3.0 = 2GB RAM + 20GB dysku
Read 12 tweets

Did Thread Reader help you today?

Support us! We are indie developers!


This site is made by just two indie developers on a laptop doing marketing, support and development! Read more about the story.

Become a Premium Member ($3/month or $30/year) and get exclusive features!

Become Premium

Don't want to be a Premium member but still want to support us?

Make a small donation by buying us coffee ($5) or help with server cost ($10)

Donate via Paypal

Or Donate anonymously using crypto!

Ethereum

0xfe58350B80634f60Fa6Dc149a72b4DFbc17D341E copy

Bitcoin

3ATGMxNzCUFzxpMCHL5sWSt4DVtS8UqXpi copy

Thank you for your support!

Follow Us!

:(