OpenAI podaje, że wiedza ChatGPT kończy się 'gdzieś' w 2021 roku, a wiedza GPT-3 'gdzieś' w 2020.
Tylko "gdzieś" to jednak mało konkretna odpowiedź 🤔
Postanowiłem to zbadać.
Wątek 🧵 ↓
Na pierwszy ogień poszedł ChatGPT, ponieważ jest on bardziej gadatliwy.
Niestety, nie można mu zadać pytania o aktualną datę, a pytania na meta-poziomie o zakres danych są niestety zbywane...
Zapytałem więc o losowe wydarzenie z maja 2022 roku, czyli spoza zakresu bazy deklarowanego przez OpenAI.
ChatGPT Twierdzi, że maj 2022 to przyszłość.
Kolejne kroki eksperymentu polegały na schodzenie z datami o 1 miesiąc: kwiecień, marzec, styczeń. Cały czas Twierdził, że to przyszłość.
Dopiero w grudniu 2021 ChatGPT uznał, że to zbyt ogólne pytanie (ale już nie przyszłość!).
Dla pewności zapytałem jeszcze o listopad, czerwiec, kwiecień itp. Odpowiedzi były identyczne.
Gdy miałem już miesiąc, testowałem dni.
Wniosek? Świadomość ChatGPT kończy się teoretycznie 31 grudnia 2021 😎
Druga fala testów wycelowana była w GPT-3. Tutaj już nie było tak łatwo, bo model Davinci-003 często odpowiadał na pytania o wydarzenia, mówiąc po prostu 'nie wiem' 🤷♂️
Eksperymentowałem ze zwiększoną liczbą tokenów, zmienną temperaturą wypowiedzi itp., ale wynik były podobne.
Postanowiłem drastycznie uprościć zapytanie dla GPT-3, czyniąc je prostym pytaniem z ograniczonym zakresem odpowiedzi.
Testowałem różne lata, zarówno idąc od roku 2016 w górę, jak i od 2022 w dół.
Wyniki były dość zaskakujące, bo cały rok 2020 zwracał odpowiedź "przyszłość".
Ta odpowiedź mnie zaskoczyła 🤔
Kilka miesięcy temu??
Eksperymentowałem z miesiącami, jak i dniami miesiąca. Doszedłem do granicznej daty 🎉
Dlaczego granicznej? Bo 10 listopada to przeszłość, ale 11 listopada, to już przyszłość 😃
Nie miałem już ochoty eksperymentować z godzinami...
Można więc uznać, że model Davinci w wersji 003 twierdzi, że posiada świadomość czasu na poziomie 11 listopada 2017 roku.
Niby sprawa jasna, ale nie pokrywa się to z deklaracjami OpenAI.
Do tego ta odpowiedź wszystko miesza:
OK. Mindfuck zaliczony, ponieważ model ma świadomość czasu na poziomie roku 2017, OpenAI mówi o roku 2020 oraz pytanie o datę zwraca 2020, aleee...
Model posiada dostęp do wiedzy z 2021 roku 😃
Ostatecznie nie mam pojęcia, jaki jest realny zakres wiedzy dla GPT-3 🤷♂️
Zakładam, że model jest po prostu systematycznie doszkalany i niezwykle trudno jest określić jego realny zakres.
Bardzo zaciekawiła mnie jednak kwestia samoświadomości modelu, jeśli chodzi o czas.
Ten eksperyment wydał mi się ciekawy, więc postanowiłem się nim tutaj podzielić.
Mówi się, że modele językowe (LLM) dają lepsze wyniki, gdy pozwolimy im "myśleć na głos". Wiemy, że LLM-y słabo radzą sobie z matematyką.
Postanowiłem więc zrobić prosty test...
Matematyczny oczywiście 😈 🧵 ↓
Wybrałem do testu 5 modeli LLM:
- Claude Sonnet 4.5
- Claude Opus 4.6
- LLama 4 Meverick
- GPT-4.1
- Gemini 3 Flash Preview
Tak, mogłem wybrać jeszcze z 5, ale te mnie interesowały :)
Każdy model otrzymał proste matematyczne zadanie do wyliczenia:
2^(5+5)+4*16/2-0.2*50/10
To tylko potęgowanie, dodawanie, odejmowanie, mnożenie i dzielenie.
Brak skomplikowanych operacji matematycznych.
Dodałem tam dla utrudnienia ułamek dziesiętny i nawiasy.
Od wielu lat, co tydzień w piątek wysyłam do dziesiątek tysięcy odbiorców newsletter unknowNews. Obecny zespół "szperaczy" wyszukujących treści składa się z dwóch zatrudnionych osób + z automatu wyławiającego słowa kluczowe z RSS-ów. Na końcu łańcucha jestem ja - czytaj dalej 🧵 ↓
Treści zbierane są przez 6-7 dni, a redagowane przeze mnie w piątki rano.
Wstaję o 5:20 i mniej więcej do 11:00-11:30 tworzę newsletter. To około 5-6 godzin pracy (sam byś to zrobił w godzinę? To zapraszam do współpracy - poważnie!).
Trochę tej pracy jest...
Od około roku nie ma jednak tygodnia, w którym ktoś nie skomentowałby, że newsletter jest generowany w 5 minut przez LLM, opisy są pisane przez AI itp.
Kiedyś już o tym pisałem, ale powoli odechciewa mi się tworzenia czegokolwiek do sieci.
Boty, które próbują włamać się na serwery to dla mnie codzienność, bo w końcu prowadzę hosting serwerów VPS 🤷♂️
Używam prostej metody, aby odsiać pewien promil internetowych agresorów 🧵 ↓
Środowisko Mikrusa () to ponad 10 tysięcy serwerów VPS.
Nie ma szans, aby admini platformy zabezpieczyli każdego z użytkowników, tym bardziej że każdy z nich ma prawa roota i może konfigurować serwer, jak zechce.
Pierwsza linia obrony to klasyka, czyli wycięcie Rosji, Chin i Indii na portach TCP związanych z usługą SSH. To obniżyło liczbę udanych włamań o jakieś 80-90%.
Ale przecież nie tylko z tych krajów przychodzą ataki, a całego świata przecież nie wytniemy — choć można próbować ;)
Wczoraj głośno było o serwisie "Poland Elects" 🇵🇱
Wspominali o nim Make Life Harder, OficjalneZero, Wykop, pojawiły się tysiące wzmianek w social mediach...
Ponad 43 miliony odsłon w godzinach od 20:00 do północy.
Dlaczego o tym piszę? Strona była hostowana na Mikrusie 😎
Czytaj dalej 🧵 ↓
Autorem projektu jest Piotr Deda @PiotrDeda.
Stworzona przez niego strona jest niemal statyczna. Wykonuje co prawda co pewien czas zapytania do zewnętrznego storage w celu odświeżenia prezentowanych danych, ale w praktyce składa się z trzech plików:
HTML+CSS+JS.
Aplikacja została umieszczona początkowo na VPS Mikrus 2.1, a w trakcie wieczoru wyborczego autor zaktualizował VPS-a do wersji 3.0.
Były to odpowiednio parametry:
Mikrus 2.1 = 1GB RAM + 10GB dysku
Mikrus 3.0 = 2GB RAM + 20GB dysku