Kilka lat temu we Wrocławiu działała Vozilla, wypożyczalnia samochodów elektrycznych na minuty. Zbankrutowała. Wiedziałem, że to nastąpi, bo od pierwszego dnia działalności śledziłem na bieżąco jej przychody. Oto długi wątek o algorytmicznym białym wywiadzie
Na samym początku zastrzeżenie - była to działalność w pełni legalna. Nie miałem żadnego kreta wewnątrz organizacji, nie naruszałem żadnych przepisów. Byłem po prostu ciekawskim klientem potrafiącym z kąkutery. Oto część pierwsza wątku pt. "Jak to robiłem"
Wypożyczenia w sieci Vozilla były realizowane przez aplikację na smartfony. W aplikacji użytkownik miał do dyspozycji mapę prezentującą lokalizację pojazdów dostępnych do wypożyczenia. Gdy ktoś inny wypożyczył auto, znikało ono z mapy. Gdy zakończył przejazd - auto pojawiało się.
Współrzędne wszystkich dostępnych pojazdów pochodziły z pliku w formacie JSON, który można było pobierać także spoza aplikacji. Nastawiłem więc automat, który pobierał i zapisywał ten plik co minutę. Przez rok, osiem miesięcy i 26 dni. To jakieś 900.000 plików.
Co można wyczytać z takiego zestawu? Spójrzmy na losy pojedynczego auta. Auto znika z mapy i kilkanaście/kilkadziesiąt minut później ponownie pojawia się z niższym stanem baterii? Właśnie zaobserwowaliśmy wypożyczenie! Możemy oszacować przychód wypożyczalni,
nie przekroczy on czasu wypożyczenia pomnożonego przez stawkę minutową. Auto znika na dłużej a stan baterii skokowo rośnie? Właśnie zaobserwowaliśmy jego ładowanie. Gdy ogarniemy spojrzeniem całą flotę, będziemy wiedzieć, ile osób zajmowało się zwożeniem aut do ładowania
oraz ile energii elektrycznej zużywano podczas tego procesu. Wiadomo też, ile wynosi rynkowa cena leasingu jednego Nissana Leaf (Vozilla miała ich 190). Mogłem oszacować górną granicę przychodów i dolną granicę kosztów. Niestety, ten biznes się nie spinał.
Część druga wątku pt. "Czego jeszcze można dowiedzieć się, gdy przez wiele miesięcy gapisz się na mapę wypożyczalni elektryków". Otóż - informacje ukryte w zgromadzonych przeze mnie danych były naprawdę ciekawe.
Sprawdziłem, jak temperatura otoczenia wpływa na zasięg w kilometrach raportowany przez samochody. Widać wyraźnie, że zimą jest on znacząco niższy
Określiłem średni dobowy czas wypożyczania w minutach na jedno auto floty (w pierwszych tygodniach była to setka aut, potem ich liczba rosła)
Godziny szczytu w wypożyczalni Vozilla
Rozkład czasu trwania pojedynczego wypożyczenia
Stan baterii samochodów wycofywanych do naładowania i przywracanych do wypożyczania
Sprawdzałem także, ile samochodów jest trwale unieruchomionych i to, czy kiedyś wróciły do służby
Wnioski z pierwszych kilku miesięcy obserwacji trafiły do 40-stronicowego raportu opublikowanego przez mojego ówczesnego pracodawcę, PGS Software, który sponsorował prace: informatykzakladowy.pl/wp-content/upl…
Czas na część trzecią wątku czyli: "Jak mogę nauczyć cię przeprowadzania takich analiz". Na pytanie "jak" odpowiadam: skutecznie! Tylko do najbliższego piątku trwa sprzedaż mojego flagowego Szkolenia z automatyzacji pobierania danych z internetu ()scrapowanie.pl
Bardzo dużą część zgromadzonej tam wiedzy wyniosłem właśnie z wielotygodniowych prac nad raportem o Vozilli.
Na szkolenie składa się
📼 10 godzin nagrań wideo
🖼️ 305 slajdów podzielonych na 15 rozdziałów
💰 dwie zniżki-niespodzianki
🎙️ jeden wywiad z radcą prawnym
Zakres Szkolenia jest taki, jak na slajdach poniżej - skupiamy się na pozyskaniu danych ze źródeł internetowych oraz ogarnięciu strategii ich składowania i wstępnego przetworzenia.
Oto skrócony spis treści, jego rozwinięcie znajdziecie na stronie . Poniżej zwrócę uwagę na kilka elementów, które stanowią o unikalności szkolenia i potwierdzają, że zawarłem tam mnóstwo wiedzy wynikającej z praktyki, nie teorii! scrapowanie.pl
W rozdziale drugim nie próbuję udawać, że znam się na prawie, tylko przez 20 minut wypytuję o legalność scrapowania radcę prawnego Mirelę Perczak
W rozdziale trzecim przypominam podstawy protokołu HTTP, ale wskazuję też że prosty timeout to tak naprawdę sześć lub siedem osobnych scenariuszy. Przy odpowiednio dużej skali doświadczysz każdej z tych sytuacji.
Czasem nie mogę się powstrzymać i przemycam trochę wiedzy niepotrzebnej, ale bardzo ciekawej!
Yo Dawg, lubisz format JSON? Możesz go lubić mniej, gdy się dowiesz, że pośród kilkudziesięciu parserów JSON nie ma dwóch jednakowo traktujących przypadki brzegowe
Przykładów pt. "ja tak zrobiłem i żałowałem" jest w szkoleniu więcej
No elo
Potraficie z głowy powiedzieć, jak działają prefiksy kluczy w S3 i jaki mają wpływ na wydajność operacji? Jeśli jest to dla ciebie "znana niewiadoma", poradzisz sobie. Jeśli jest to "nieznana niewiadoma", możesz nie rozumieć, dlaczego nagle chmura AWS jest tak wolna.
To prawie tak proste, jak rzucanie palenia.
Wspominałem, że są przykłady z życia...
... oraz analiz na blogu Informatyk Zakładowy?
Nie waham się odsyłać do najlepszych edukatorów jacy są! @KacperSzurek!
@KacperSzurek Wracając do tematu - po przerobieniu Szkolenia z automatyzacji pobierania danych z internetu będziesz w stanie samodzielnie przeprowadzać operacje pobierania, organizacji, składowania i wstępnej obróbki dużych oraz małych zestawów danych.
@KacperSzurek Vozilla to tylko jeden przykład - scrapowałem też przez prawie dwa lata Traficara. Zgromadziłem milion plików i miliard punktów danych, przepuściłem przez algorytmy uczenia maszynowego i dowiedziałem się, jaki wpływ na utylizację floty ma sezonowa zmienność
@KacperSzurek wynikająca z trendów długoterminowych, wakacji i świąt, dni tygodnia, czy pory dnia (w weekendy i dni robocze). Tę analizę możecie przeczytać po angielsku tutaj: xebia.com/blog/machine-l…
@KacperSzurek Jeśli Szkolenie cię zainteresowało, ale nie masz pewności, czy będzie ci odpowiadał styl narracji albo poziom zaawansowania - daję gwarancję satysfakcji! Przez dwa tygodnie od zakupu możesz dokonać bezwarunkowego zwrotu. Możesz nawet przerobić całe szkolenie!
@KacperSzurek Jeśli dojdziesz do wniosku, że nie były to dobrze wydane pieniądze, wystarczy jeden mail a ja koryguję fakturę do zera i zwracam Ci całą kasę.
@KacperSzurek No i tak wygląda cały ten biały wywiad. Nieźle, nie? Wpatrujemy się w mapę a w efekcie wiemy, ilu pracowników zajmuje się obsługą floty i ile przychodu przynosi każde auto. Jeśli chcesz tak umieć, to wiesz, gdzie kliknąć.
@KacperSzurek A sama Vozilla? Nigdy nie osiągnęła rentowności, zaś gwoździem do trumny była pandemia COVID. Działalność wypożyczalni zakończyła się 30 kwietnia 2020.
Czy opisywałem, jak kilka lat temu *prawie* dałem się nabrać na wycelowany indywidualnie we mnie phishing? Oczywiście, że nie - bo nie chciałem dawać adwersarzowi broni do ręki i informować, co zrobił dobrze, a gdzie się potknął. Jeśli jednak potrzebujecie
dowodu, że absolutnie każdego da się oszukać, oto on: Troy Hunt, autor serwisu , zmęczony i niewyspany po długiej podróży, nie zauważył phishingu podszywającego się pod Mailchimp i podał oszustom dane logowania dohaveibeenpwned.com
swojego konta, wraz z jednorazowym hasłem OTP (to sześciocyfrowe, z apki Authenticator). Minutę później lista subskrybentów jego newslettera była już wykradziona. Jeśli ktoś nie zna nazwiska - to człowiek, który od dziesięciu lat gromadzi dane z wycieków haseł
A teraz napiszę wam o tym, jak wygląda huśtawka emocjonalna twórcy internetowego. Poniedziałek, godzina 17:00 - mój produkt jest zajeb*sty. Poniedziałek, godzina 18:00 - mój produkt to g*wno. Napiszę wątek, jeśli obiecacie, że nie będziecie się śmiali. 🧵👇
Stali czytelnicy wiedzą, że na łamach bloga regularnie dzielę się informacjami o przychodach, kosztach, rozkminach związanych z pisaniem tekstów, tworzeniem szkoleń, działalności w social mediach i wszystkim innym. Raz lub dwa razy w roku pokazuję blog od zaplecza.
Wiem, jak bardzo sam szukałem takich informacji u innych, gdy sam zaczynałem. Pudelkowe doniesienia o tym, ile zarabiają influencerzy czy youtuberzy, nijak nie przystają do tego, ile i na czym można zarobić w różnorakich niszach. Tym bardziej, że o kalibrację
PORZUCAM WYSZUKIWARKĘ GOOGLE! Skoro clickbait mamy już za sobą, objaśniam - naprawdę porzucam wyszukiwarkę Google. Gdy kilka tygodni temu napisałem szeroko komentowany wątek o gównowaceniu tej usługi, w komentarzach najczęściej polecano mi Perplexity. Nadszedł jej czas 🧵👇
Dlaczego ta wyszukiwarka i dlaczego teraz? Pracodawca sponsoruje mi subskrypcję newslettera Pragmatic Engineer i jego autor wszedł w kooperację w Perplexity oraz Kagi: newsletter.pragmaticengineer.com/p/perplexity-a…
Wraz z rocznym abonamentem na newsletter dostałem roczny abonament Perplexity Pro oraz kwartalny Kagi Ultimate. Od dziś będę korzystał tylko z tych wyszukiwarek, jednocześnie zaś będę zbierał materiały do reportażu uczestniczącego - jak ta zmiana wpłynie
Dziś dowiemy się, dlaczego korzystanie z przeglądarkowej wersji chińskiego czata DeepSeek niesie wiele ryzyk, ale zainstalowanie go na własnym komputerze jest całkowicie bezpieczne. Brzmi to bezsensownie? Ale to prawda! Zapraszam do długiego wątku edukacyjnego 🧵👇
W minionym tygodniu społeczność specjalistów zajmujących się sztuczną inteligencją przeżyła małe trzęsienie ziemi. W przypadku akcji NVidii nie było ono zresztą takie małe, bo kursy spadły o 17%, obniżając wycenę firmy o... cztery roczne budżety Polski. A wszystko
to z powodu publikacji chińskich naukowców, którzy zaprezentowali światu swoje nowe modele językowe DeepSeek-V3 oraz DeepSeek-R1. Najwięcej hałasu zrobił ten drugi, z trzech powodów. Po pierwsze - jest dostępny za darmo, na otwartej licencji, a jednocześnie
Będąc młodą lekarką, tfu, młodym redaktorem magazynu CHIP, zacząłem używać wyszukiwarki Google około roku 1999-2000. Była nieprawdopodobnie doskonała, o lata świetlne wyprzedzała wszystkie Altavisty, Lycosy czy HotBoty. Przez ćwierć wieku moją rutyną było 👇🧵
ustawianie wyświetlania stu wyników na jednej stronie. Przez lata nauczyłem się niemal instynktownie odróżniać wartościowe linki od tych mniej wartościowych - a większa liczba wyników naraz ułatwiała szybkie przelecenie wzrokiem wielu odnośników.
Lata mijały a ja przywykłem do przewijania całego pierwszego ekranu wyników, bo był coraz bardziej zarypany reklamami. Wartościowe linki były jednak oddalone o jedno pacnięcie spacji, więc nadal dało się żyć.
Poznajcie pana Damiana Bessa, który w październiku 2023 pełnił w Ministerstwie Sprawiedliwości funkcję Zastępcy Dyrektora Biura Komunikacji i Promocji. Pan Bess z upoważnienia sami-wiecie-kogo podpisał decyzję o odmowie udostępnienia kodu źródłowego SLPS. Wątek👇🧵
Czytając pismo które będę dziś dla Was komentował, najpierw wytrzeszczałem oczy. Potem je przecierałem. A na końcu chciałem je sobie wydłubać. 2/36
Zaznaczę dla przejrzystości - pan Damian nie napisał wszystkiego sam, stanowiska zajęli też Dyrektorzy Departamentu Informatyzacji i Rejestrów Sądowych, Departamentu Kadr i Organizacji Sądów Powszechnych i Wojskowych, Biura Cyberbezpieczeństwa oraz Biura Bezpieczeństwa. 3/36