Czego możemy dowiedzieć się o polskich domenach z listy HSTS Preload? Wątek 🧵👇
1/19
Co to jest HSTS? To mechanizm, za pomocą którego strona WWW może powiedzieć przeglądarce internetowej: "komunikuj się ze mną wyłącznie za pomocą szyfrowanego protokołu HTTPS". Podnosi to bezpieczeństwo korzystania z sieci. Więcej w Wikipedii: pl.wikipedia.org/wiki/HTTP_Stri…
2/19
Ryzyko jest istotnie zredukowane, ale nie znika. Przy pierwszym połączeniu ze stroną przeglądarka nie wie jeszcze, że HTTPS jest obowiązkowy. Pierwsze wejście na stronę z użyciem HTTP nadal naraża użytkownika na ryzyko podsłuchu i modyfikacji przesyłanych danych.
3/19
Aby zapobiec takiej sytuacji, domeny internetowe można dodać do spisu HSTS Preload. Jest to lista domen, z którymi przeglądarki *zawsze* będą łączyć się za pomocą bezpiecznego protokołu HTTPS, nawet przy pierwszym połączeniu. Stary protokół HTTP będzie wykluczony.
4/19
Jeśli chcesz sprawdzić, czy jakaś domena jest na liście HSTS Preload w twoim Chrome, otwórz adres chrome://net-internals/#hsts i wpisz nazwę w sekcji "Query HSTS/PKP domain"
6/19
Na liście znajduje się 166285 nazw domenowych, z czego 1235 w obrębie polskiej domeny najwyższego poziomu ".PL". To właśnie tym domenom poświęcona jest niniejsza analiza.
8/19
Czego dowiadujemy się o długości nazw domenowych?
Niektóre nazwy są bardzo krótkie, na przykład:
9h[.]pl
wk[.]pl
er[.]pl
py[.]pl
dm[.]pl
(wszystkie po 5 znaków)
9/19
Rozkład długości nazw domenowych w analizowanym zbiorze wygląda następująco:
11/19
Pokażmy jeszcze raz rozkład długości nazw domenowych, ale z logarytmiczną skalą Y - to potwierdza powagę i fachowość niniejszej analizy.
12/19
Spośród polskich domen dokładnie 1094 zawiera jedną kropkę, zaś 141 zawiera dwie kropki (przykłady - patrz powyżej). Trzy kropki są wykluczone, dowolna większa wartość również.
13/19
1077 domen nie zawiera żadnej kreski. 142 domeny zawierają jedną kreskę, 14 domen zawiera dwie kreski, zaś dwie domeny zawierają trzy kreski. Są to: auto-motor-i-sport.pl odzyskiwanie-danych-z-dysku.pl
14/19
Najpopularniejsze literki w polskich nazwach domenowych to oczywiście "p" oraz "l". Jeśli jednak zignorujemy część ".pl", będą to "a", "e" oraz "o" - każda ma ponad 1000 wystąpień.
15/19
Najmniej popularne literki to "q", "ł", "ś", "ą" - wszystkie poniżej dziesięciu wystąpień. Trzeba jednak pamiętać, że nie było ani jednego wystąpienia liter "ę", "ż", "ź", "ć" oraz "ń".
16/19
Tylko pięć spośród polskich domen z listy HSTS używa IDN czyli formatu międzynarodowych nazw domenowych. Więcej informacji pl.wikipedia.org/wiki/Internati…
Dla wszystkich nieświadomych, dlaczego ostatni ruch #Apple jest tak kontrowersyjny, przygotowałem wizualną ściągawkę. Haszowanie obrazków nie jest dokonywane funkcjami kryptograficznymi! Algorytmy są inne a kolizje nieuniknione - spójrzmy na prostą matematykę
Apple twierdzi, że błąd false positive zdarzy się raz na trylion, to taki sposób na powiedzenie "praktycznie nigdy". "Trillion" to nasz bilion. Na świecie działa półtora miliarda aktywnych iPhone'ów. Jeśli każdym zrobiono tysiąc zdjęć, mamy *gwarantowany* false positive.
Teraz zastanówmy się, na ile sposobów można zrobić zdjęcie niemowlakowi. Milion? Milion zdjęć niemowlęcia wyrabia raptem setka insta-rodziców przez pierwszy kwartał po narodzinach. Kolizje będą rzędy wielkości częstsze.
Tak sobie czytam, co różni wysoko kształceni ludzie piszą o europejskiej regulacji AI i czuję, że wielu z nich nie do końca wie, jak to wszystko wygląda w praktyce. Wątek.
Więc po pierwsze - nie mamy sztucznej inteligencji, nie mamy maszyn, które myślą, wnioskują, czy 1/n
jakkolwiek rozumują. Mamy jedynie algorytmy uczenia maszynowego, w których jakiś algorytm nakarmiony tysiącami lub milionami przykładów wykryje korelację między jakimiś parametrami. Przykład - jeśli maszyna ma określić cenę mieszkania, to na podstawie tysiąca mieszkań 2/n
z prawdziwych transakcji wykryje, że ten sam metraż idzie drożej jeśli mieszkanie ma trzy pokoje zamiast dwóch. Albo że brak windy to minus ileś procent ceny równoważnego mieszkania z windą za każde dodatkowe piętro.
Po drugie - aby użyć algorytmów uczenia maszynowego, nie 3/n
Co jakiś czas z ważnych powodów proszę Was o RT i to jest właśnie ten przypadek. Chciałbym, aby możliwie daleko poniosła się informacja, że wydawca komunikatora #Usecrypt pozwał mnie w procesie cywilnym o zaniechanie naruszeń dóbr osobistych i usunięcie skutków naruszenia 1/6
Co robi typowa firma skonfrontowana z usterką swojego produktu? Usuwa błąd, zapewnia, że bezpieczeństwo użytkowników jest dla niej najważniejsze i przekazuje badaczowi podziękowania, czasem dorzucając kubek albo t-shirt 3/6
1/4 Cała ta historia zaczęła się w lutym 2014, kiedy pracowałem nad aplikacją @AppyParking. Apka korzystała z Google Maps, rysowała na nich półprzezroczyste mapy stref parkingowych i problem z nimi był taki, że na niektórych poziomach zooma niektóre strefy były rysowane bez
2/4 wypełnienia. Błąd w bibliotece Google, nie do naprawienia przez programistę.
Były to, przypomnijmy, czasy Androida 4.4, Samsunga S2 i Google Nexusa. Piękne czasy, pionierskie.