Weiß nicht, wer hier dümmer ist: Die KI, die Menschen (korrekt) als Primaten identifiziert oder Leute, die “Primaten” mit “Affen” gleichsetzen und glauben, die “KI” würde wegen der Hautfarbe Schwarze mit Affen verwechseln. spiegel.de/netzwelt/faceb… nytimes.com/2021/09/03/tec…
Verwechselung wegen Hautfarbe ist zwar möglich, aber im Gegensatz zu Menschen “interessiert” ein neuronales Netz die Hautfarbe nicht allzu sehr, es sei denn, man trainiert es darauf. Allgemein sind es vor allem Kontraste und Muster, an denen sich trainierte Netze orientieren.
Im HSV-Farbraum haben Schwarze und Weisse zudem praktisch die gleiche (rote) Hautfarbe (H 0-17) aufgrund der Blutgefäße, die Helligkeit V spielt keine Rolle, und Farbsättigung von Haut liegt bei 15-170, abhängig von der Beleuchtung und individueller Hautbeschaffenheit.
Generell kristallieren sich beim Training von Modellen Ähnlichkeiten heraus, etwa zwischen Hunden, Katzen und Bären, und Menschen ähneln halt Affen. Je nach Perspektive kann ein neuronales Netz Hunde mit Bären und Katzen und Menschen mit Affen verwechseln. Ist nicht ungewöhnlich.
Ein weiteres Problem ist, dass die meisten Menschen Sprache nicht präzise benutzen und “Primaten” synonym mit “Affen” setzen. Wenn man etwa nach “Primaten” googelt und sich die Bildsuchergebnisse ansieht: Nur Affenbilder zu sehen.
Das hat mit der Klassifizierung von Trainingdaten zu tun, die von Menschen vorgenommen wird, und wenn die Klasse „Primaten” nur Affenbilder enthält, ist das falsch, aber wenn sie korrekterweise auch Menschen enthält, sind Menschen und Affen halt Primaten und Leute regen sich auf.
Ob der vorliegende Fall wirklich skandalös ist, hängt davon ab, ob die KI darauf trainiert ist, nur Affen als Primaten zu klassifizieren, was ich vermute, und wie häufig die KI Menschen als Primaten identifiziert und ob es einen Zusammenhang mit der Hautfarbe gibt.
Aus diesem einen, anekdotischen Fall lässt nicht wirklich viel schließen, außer, dass KIs dieselben Probleme haben wie Menschen, die mit demselben Wort verschiedene Dinge meinen und etwa unter Demokratie, Faschismus und Sozialismus sehr verschiedene Dinge verstehen können.
So sind in meinem Sprachgebrauch Faschismus und Nazionalsozialismus zwei verschiedene Dinge, seit ich weiß, dass Hitler den Faschismus verachtet hat, weil Faschismus nicht rassistisch war, während Rassimus Grundlage des Nationalsozialismus ist.
Nationalsozialismus mit Faschismus in einen Topf zu werfen ist nicht nur aus meiner Sicht eine Verharmlosung des Nationalsozialismus, die den rassistischen Wesenskern und den Holocaust eher banalisiert - auch seriöse Wissenschaftler monieren das und plädieren dafür, …
…sich vom der Verwendung Begriff des “Faschismus” zu verabschieden, weil er substanzlos und missverständlich geworden und eigentlich ein “Strohmann” ist: Ein Begriff, der von den Gegnern und Siegern mit einer Bedeutung versehen wurde, die er bei Faschisten nie hatte,…
…und Leute wie Hitler als Faschisten bezeichnet, die nie Faschisten waren. Würden wir eine KI mit Daten aus dem Internet darauf trainieren, Leute als “Faschisten” zu klassifizieren, würde die KI wohl die marxistische Definition übernehmen und würde Hitler als “Faschisten” …
…klassifizieren. Würde man eine KI dagegen mit historischem Archivmaterial und den Reden und Schriften von Faschisten und Nazis trainieren, könnte sie aus Reden und Schriften zeitgenössischer Politiker aussagekräftigere Ähnlichkeiten mit den originalen Nazis…
…und Faschisten errechnen als eine KI, die von Twitter und Facebook gelernt hat, wer als Faschist oder Nazi bezeichnet wird. Die interessante Frage ist: Wollen wir KIs haben, die vorherrschende Vor- und Fehlurteile bestätigen, oder wollen wir KIs, die es besser wissen?
Beides dürfte Akzeptanzprobleme machen, aber wird wohl vorerst darauf hinauslaufen, dass KIs verbreitete Vor- und Fehlurteile übernehmen, weil diese im Trainingsmaterial enthalten sind und wir nicht wissen, wie es anders gehen könnte.
Im Fall der “Primaten” wird Facebook wohl bestenfalls mit einer Krücke versuchen, eine Wiederholung zu vermeiden, etwa die Kategorie “Primaten” ganz sperren für die Vorschlagsgenerierung, denn wirklich lösen lässt sich Problem derzeit nicht.
Heutige “KIs” basieren weitgehend auf statistischen Methoden, und eine Statistik über Trainingsmaterial wird die Zusammenhänge reproduzieren, die im Trainingsmaterial enthalten sind - das ist schließlich Sinn und Zweck des Trainings.
Wollen wir eine KI “sauber” trainieren, können wir nicht das “dreckige” Internet nehmen, sondern müssen wie bei der Schulung von Kindern quasi ein Curriculum mit kuratiertem und zensierten Material erstellen. Eine solche KI hätte aber Probleme, das breite Internet zu verstehen.
Heutige „KIs“ ähneln eher isolierten Autisten, die statt Schulunterricht in jüngstem Alter einfach das Internet und einen Haufen Bücher vorgesetzt kriegen und Kommunikation primär aus Kommentaren und Diskussionen im Internet kennen. Was soll da schon schiefgehen?
Beim derzeitigen Stand der Technik ist der aktuell erfolgreichste Ansatz, das Problem mit Menge zu erschlagen. Während GPT-2 etwa noch “too dangerous to release” war, zeigt GPT-3 mit bis zu 175 Mrd. Parametern (ca. 800 GB) und Trainingskosten in Millionenhöhe bemerkenswerte…
…Kunststücke im Umgang mit natürlicher Sprache, etwa Übersetzen und Generieren von Texten. GPT-3 wird zu 80% mit dem „Common Crawl“ trainiert, rund 410 Mrd. Token (Worte), dazu 70 Mrd. Token Bücher und 3 Mrd. Token Wikipedia und 19 Mrd. Token aus Reddit-Posts mit Score >= 3.
Das „Curriculum“ für GPT-3 ist also zu 86% „Internet“ und 14% Bücher, ca. 700.000. Und man kann mit GPT-3 z.B. auch rassistische Texte generieren, weshalb es auch keinen einfachen öffentlichen Zugang gibt, sondern lauter spezialisierte Anwendungen und Apps, die die API benutzen.
Wir werden uns bis auf weiteres darauf einstellen müssen, dass „KIs“ letzlich menschliche Äußerungen im Internet reproduzieren, einschließlich all des Unsinn und der Vielzahl von Fehlwahrnehmungem, Fehlklassifikationen und Fehlschlüssen der unfreiwilligen menschlichen „Trainer“.
Das Training von KIs wird ähnlich sensibel und politisch sein wie die Bildung von Kindern, und je höher entwickelt KIs sein werden, umso mehr werden Fehlfunktionen von KIs psychischen Problemen und mentalen Ausfällen von Menschen ähneln.
Die mediale Empörung über den Facebook-Fall halte ich für dumm und an der Sache vorbei, und Facebooks Reaktion („eindeutig inakzeptabler Fehler“) ist PR-Bullshit, der mich zweifeln lässt, dass sich bei Facebook irgendjemand kompetentes ernsthaft mit dem Problem beschäftigt hat.

• • •

Missing some Tweet in this thread? You can try to force a refresh
 

Keep Current with Pavel Mayer

Pavel Mayer Profile picture

Stay in touch and get notified when new unrolls are available from this author!

Read all threads

This Thread may be Removed Anytime!

PDF

Twitter may remove this content at anytime! Save it as PDF for later use!

Try unrolling a thread yourself!

how to unroll video
  1. Follow @ThreadReaderApp to mention us!

  2. From a Twitter thread mention us with a keyword "unroll"
@threadreaderapp unroll

Practice here first or read more on our help page!

More from @pavel23

12 Sep
Mir hat ein CDU-Ministerpräsident mal gesagt, vor Wahlen würde er sich rechtsradikal geben, um die Stimmen der Rechten mitzunehmen, und dann bis zur nächsten Wahl seine pragmatische Politik der Mitte durchziehen. Gerade die rechtsextremen Wähler seien nicht allzu helle, ...
...wären mit ein paar Sprüchen leicht abzuholen und würden sich nach der Wahl ohnehin nicht für echte Politik interessieren. Ich war mir nicht sicher, ob ihn das jetzt sympatischer und unsympathischer macht und ob das vielleicht eine "Doppellüge" war,..
...also er, wie er vorgab, wirklich ein Mann der Mitte war, der gelegentlich den Rechtradikalen mimte, oder tatsächlich ein Rechtsradikaler, der privat vorgab, keiner zu sein und so seine derben Äußerungen etwa zu Asylsuchenden zu verleugnen.
Read 25 tweets
11 Sep
Ein paar Gedanken zum Thema "Wohnungskonzerne" enteignen: Die öffentliche Hand kann sich das Geld problemlos zu niedrigen Zinssätzen leihen, und die Mieten dürften höher sein als die Zinsen.
Dazu kommt dann die Tilgung, wobei das letztlich genau dasselbe ist wie Geld auf die hohe Kante zu legen, und dann kommen die Kosten für Instandhaltung, Bewirtschaftung und Abschreibung, die von außen schwer zu kalkulieren sind.
Ich sehe zwei Hauptrisiken: Zum einen, dass sich die Zinssituation ändert, zum anderen, dass die Wohnungen leerstehen oder die Mieten gesenkt werden müssen, weil Leute abwandern oder so viele bessere Wohnungen neu gebaut werden, dass die Bestände für Mieter unattraktiv werden.
Read 18 tweets
11 Sep
Generell wird das Potential von motorisierten Zweirädern als Verkehrsträger in Deutschland von der Politik komplett unterschätzt. Sie sparen Verkehrsfläche, Energie und Rohstoffe, selbst mit Verbrennungsmotor, und wer vom Auto aufs Motorrad umsteigt, tut mehr für die Umwelt…
…als jemand, der auf ein Elektroauto umsteigt. Mit dem elektrifizierten Motorrad dagegen kommen nicht mal Busse und Bahnen mit, was Nachhaltigkeit und Energieverbrauch angeht, und innerhalb der Stadt ist es die beste und billigste Individualverkehrsoption, billiger als der ÖPNV.
Ja, es ist keine Option für jeden und für jedes Wetter, und es ist gefährlicher als jede andere Option. Rund 60% der Motorradunfälle sind fremdverschuldet, meist von Autofahrern, aber im Gegensatz zum Radverkehr, wo zunehmend Verkehrsflächen für Radfahrer geschaffen werden, …
Read 24 tweets
11 Sep
Das hier zeigt mal wieder, wie lebensfremd die Leute im Berliner Senat sind. Bezeichnend auch, dass hier ein nicht existierendes Problem gelöst werden soll, natürlich auch wieder, ohne Mittel dafür aufzuwenden. bz-berlin.de/berlin/aus-fue…
Gut, als Motorradfahrer bin ich hier alles andere als neutral, aber Motorräder und Motorroller sind auch Energie- und Verkehrsfläche sparende und günstige Mobilitätsoptionen für viele Menschen, die man eigentlich in einer Großstadt fördern sollte.
Vermutlich ist das alles wieder ein Sturm im Wasserglas und wird von der BZ gerade jetzt aufgebracht, um vor der Wahl noch etwas Stimmung gegen #rrg zu machen, und wisst ihr was? Es funktioniert bei mir. Ich bin verärgert, dass der Senat das überhaupt ernsthaft debattiert hat.
Read 25 tweets
6 Sep
Habe heute mit einem Bürgeramt in Prag interagiert. Spontan einen Termin bekommen, war dann zu früh da, bin trotzdem sofort drangekommen. Für einen Berliner immer wieder eine schockierende Erfahrung, dass Interaktion mit der Verwaltung anderswo funktioniert.
So sieht es seit Jahren bei der berlinweiten Online-Terminvereinbarung aus: Anmeldung nur max. 2 Monate im Voraus, alle Termine ausgebucht. Ab und zu gibt es wohl freie Termine, aber das alles ist echt kafkaesk.
Es ist in der Tat einfacher, einen Termin für eine Generalaudienz beim Papst zu bekommen als einen Termin beim Berliner Bürgeramt - wirklich.
Read 20 tweets
3 Sep
#ZukunftSteam 2 Kultusministerinnen, 1 “Familienpolitikerin”, 1 “Musikmanager”, 1 “Terrorexperte”, 1 unbekannter Anwalt mit “Jung” im Namen, letzte 4 ohne Regierungserfahrung, dazu Totalausfall Dorothea Bär und der Lobbyist Friedrich Merz. spiegel.de/politik/deutsc…
Armin Laschet und die CDU könnte einem fast leid tun, wenn es sich bei #ZukunftSteam nicht primär um eine Photo-Op handeln würde, die Diversität vorgaukeln soll. Kompetent erscheint niemand aus der Truppe, aber das ist auch nicht die Anforderung.
Die Hauptanforderung nicht nur an CDU-Politiker ist, Lobbyinteressen aufzunehmen, umzusetzen und dabei die Bevölkerung so zu verwirren, dass sie trotzdem gewählt werden. Dieses bewährte Spiel, bei dem man vor Wahlen eine Fassade präsentiert und nach der Wahl macht, was man will.
Read 25 tweets

Did Thread Reader help you today?

Support us! We are indie developers!


This site is made by just two indie developers on a laptop doing marketing, support and development! Read more about the story.

Become a Premium Member ($3/month or $30/year) and get exclusive features!

Become Premium

Too expensive? Make a small donation by buying us coffee ($5) or help with server cost ($10)

Donate via Paypal Become our Patreon

Thank you for your support!

Follow Us on Twitter!

:(