# Pentaradio vom 22. Oktober 2024 # Titel: "Ausgeklügelter Mustervergleich" Mit Mole, Simon und Xyrill. Die Welt ist kaputt wie eh und je. Damit zumindest unser Bild der Welt scharf und fokussiert bleibt, besprechen wir für Euch die Entwicklungen des Monats Oktober: von Monopol-Urteilen über KI-Forschungsergebnisse bis hin zu Raketentests. Auf Basis der Livesendung vom 22. Oktober 2024. ## Check-In Die Tischhöhe ist [0,49 步](https://de.wikipedia.org/wiki/Bu_(Einheit)). ## Feedback Christoph schreibt (eigentlich gerichtet an STP, aber hier erreichen wir wahrscheinlich mehr): > An der Hochschule für Musik und Theater in Leipzig leite ich ein DFG-Projekt in Musikwissenschaft mit dem Titel "Kulturen der Heimcomputermusik". Dabei geht es darum, wie in den 1980er Jahre wo auf der Welt mit C64, Amiga, Atari ST usw. Musik gemacht wurde. Wir haben da aktuell ein Problem, und ich wollte mal fragen, ob Dir etwas (jemand) Hilfreiches einfällt: Unser dritter Projektmitarbeiter, der für "die IT" im engeren Sinne zuständig war (wie funktioniert ein Soundchip, was ist der Unterschied von Assembler und Maschinensprache, warum steigt Rauch aus diesem Netzteil), hat eine feste volle Stelle bekommen und muss bei uns aussteigen. Gut für ihn, schlecht für uns. Die DFG hat mir erlaubt, die Stelle nicht als Stelle nachzubesetzen (denn mit einem Jahr Restlaufzeit hat das keinen Zweck mehr), sondern in viele Werkverträge aufzulösen. > > Kennst Du Menschen, die sich für solche Fragen interessieren und die vielleicht Interesse an einer Art freien Mitarbeit über einen Honorarvertrag hätten? Aktuell gibt es Bedarf an der Komplettierung einer angefangenen Übersicht der relevanten Soundchips der 80er – teils ist da detailliert etwas da, teils nicht –, die idealerweise irgendwann in ein großes Netzwerkdiagramm überführt werden soll: Welche Soundchips von Yamaha sind weltweit in welchen Systemen verbaut usw.? Dann ggf. auch ein bisschen Code-Analyse (vor allem C). Wer sich angesprochen fühlt, bitte bei uns per Mail melden. Wir stellen gerne Kontakt her. ## News - [Bitwarden ist nicht mehr Open Source](https://github.com/bitwarden/clients/issues/11611) - für die Serverseite ist [Vaultwarden](https://github.com/dani-garcia/vaultwarden) eine kompatible Open-Source-Alternative - oder halt [KeePassXC](https://keepassxc.org/) plus File-Sync zwischen allen beteiligten Geräten und Backups - im Gespräch erwähnt: [Pentaradio vom Juli 2020: "Kein Backup, kein Mitleid"](https://c3d2.de/news/pentaradio24-20200728.html) - Erste Effekte aus den Google-Monopolprozessen: [US-Gericht ordnet freien Zugang für Drittanbieter-App-Stores auf Android an](https://arstechnica.com/tech-policy/2024/10/judge-orders-google-to-distribute-third-party-app-stores-on-google-play/) - [Pentaradio berichtete](https://c3d2.de/news/pentaradio24-20240827.html) - Inhalt der [einstweiligen Verfügung](https://storage.courtlistener.com/recap/gov.uscourts.cand.373179/gov.uscourts.cand.373179.1017.0_3.pdf) - Google muss anderen App-Stores Zugriff auf ihren eigenen App-Katalog geben (außer bei Opt-Out der App-Entwickler) - Google muss die Installation anderer App-Stores mittels Google Play Store erlauben - wenn OEMs den Google Play Store vorinstallieren, darf Google damit keine monetären oder materiellen Anreize verknüpfen (z.B. Zugang zu anderen Google-Diensten) und nicht die Vorinstallation anderer App-Stores verbieten - Ein Manko: Alle Pflichten auf drei Jahre begrenzt, "weil die Bestimmungen darauf abzielen, die Wettbewerbsbedingungen für den Markteintritt und das Wachstum von Konkurrenten zu verbessern, ohne Google übermäßig zu belasten. Wenn der Wettbewerb ins Rollen kommt und die Netzwerkeffekte, von denen Google Play zu Unrecht profitiert, nachlassen, sollte Google als Wettbewerber nicht übermäßig eingeschränkt werden." (Übersetzung mithilfe von [DeepL](https://deepl.com)) - Money Quote: "\[Richter James Donato] ging in seiner 17-seitigen Verfügung nicht auf jedes einzelne Argument von Google ein, da \[er] einige von ihnen für zu schwach hielt, um eine Antwort zu rechtfertigen. Er schrieb: 'Wie bereits erwähnt, bestand Googles Vorgehensweise in diesem Fall darin, das Gericht mit [einem Meer von Kommentaren zu überschwemmen](https://de.wikipedia.org/wiki/Gish-Galopp), von denen viele kursorisch und unausgegoren waren. Das Gericht lehnt es ab, die Einwände von Google aufzugreifen, die in ihrer Präsentation vor dem Gericht nicht vollständig entwickelt wurden'." - Studie: ["Piraterie" bei Computerspielen verursacht etwa 20% Umsatzverlust](https://doi.org/10.1016/j.entcom.2024.100885) - Money Quote: "Denuvo-DRM schützt die Gesamteinnahmen im Mittel um 15 % und im Median um 20 % vor Piraterie. Piraterie führt zu einem durchschnittlichen Rückgang der Gesamteinnahmen um 20 %, wenn Denuvo schnell geknackt wird. Wenn Denuvo 12 Wochen oder länger überlebt, verursacht die Piraterie keinen mittleren Gesamtumsatzverlust." - Dem gegenüber steht der Kollateralschaden durch DRM zum Beispiel für legitime Schranken des Urheberrechts, z.B. Langzeitarchivierung kultureller Artefakte ([Pentaradio berichtete](https://c3d2.de/news/pentaradio24-20220125.html)). - Mole fragt sich: [Ist Xyrill Stackenblochen?](https://www.youtube.com/watch?v=d3nRFnBEZCc) - Countdown: [in einem Jahr (14. Oktober 2025) Support-Ende für Windows 10](https://www.theregister.com/2024/10/14/final_year_windows_10/) - obwohl (oder weil!) Windows 11 erst bei 33% Marktanteil liegt, Windows 10 hingegen doppelt so viel (63%; [Quelle](https://www.theregister.com/2024/10/01/windows_11_market_share/)) - besonders tragisch, weil Windows 11 unplausibel moderne Hardware voraussetzt, um Neukäufe zu forcieren - Unser Tipp: Wer auf Windows angewiesen ist und das Upgrade von 10 auf 11 nicht machen kann, kann mit [Rufus](https://rufus.ie/de/) einen Installations-Stick erstellen, der manche der Bogus-Kompatibilitätsanforderungen umgehen kann. - Schlangenöl-Update: [Wenn man auf einem "Call of Duty"-Server in den Chat "Trigger Bot" schreibt, werden die Benutzerkonten aller angemeldeten Spieler gesperrt.](https://blog.fefe.de/?ts=99ece009) - In dem Fall kein Antivirus, sondern ein Anticheat, der schaut, ob im Speicher des Spiels bestimmte Zeichenfolgen wie eben "Trigger Bot" auftauchen. - Der Plan war eigentlich, damit Mods zu finden, die einen solchen Bot als Option im Menü anzeigen. Aber das Chatfenster ist halt auch Teil des Spiels. - Zum Schluss noch eine gute Nachricht: [Der Entwurf der neuen NIST-Richtlinie für Authentifizierungssysteme](https://pages.nist.gov/800-63-4/sp800-63b.html) stuft blödsinnige Passwortregeln wie "mindestens ein Sonderzeichen" und Rotationszwang alle N Monate von "lieber nicht" auf "verboten" herunter. - Sofern beschlossen, gilt das erstmal direkt nur für Regierungssysteme und -webseiten, aber diese Regeln schlagen für gewöhnlich mit der Zeit auch in die Industriestandards durch. - im Gespräch erwähnt: [CWE-655: Frustrierendes Sicherheitstheater ist eine Schwachstelle](https://cwe.mitre.org/data/definitions/655.html) - Videotipp: [SpaceX Starship](https://www.youtube.com/watch?v=eXsT2HT171o) ## ✨KI✨-News - Energieverbrauch: [Microsoft bringt Three Mile Island wieder ans Netz, um ihre ✨KI✨ zu betreiben](https://www.reuters.com/markets/deals/constellation-inks-power-supply-deal-with-microsoft-2024-09-20/) - [Google zieht nach](https://www.theguardian.com/technology/2024/oct/15/google-buy-nuclear-power-ai-datacentres-kairos-power) - [Amazon zieht nach](https://observer.com/2024/10/amazon-google-microsoft-nuclear-power-ai-ambitions/) - Aber bringt's auch Ergebnisse? Studie: [Effekte der Nutzung von Microsoft's Copilot für Programmiertätigkeiten](https://www.cio.com/article/3540579/devs-gaining-little-if-anything-from-ai-coding-assistants.html) - Key Insight laut den Studienautoren: "Entwickler mit Copilot-Zugang verzeichneten eine \[um 41%] höhere Fehlerquote, während \[ihre Arbeitsleistung, gemessen an der Zahl bearbeiteter Tickets,] konstant blieb." - Das Apple-Paper: [Was neuere LLMs uns als "Reasoning" darstellt, sieht eher nach fortgeschrittenem Mimicry aus.](https://arxiv.org/abs/2410.05229) - Grundlage des Tests ist GSM8K, eine Sammlung von 8000 Logikpuzzles für den Grundschul-Matheunterricht. Sowas wie "Georg sammelt am Freitag 20 Äpfel, am Samstag 35 Äpfel, und am Sonntag doppelt so viele Äpfel wie Freitag. Wieviele Äpfel hat Georg gesammelt?" - Damit akzeptable Performance (z.B. OpenAI o1-mini: 95,1% richtige Antworten), aber vielleicht waren diese Aufgaben in den Trainingsdaten drin? - Seitenbemerkung: 95% klingt toll, aber für sehr viele Anwendungen ist eine Fehlerrate von "1 in 20" trotzdem katastrophal. - Erste Abänderung: Zahlen und Namen werden variiert, ohne die Problemstruktur zu verändern. Zum Beispiel statt "Georg sammelt am Freitag 20 Äpfel" jetzt "Lisa isst am Montag 8 Bonbons" und so weiter. - Damit immer noch gute Performance (z.B. OpenAI o1-mini: zwischen 89,1% und 94,9% richtige Antworten). - Zweite Abänderung: Es werden irrelevante Informationen hinzugefügt, die die Problemstruktur nicht verändern. Zum Beispiel "Georg sammelt am Sonntag doppelt so viele Äpfel wie Freitag, _aber fünf davon sind etwas kleiner_. Wieviele Äpfel hat Georg gesammelt?" - Damit plötzlich katastrophale Performance-Einbrüche (z.B. OpenAI o1-mini: 66,0% richtige Antworten). - Aus der Zusammenfassung (Übersetzung mithilfe von [DeepL](https://deepl.com)): "Letztlich unterstreicht unsere Arbeit, dass die Fähigkeit von LLMs, echte mathematische Schlussfolgerungen zu ziehen, erheblich eingeschränkt ist. Die hohe Varianz in der Leistung bei verschiedenen Versionen derselben Frage, ihr erheblicher Leistungsabfall bei einer geringfügigen Erhöhung des Schwierigkeitsgrads und ihre Empfindlichkeit gegenüber inkonsequenten Informationen deuten darauf hin, dass ihr logisches Denken anfällig ist. Es ähnelt eher einem ausgeklügelten Mustervergleich als einem echten logischen Denken. Wir erinnern den Leser daran, dass \[unsere Testaufgaben\] relativ einfache Mathematikfragen aus dem Grundschulbereich enthalten, die in jedem Schritt nur einfache Rechenoperationen erfordern. Daher sind die derzeitigen Einschränkungen dieser Modelle bei anspruchsvolleren mathematischen Benchmarks wahrscheinlich noch ausgeprägter." - "Ausgeklügelter Mustervergleich"... Woran erinnert uns das nur? - im Gespräch erwähnt: https://blogs.helmholtz.de/research-field-information/2024/08/07/ki-studie-zeigt-scheitern-von-llm-im-logischen-denken/ - Hörtipp: ["LLM State of the Union" in Freak Show #285](https://freakshow.fm/fs285-gib-den-maschinen-eine-chance), dort zwischen Zeitmarken 2\:13\:13 und 3\:02\:20 - Dort eine Besprechung der aktuellen Fähigkeiten von LLMs anhand bestimmter Beispielprobleme (insb. Logik-Rätsel und Sprach-Puzzles), inklusive eines Skynet-Moments: Kann ein LLM Methoden entwickeln, um seine eigenen Einschränkungen zu umgehen? - Noch ein Paper: ["Größere und besser instruierbare Sprachmodelle werden weniger zuverlässig"](https://doi.org/10.1038/s41586-024-07930-y) - Fortgeschrittene Sprachmodelle wie ChatGPT oder Claude werden durch menschliches Feedback trainiert (["Reinforcement learning from human feedback", RLHF](https://de.wikipedia.org/wiki/Reinforcement_learning_from_human_feedback)). - Problem: Die menschlichen Trainer können bei fortgeschrittenen und spezialisierten Fragestellungen die Antworten schlechter nach ihrem Wahrheitsgehalt beurteilen und bewerten deswegen vor allem, wie kompetent das Modell in der Antwort auftritt. So züchten sie selbstbewusste Lügner heran. - Apropos DeepL: Die haben ein neues Schreibhilfe-LLM... [mit fragwürdigen Vorschlägen](https://www.deepl.com/en/write#de/Sehr%20geehrte%20Frau%20Dr.%20Schneider). - [Xyrill hat einen Screenshot gesichert](https://dl.xyrillian.de/pentaradio-quellen/screenshot-20241008-185638.png). - Vielleicht sollten wir wirklich aufhören, von ✨KI✨ zu reden, und immer konsequent "stochastischer Papagei" sagen. - Weitere Beispiele von AI-Slop aus diesem Monat im Schnelldurchlauf: - [Laut Google ist der Unterschied zwischen Sauce und Dressing, dass man eines aufs Essen macht und das andere auf Wunden.](https://toot.cat/@devopscats/113292732236170381) - [ChatGPT erklärt, wie man einen Netzstecker verkabelt.](https://mastodon.ie/@iolo/113248676764884541) - Videotipp: [Tom Nicholas: "How AI Theft is Killing Free Speech"](https://www.youtube.com/watch?v=ihRr7diYuKA) - Tom Nicholas zieht eine historische Parallele zwischen Plattformkapitalismus der 2000er- und 2010er-Jahre (Google, Facebook und Co. profitieren von der Arbeit von Journalisten und Künstlerinnen, indem sie den Zugang dazu regulieren) und dem aufkommenden ✨KI✨-Plattformkapitalismus (OpenAI, Anthropic und Co. profitieren von der Arbeit von Journalisten und Künstlerinnen, indem sie mit deren Werken ihre Modelle trainieren) ## Debatte [Mastodon-User Wolfgang Lucht rezensiert](https://mstdn.social/@W_Lucht/113250069797168707) das Buch [„The Collapse of Complex Societies“](https://archive.org/details/TheCollapseOfComplexSocieties) des Anthropologen und Historikers [Joseph Tainter](https://de.wikipedia.org/wiki/Joseph_Tainter): > Die Haupthypothese lautet, dass in dem Maße, in dem Gesellschaften als Reaktion auf Probleme in ihre Komplexität investieren und Erträge aus dieser Investition erzielen, die Kosten für deren Aufrechterhaltung steigen, bis die Erträge irgendwann marginal werden. An diesem Punkt werden die Gesellschaften strukturell anfällig für Schocks. > > Ich denke, dass unsere derzeitige Unfähigkeit, die sich verschärfende ökologische und soziale Krise der Welt zu bewältigen, etwas damit zu tun hat. [Pentaradio berichtete.](https://c3d2.de/news/pentaradio24-20221227.html) Haben wir mal wieder Recht gehabt, dass Komplexität das Grundproblem ist! ## Musik - ["KI Killermachine (ID 949)", Lobo Loco (2018)](https://freemusicarchive.org/music/Lobo_Loco/Wittness_for_Fittness/KI_Killermachine_ID_949/) - ["King Kong Kitchie Kitchie Ki Me O", Roger McGuinn (2009)](https://freemusicarchive.org/music/Roger_McGuinn/Folk_Den_Project/20090517154850991/)