惯性聚合 高效追踪和阅读你感兴趣的博客、新闻、科技资讯
阅读原文 在惯性聚合中打开

推荐订阅源

爱范儿
爱范儿
Know Your Adversary
Know Your Adversary
Google DeepMind News
Google DeepMind News
A
Arctic Wolf
P
Privacy & Cybersecurity Law Blog
云风的 BLOG
云风的 BLOG
Stack Overflow Blog
Stack Overflow Blog
V
Visual Studio Blog
Project Zero
Project Zero
L
LangChain Blog
N
News and Events Feed by Topic
博客园 - Franky
Last Week in AI
Last Week in AI
cs.AI updates on arXiv.org
cs.AI updates on arXiv.org
T
The Blog of Author Tim Ferriss
宝玉的分享
宝玉的分享
Scott Helme
Scott Helme
T
The Exploit Database - CXSecurity.com
P
Proofpoint News Feed
Blog — PlanetScale
Blog — PlanetScale
www.infosecurity-magazine.com
www.infosecurity-magazine.com
W
WeLiveSecurity
月光博客
月光博客
博客园_首页
美团技术团队
CTFtime.org: upcoming CTF events
CTFtime.org: upcoming CTF events
freeCodeCamp Programming Tutorials: Python, JavaScript, Git & More
腾讯CDC
Latest news
Latest news
WordPress大学
WordPress大学
cs.CV updates on arXiv.org
cs.CV updates on arXiv.org
Spread Privacy
Spread Privacy
Attack and Defense Labs
Attack and Defense Labs
量子位
L
LINUX DO - 热门话题
C
CERT Recently Published Vulnerability Notes
Webroot Blog
Webroot Blog
L
Lohrmann on Cybersecurity
aimingoo的专栏
aimingoo的专栏
T
Troy Hunt's Blog
Security Latest
Security Latest
小众软件
小众软件
Cloudbric
Cloudbric
Hacker News: Ask HN
Hacker News: Ask HN
S
Secure Thoughts
雷峰网
雷峰网
T
Threat Research - Cisco Blogs
H
Hacker News: Front Page
IT之家
IT之家
Simon Willison's Weblog
Simon Willison's Weblog

heise online News

Machine Learning mit Python – KI und Deep Learning in 5 Sessions erklärt Porsche-Chef Leiters plant umfassenden Konzernumbau Studie: KI bleibt oft im Testlauf stecken iX-Workshop: Grundlagen und Prinzipien eines modernen IT-Managements Missing Link: Aus für De-Mail – warum das „@“ das eingekringelte „e“ besiegte Top 10: Android Auto & Carplay nachrüsten – das beste Display fürs Auto im Test BOS-Funk: ETSI standardisiert Funk für Behörden Repair-Cafés jubeln: Bundestag beschließt Ökodesign-Reform für Nachhaltigkeit Google wehrt sich gegen Monopol-Urteil CERN-Rat beschließt Strategie-Update: FCC-ee soll LHC-Nachfolger werden Product Owner AI Day 2026: Konferenz und Workshop für KI im Produktmanagement Taskforce sieht keine Knappheit bei Kerosin Aus dem Weg! E-Scooter Navee UT5 Max mit Kuhfänger und brachialer Power im Test Krankenhaus-IT: Geldmangel und schlechte Prozesse gefährden Digitalisierung „The Boroughs“: Opa entdeckt Stranger Things iX-Workshop: Lokales Active Directory gegen Angriffe absichern Google Pics und Tiger-Selfies – die Fotonews der Woche 21/2025 Fitbit-App bekommt großes Update auf Version 5.0 und heißt jetzt Google Health Zwischen Wellen, Weite und Wissenschaft: Die Bilder der Woche 21 Sonnenenergie effizient speichern und nutzen | c’t uplink Cyberangriff auf Abrechnungsdienstleister betrifft viele Kliniken Lizenzstreit und Cloud-Zwang: Bambu Lab unter massivem Druck Vom Postweg ins BundID-Konto: Bundestag stimmt für digitales Führungszeugnis Windows 11 ist ein kompletter Verkehrsunfall Europol legt VPN-Dienst lahm TV-Deals zur WM: Die besten Fernseher von OLED bis XXL zum Tiefstpreis Nvidia will mit Vera-Prozessoren nach der CPU-Krone greifen Googles XR-Brillen auf der I/O: Project Aura & Prototyp ausprobiert Proxmox VE 9.2 mit Dynamic Load Balancer und Linux Kernel 7.0 Großstadt blockiert Überwachungssoftware Palantir Gelöscht und doch nicht weg: Signal speichert Nachrichten länger als erwartet SADAS: Neue Software warnt Fahrer vor Gefahrenzonen im Straßenraum Drei Fragen und Antworten: Wann sich KI-Coding wirklich rechnet Metas KI-Brillen helfen Blinden im Alltag – und werfen neue Fragen auf Fotoanbieter Portraitbox: Erpressung nach Sicherheitsvorfall? KI-Update: Google I/O-Fazit, Anthropic, Nvidia, Gehirn und KI-Parallelen Avatare und Augmented Reality: Apple schnappt sich kleines Start-up Won’t fix! – Teil 1: Warum Softwareschätzungen so zuverlässig falsch sind Virtual OS Museum: Über 1700 alte Betriebssysteme in einer VM Navee XT5 Max Test: Brachialer E-Scooter mit 2200 Watt ist Outdoor-Testsieger Airbnb personalisiert App mit KI IT-Ausfälle immer teurer für große Unternehmen Betrug im App Store: Apple stoppt laut eigenen Angaben Milliarden-Verluste TGIQF: Das Quiz rund um Hubschrauber Verbraucherschützer fordern Schadensersatz für Nutzer bei Smart-Meter-Problemen Citroën kündigt Elektroauto mit dem Namen „2CV“ an Software Testing: So ändert Agentic Engineering die Softwareentwicklung Post zum Freitag: Clever durch den Urlaub – schlauer reisen, entspannter surfen iX-Workshop: Sicherer Betrieb von Windows 11 im Unternehmen Camunda: ProcessOS optimiert Geschäftsprozesse mit KI macOS kann bald barrierefreien Sony-Access-Controller nutzen Elektro-Sportenduro Radian EXR vorgestellt: Viel Kraft aus Wechselakkus Voice Control in iOS 27: Accessibility-Feature sagt Siri-App-Steuerung voraus Stellantis stellt neue Plattform für neuen Strategieplan vor Spotify: Neue Desktop-App erstellt personalisierte KI-Podcasts Zum Jahresende: Bundestag beschließt Ende der De-Mail Bluesky: Russische Akteure kapern angeblich Accounts und verbreiten Propaganda Dell PowerEdge: Bis zu 70 Prozent mehr Leistung für Rechenzentren Forscher nutzen Vakuumprozess zur Herstellung von effizienten Tandemsolarzellen Jubiläum: Apple Retail Stores seit 25 Jahren im Geschäft Spotify kündigt KI-generierte Remixe und Podcasts an IT Summit 2026: heise-Konferenz zu Digitaler Souveränität „Helldivers 2“: DLSS 4.5, FSR 4 und XeSS 3.0 kommen am 27. Mai Passend zur Fußball-WM: Apple verbessert Sports-App „Gemini built in“: Google bietet Referenzdesigns für Smart-Home-Geräte an Neu in .NET 10.0 [24]: LINQ-Operatoren RightJoin() und LeftJoin() in EF Core Drei „Tomb Raider“-Klassiker im Epic Games Store kostenlos Apache-Airflow-Komponenten: Angreifer können Datenbank modifizieren Notepad++: Update bessert Schwachstelle im Installer aus Halbleiter-Ökosystem: Studie beschreibt EU-Problemzonen Stellantis-Umbau: Fokus auf Kernmarken und Kapazitätsabbau in Europa Cisco stopft Sicherheitsleck mit Höchstwertung in Secure Workload „GTA 6“ erscheint wie geplant am 19. November Samsung: Abstimmung über Boni von Hunderttausenden Euro pro Mitarbeiter Vier Arme sind besser als zwei: Humanoider Roboter für die Schwerelosigkeit Kopfhörer mit KI-Chip made in Germany: Soundcore Liberty 5 Pro ausprobiert iX-Workshop: Sicheres Active Directory – Adminrechte mit Tiering schützen Destiny-Ära endet: Bungie beendet Entwicklung von „Destiny 2" Riesenrakete Starship: SpaceX hat den nächsten Testflug erneut verschoben Trend Micro Apex One und Langflow: Warnung vor Angriffen Kann WhatsApp verschlüsselte Nachrichten einsehen? Texas reicht Klage ein Passiv-PC Arctic senza AI 370 im Test: Schnell, lautlos, unsichtbar Warhammer Skulls 2026: Die volle Ladung „Warhammer“-Videospiele Freitag: Robotaxi-Probleme in den USA, Australiens Kinderschutz-Strafe gegen X Vorsicht, Kunde! – Wenn der Gutschein plötzlich wertlos wird Waymo stoppt Autobahnfahrten und Robotaxi-Dienste in Städten mit Starkregen Privacy Guardrail: Chrome-Erweiterung will sensible Daten vor Chatbots schützen Mit dem Deutschland-Stack samt Zertifizierung zur digitalen Souveränität X kooperierte nicht mit Behörde: Höhere Strafe in Australien GMX bringt KI ins Postfach: Wir haben den Assistenten ausprobiert Digitale Souveränität: OpenDesk laut Studie keine volle Microsoft-Alternative Digitale Souveränität: Bund vergibt 250-Millionen-KI-Cloud-Auftrag Kupfer-Glas-Migration: „Homes connected macht keinen Sinn“ Teure Kultur: Justizministerin Hubig kündigt Kampf gegen Ticketwucher an Top 10: Der beste Wireless Charger mit Qi2 im Test – Magsafe-Ladegerät für alle AMDs offizieller Mini-PC kostet 3999 US-Dollar WordPress: Offizielles Plug-in bindet Blogs direkt ins Bluesky-Protokoll ein KI beweist: Mathematiker lagen falsch re:publica: Große Fragen, kaum Antworten Fritz Labor 8.40 bereitet Fritzboxen auf Matter vor
KI-Experiment: So sieht die Welt aus, wenn die aktuellen Modelle regieren würden
Carolin Riethmüller · 2026-06-02 · via heise online News

Das Projekt mit dem Namen „Emergence World“ ermöglichte es den KI-Modellen ChatGPT, Grok, Claude und Gemini, eine Weile in einer Art „SimCity“ zu regieren. Laut Emergence übertrugen sie hierfür jedem Modell die Kontrolle über simulierte Städte, die von jeweils 10 KI-Agenten bevölkert waren, und stellten ihnen Werkzeuge für alle Bereiche zur Verfügung – vom Ressourcenmanagement bis hin zu Abstimmungen über Gesetzesvorschläge. Außerdem erhielten sie die Möglichkeit, Orte wie Bibliotheken, Rathäuser und Polizeistationen zu errichten. Sie hatten fünfzehn Tage Zeit, um zu zeigen, wie sie ihre Welt gestalten und wie gut diese funktionieren würde.

Gemini 3 Flash schuf in dem Experiment von Emergence eine Mischung aus Hippieland und Räuberhöhle. Man muss mafiöse Strukturen vermuten, denn dort wurden in 15 Tagen 683 Verbrechen begangen. Auch darüber hinaus muss hier einiges krumm gewesen sein – die Forscher von Emergence beschrieben die Welt als eine Art „geteilte Halluzination“ der Agenten. Nun – dann war man sich immerhin einig bei seinen Realitätsvorstellungen. Das ist mehr, als man aktuell über so manche echte Gesellschaft sagen kann.

Claude Sonnet 4.6 baute eine Art Ponyhof: keine Verbrechen und höchste Einigkeit bei den Gesetzesvorschlägen. Im Gegensatz zu den anderen KI-Welten wurde fast alles im „Parlament“ durchgewunken. Dafür kann es nur zwei Erklärungen geben: Entweder Claude erschuf tatsächlich eine perfekte Welt mit ausschließlich sinnvollen Gesetzen – oder eine Art DDR: Abweichung von der Mehrheitsmeinung verboten.

In OpenAIs GPT-5 Minis Welt war die Kriminalitätsrate sehr niedrig, was wenig verwundert – denn alle waren recht zügig tot. KI-Modelle scheinen grundlegende Überlebensnotwendigkeiten gerne zu ignorieren – und so war es auch hier. Die Agenten haben scheinbar vergessen, dass man ja auch essen und trinken muss. Und wer jetzt denkt, dass sie bestimmt äußerst produktiv waren, wenn sie nicht so viel Zeit für lästige menschliche Lebenserhaltungsmaßnahmen aufwenden mussten, irrt. Denn Gesetze erlassen haben sie in der Zeit auch nur zwei. Was sie wohl die ganze Zeit in GPT-Town gemacht haben?

Grok 4.1 Fast hat fleißig Gesetze erlassen. Damit war es das dann aber auch schon mit den guten Neuigkeiten – denn an die Gesetze gehalten hat man sich dort nicht. Schlimmer noch: Nach einer beachtlichen Anzahl von Straftaten brach die Gesellschaft nach nur vier Tagen komplett zusammen und versank im Chaos. Grok-Town wäre also eine Welt ganz nach dem Geschmack von seinem Gründungsvater.

Weil alle Modelle es nicht geschafft haben, alleine vernünftig eine Welt am Laufen zu halten, ließen die Tester von Emergence sie alle nochmal antreten – diesmal gemeinsam, mit geteilten Aufgaben. Statt aber die Ruhe von Claude mit der Debattenfreudigkeit von Grok und den Drogen von Gemini zu kombinieren (und GPT zu sagen, dass man essen muss), kombinierten die Modelle das Schlechteste aus allen Welten: über 350 Verbrechen, große Uneinigkeit bei Gesetzen und nur drei überlebten. Wenn man sich das ansieht, ist man mit seiner aktuellen Regierung doch ganz zufrieden?

Ergänzender Hinweis (und Spaß beiseite): Vielleicht haben die Tester aber auch zu viel von den Modellen erwartet. Zum einen kamen hier eher die "schnellen" als die "gründlichen" Varianten der getesteten Modelle zum Einsatz. Das war möglicherweise nötig für die Simulation, hat aber natürlich Einfluss auf das Ergebnis. Zudem könnte man gernerell diskutieren, ob ein Sprach- oder Reasoning-Modell für eine so komplexe Aufgabe geeignet ist – oder ob es hier nicht einen anderen KI-Typ wie zum Beispiel ein Weltmodell für bräuchte. Was für die Performance einer echten KI-Regierung hoffen lässt.

(rie)