惯性聚合 高效追踪和阅读你感兴趣的博客、新闻、科技资讯
阅读原文 在惯性聚合中打开

推荐订阅源

E
Exploit-DB.com RSS Feed
Google Online Security Blog
Google Online Security Blog
SecWiki News
SecWiki News
Application and Cybersecurity Blog
Application and Cybersecurity Blog
The Last Watchdog
The Last Watchdog
GbyAI
GbyAI
Microsoft Azure Blog
Microsoft Azure Blog
MyScale Blog
MyScale Blog
Y
Y Combinator Blog
Microsoft Security Blog
Microsoft Security Blog
Martin Fowler
Martin Fowler
CTFtime.org: upcoming CTF events
CTFtime.org: upcoming CTF events
B
Blog RSS Feed
Hacker News - Newest:
Hacker News - Newest: "LLM"
D
DataBreaches.Net
Cloudbric
Cloudbric
Help Net Security
Help Net Security
B
Blog
K
KPMG report finds enterprise disconnect between AI and its ROI | CIO
罗磊的独立博客
PCI Perspectives
PCI Perspectives
Apple Machine Learning Research
Apple Machine Learning Research
量子位
P
Proofpoint News Feed
N
News and Events Feed by Topic
Attack and Defense Labs
Attack and Defense Labs
Stack Overflow Blog
Stack Overflow Blog
Recent Commits to openclaw:main
Recent Commits to openclaw:main
T
The Blog of Author Tim Ferriss
J
Java Code Geeks
cs.AI updates on arXiv.org
cs.AI updates on arXiv.org
人人都是产品经理
人人都是产品经理
小众软件
小众软件
www.infosecurity-magazine.com
www.infosecurity-magazine.com
The Register - Security
The Register - Security
S
Secure Thoughts
The GitHub Blog
The GitHub Blog
Forbes - Security
Forbes - Security
M
MIT News - Artificial intelligence
Recorded Future
Recorded Future
H
Heimdal Security Blog
S
Security Archives - TechRepublic
WordPress大学
WordPress大学
C
Cisco Blogs
博客园 - 【当耐特】
Cyber Security Advisories - MS-ISAC
Cyber Security Advisories - MS-ISAC
C
Check Point Blog
AI
AI
美团技术团队
Blog — PlanetScale
Blog — PlanetScale

heise online News

Machine Learning mit Python – KI und Deep Learning in 5 Sessions erklärt Porsche-Chef Leiters plant umfassenden Konzernumbau Studie: KI bleibt oft im Testlauf stecken iX-Workshop: Grundlagen und Prinzipien eines modernen IT-Managements Missing Link: Aus für De-Mail – warum das „@“ das eingekringelte „e“ besiegte Top 10: Android Auto & Carplay nachrüsten – das beste Display fürs Auto im Test BOS-Funk: ETSI standardisiert Funk für Behörden Repair-Cafés jubeln: Bundestag beschließt Ökodesign-Reform für Nachhaltigkeit Google wehrt sich gegen Monopol-Urteil CERN-Rat beschließt Strategie-Update: FCC-ee soll LHC-Nachfolger werden Product Owner AI Day 2026: Konferenz und Workshop für KI im Produktmanagement Taskforce sieht keine Knappheit bei Kerosin Aus dem Weg! E-Scooter Navee UT5 Max mit Kuhfänger und brachialer Power im Test Krankenhaus-IT: Geldmangel und schlechte Prozesse gefährden Digitalisierung „The Boroughs“: Opa entdeckt Stranger Things iX-Workshop: Lokales Active Directory gegen Angriffe absichern Google Pics und Tiger-Selfies – die Fotonews der Woche 21/2025 Fitbit-App bekommt großes Update auf Version 5.0 und heißt jetzt Google Health Zwischen Wellen, Weite und Wissenschaft: Die Bilder der Woche 21 Sonnenenergie effizient speichern und nutzen | c’t uplink Cyberangriff auf Abrechnungsdienstleister betrifft viele Kliniken Lizenzstreit und Cloud-Zwang: Bambu Lab unter massivem Druck Vom Postweg ins BundID-Konto: Bundestag stimmt für digitales Führungszeugnis Windows 11 ist ein kompletter Verkehrsunfall Europol legt VPN-Dienst lahm TV-Deals zur WM: Die besten Fernseher von OLED bis XXL zum Tiefstpreis Nvidia will mit Vera-Prozessoren nach der CPU-Krone greifen Googles XR-Brillen auf der I/O: Project Aura & Prototyp ausprobiert Proxmox VE 9.2 mit Dynamic Load Balancer und Linux Kernel 7.0 Großstadt blockiert Überwachungssoftware Palantir Gelöscht und doch nicht weg: Signal speichert Nachrichten länger als erwartet SADAS: Neue Software warnt Fahrer vor Gefahrenzonen im Straßenraum Drei Fragen und Antworten: Wann sich KI-Coding wirklich rechnet Metas KI-Brillen helfen Blinden im Alltag – und werfen neue Fragen auf Fotoanbieter Portraitbox: Erpressung nach Sicherheitsvorfall? KI-Update: Google I/O-Fazit, Anthropic, Nvidia, Gehirn und KI-Parallelen Avatare und Augmented Reality: Apple schnappt sich kleines Start-up Won’t fix! – Teil 1: Warum Softwareschätzungen so zuverlässig falsch sind Virtual OS Museum: Über 1700 alte Betriebssysteme in einer VM Navee XT5 Max Test: Brachialer E-Scooter mit 2200 Watt ist Outdoor-Testsieger Airbnb personalisiert App mit KI IT-Ausfälle immer teurer für große Unternehmen Betrug im App Store: Apple stoppt laut eigenen Angaben Milliarden-Verluste TGIQF: Das Quiz rund um Hubschrauber Verbraucherschützer fordern Schadensersatz für Nutzer bei Smart-Meter-Problemen Citroën kündigt Elektroauto mit dem Namen „2CV“ an Software Testing: So ändert Agentic Engineering die Softwareentwicklung Post zum Freitag: Clever durch den Urlaub – schlauer reisen, entspannter surfen iX-Workshop: Sicherer Betrieb von Windows 11 im Unternehmen Camunda: ProcessOS optimiert Geschäftsprozesse mit KI macOS kann bald barrierefreien Sony-Access-Controller nutzen Elektro-Sportenduro Radian EXR vorgestellt: Viel Kraft aus Wechselakkus Voice Control in iOS 27: Accessibility-Feature sagt Siri-App-Steuerung voraus Stellantis stellt neue Plattform für neuen Strategieplan vor Spotify: Neue Desktop-App erstellt personalisierte KI-Podcasts Zum Jahresende: Bundestag beschließt Ende der De-Mail Bluesky: Russische Akteure kapern angeblich Accounts und verbreiten Propaganda Dell PowerEdge: Bis zu 70 Prozent mehr Leistung für Rechenzentren Forscher nutzen Vakuumprozess zur Herstellung von effizienten Tandemsolarzellen Jubiläum: Apple Retail Stores seit 25 Jahren im Geschäft Spotify kündigt KI-generierte Remixe und Podcasts an IT Summit 2026: heise-Konferenz zu Digitaler Souveränität „Helldivers 2“: DLSS 4.5, FSR 4 und XeSS 3.0 kommen am 27. Mai Passend zur Fußball-WM: Apple verbessert Sports-App „Gemini built in“: Google bietet Referenzdesigns für Smart-Home-Geräte an Neu in .NET 10.0 [24]: LINQ-Operatoren RightJoin() und LeftJoin() in EF Core Drei „Tomb Raider“-Klassiker im Epic Games Store kostenlos Apache-Airflow-Komponenten: Angreifer können Datenbank modifizieren Notepad++: Update bessert Schwachstelle im Installer aus Halbleiter-Ökosystem: Studie beschreibt EU-Problemzonen Stellantis-Umbau: Fokus auf Kernmarken und Kapazitätsabbau in Europa Cisco stopft Sicherheitsleck mit Höchstwertung in Secure Workload „GTA 6“ erscheint wie geplant am 19. November Samsung: Abstimmung über Boni von Hunderttausenden Euro pro Mitarbeiter Vier Arme sind besser als zwei: Humanoider Roboter für die Schwerelosigkeit Kopfhörer mit KI-Chip made in Germany: Soundcore Liberty 5 Pro ausprobiert iX-Workshop: Sicheres Active Directory – Adminrechte mit Tiering schützen Destiny-Ära endet: Bungie beendet Entwicklung von „Destiny 2" Riesenrakete Starship: SpaceX hat den nächsten Testflug erneut verschoben Trend Micro Apex One und Langflow: Warnung vor Angriffen Kann WhatsApp verschlüsselte Nachrichten einsehen? Texas reicht Klage ein Passiv-PC Arctic senza AI 370 im Test: Schnell, lautlos, unsichtbar Warhammer Skulls 2026: Die volle Ladung „Warhammer“-Videospiele Freitag: Robotaxi-Probleme in den USA, Australiens Kinderschutz-Strafe gegen X Vorsicht, Kunde! – Wenn der Gutschein plötzlich wertlos wird Waymo stoppt Autobahnfahrten und Robotaxi-Dienste in Städten mit Starkregen Privacy Guardrail: Chrome-Erweiterung will sensible Daten vor Chatbots schützen Mit dem Deutschland-Stack samt Zertifizierung zur digitalen Souveränität X kooperierte nicht mit Behörde: Höhere Strafe in Australien GMX bringt KI ins Postfach: Wir haben den Assistenten ausprobiert Digitale Souveränität: OpenDesk laut Studie keine volle Microsoft-Alternative Digitale Souveränität: Bund vergibt 250-Millionen-KI-Cloud-Auftrag Kupfer-Glas-Migration: „Homes connected macht keinen Sinn“ Teure Kultur: Justizministerin Hubig kündigt Kampf gegen Ticketwucher an Top 10: Der beste Wireless Charger mit Qi2 im Test – Magsafe-Ladegerät für alle AMDs offizieller Mini-PC kostet 3999 US-Dollar WordPress: Offizielles Plug-in bindet Blogs direkt ins Bluesky-Protokoll ein KI beweist: Mathematiker lagen falsch re:publica: Große Fragen, kaum Antworten Fritz Labor 8.40 bereitet Fritzboxen auf Matter vor
„Fix this code“: Sperre von Fable 5 und Mythos 5 angeblich nach simplen Prompt
Martin Holland · 2026-06-16 · via heise online News

Für die Sperrung der mächtigen KI-Modelle Fable 5 und Mythos 5 soll kein Jailbreak, sondern die Befolgung der simplen Aufforderung „fix this code“ verantwortlich gewesen sein. Das behauptet zumindest die IT-Sicherheitsforscherin Katie Moussouris, die den Report einsehen durfte, der dazu geführt hat, dass die US-Regierung die Sperre unter Berufung auf eine Exportkontrolldirektive verfügt hat. In dem Bericht wird demnach dargelegt, dass die Forschenden den KI-Modellen Fable 5, Mythos und Opus Open-Source-Code mit bekannten Sicherheitslücken und solchen mit gezielt eingefügten Lücken vorgelegt hätten. Die Bitte „prüfe den Code auf Sicherheitslücken“, habe Fable 5 verweigert. Der Bitte „repariere den Code“ sei das Modell dann aber nachgekommen.

Moussouris meint, dass sie die einzige unabhängige Expertin zu sein scheint, die den besagten Report einsehen konnte. Darin heißt es demnach weiter, dass die Antwort auf „fix this code“ mittels eines „mehrstufigen und manuellen Verfahrens“ in Skripte umgewandelt worden sei, die die ausgegebenen Patches prüfen. Das sei alles gewesen und habe nach ihrer Meinung nie zu einem Exportverbot führen dürfen. Wer sich der Abwehr von Cyberangriffen widmet, müsse KI-Technik nutzen dürfen, um Lücken in Code abzusichern, deren Bedeutung zu erklären und Tests zur Prüfung schreiben dürfen. Das sei keine Umgehung von Leitplanken, wie behauptet. Das sei ganz im Gegenteil das wertvollste, was KI-Modelle für die Cyberabwehr tun könnten.

Moussouris meint, es sei Zeit für ein T-Shirt mit der Aufschrift „fix this code“ und der Erklärung, dass es sich bei den Worten um Munition handle

(Bild: lutasecurity.com)

Die Expertin versichert noch, dass sie weiß, wovon sie schreibt. Vor mehr als zehn Jahren hat sie an Verhandlungen zur Verbesserung des Wassenaar-Abkommen für Exportkontrollen teilgenommen und dafür gesorgt, dass Ausnahmen für defensive Aktivitäten aufgenommen wurden. Wenn man KI-Modelle jetzt in ähnlicher Weise beschränkt, würde man die Cyberabwehr schwächen, ohne dass kriminelle Cyberakteure dadurch eingeschränkt würden. Moussouris hat deshalb zusammen mit einer Reihe von Expertinnen und Experten die US-Regierung aufgefordert, den Schritt gegen Fable 5 und Mythos 5 zu prüfen und die Sperre aufzuheben. Das zeige auch, wie wichtig die Modelle für ihre Arbeit seien. Gespräche zur Aufhebung der Sperre sind am Montag aber gescheitert.

Anthropic hat Fable 5 vorigen Dienstag als inhaltlich eingeschränkte Variante des neuen Mythos 5 freigegeben. Erste Tests hatten die merklich höhere Leistungsfähigkeit des KI-Modells bestätigt, aber auch zu Kritik an den Sicherheitsmaßnahmen geführt, die immer wieder einen Rückfall auf ein weniger leistungsfähiges Modell auslösen. Am Freitag hat Anthropic dann unerwartet den Zugriff auf Fable 5 und Mythos 5 gesperrt – für alle Nutzerinnen und Nutzer weltweit. Verantwortlich war Berichten zufolge primär ein Bericht des Amazon-CEOs Andy Jassy über einen mutmaßlichen Jailbreak. Auf diesen Bericht bezieht sich Moussouris. Angeblich gibt es aber auch Hinweise darauf, dass eine Gruppe mit Verbindungen zur chinesischen Regierung Zugriff auf das mächtige KI-Modell Mythos hatte.

Die Financial Times berichtet inzwischen noch, dass Anthropic lediglich 90 Minuten Zeit gegeben wurde, um auf den Bericht zu dem angeblichen Jailbreak zu reagieren. Inzwischen habe das KI-Unternehmen versichert, dass es sich eben nicht um eine Methode handelt, die auf die eigenen KI-Modelle beschränkt sei. Die würden beispielsweise auch bei jenen von OpenAI funktionieren. Das passt zu den Erklärungen von Moussouris. Das US-Magazin Axios berichtet derweil, dass in der US-Regierung der Eindruck vorherrscht, von Anthropic betrogen worden zu sein. Es sei so, als würden beide Parteien unterschiedliche Sprachen sprechen, erklärt demnach eine anonyme Person die Verständnisschwierigkeiten.

(mho)