惯性聚合 高效追踪和阅读你感兴趣的博客、新闻、科技资讯
阅读原文 在惯性聚合中打开

推荐订阅源

H
Help Net Security
T
ThreatConnect
SecWiki News
SecWiki News
F
Future of Privacy Forum
AWS News Blog
AWS News Blog
C
Cisco Blogs
A
Arctic Wolf
Vercel News
Vercel News
The GitHub Blog
The GitHub Blog
Scott Helme
Scott Helme
V
V2EX
博客园 - 叶小钗
阮一峰的网络日志
阮一峰的网络日志
K
Kaspersky official blog
G
Google Developers Blog
freeCodeCamp Programming Tutorials: Python, JavaScript, Git & More
P
Privacy International News Feed
C
Cyber Attacks, Cyber Crime and Cyber Security
N
News | PayPal Newsroom
Schneier on Security
Schneier on Security
NISL@THU
NISL@THU
Microsoft Azure Blog
Microsoft Azure Blog
量子位
The Hacker News
The Hacker News
Stack Overflow Blog
Stack Overflow Blog
Security Latest
Security Latest
M
Microsoft Research Blog - Microsoft Research
Google Online Security Blog
Google Online Security Blog
博客园_首页
C
CXSECURITY Database RSS Feed - CXSecurity.com
I
InfoQ
Google DeepMind News
Google DeepMind News
Y
Y Combinator Blog
The Cloudflare Blog
Microsoft Security Blog
Microsoft Security Blog
Martin Fowler
Martin Fowler
Cisco Talos Blog
Cisco Talos Blog
钛媒体:引领未来商业与生活新知
钛媒体:引领未来商业与生活新知
T
Troy Hunt's Blog
F
Fox-IT International blog
S
Security @ Cisco Blogs
博客园 - 司徒正美
cs.CV updates on arXiv.org
cs.CV updates on arXiv.org
C
Comments on: Blog
Threat Intelligence Blog | Flashpoint
Threat Intelligence Blog | Flashpoint
L
LINUX DO - 最新话题
GbyAI
GbyAI
Project Zero
Project Zero
腾讯CDC
T
Tailwind CSS Blog

heise online News

PV-Vorhersage für Home Assistant: E-Auto und smarte Geräte effizient laden Sensoren und KI sollen marode Brücken vor Sperrung retten iX-Workshop: BCM und IT-Notfallplanung – vorbereitet für den Ernstfall Crowdfunding: Eine Milliarde US-Dollar für „Star Citizen“ und „Squadron 42“ heise+ | BMW iX3: E-SUV im Test – mehr Reichweite als ich Dienstag: Papst thematisiert KI, Trump stoppt wichtige KI-Verordnung Delivery Hero: Übernahmepoker treibt Aktie weiter nach oben Tether: Offizieller Stablecoin in Georgien vor der Einführung Iraner sollen wieder das Internet nutzen dürfen Top 10: Carplay-Wireless-Adapter im Test – iPhone im Auto kabellos nutzen Meta testet Reddit-Konkurrenz: Neue App „Forum“ für Facebook-Gruppen Vodafone: Uploads mit bis zu 200 Mbit/s für einige Xiaomi-Geräte Kaufberatung und Test: Elektro-Dreirad für Erwachsene und Senioren ab 1300 Euro Festivalfotografie vorbereiten: Tipps zu Planung und Equipment Stromnetze für die Energiewende: Milliardeninvestitionen in Schleswig-Holstein Erste Enzyklika: Papst fordert Richtlinien für Umgang mit KI Digitale Rasterfahndung: Wenn Bilder im Netz Leben zerstören heise-Angebot: EU AI Act: Was bis August 2026 in Unternehmen erledigt sein muss Nächste Woche: heise security Tour Online zu KI, Identität und Lieferketten Leben und spielen lassen: Die fünf besten „James Bond“-Games heise-Angebot: iX-Workshop: KI-Methoden und -Werkzeuge für die IT-Sicherheit IT-Branche: HR-Trends verschieben sich Wie 2021 bei LLMs: Google-Forscher über die Zukunft der Weltmodelle „Fabula Rasa“ ist ein faszinierender Ausblick auf KI-gestütztes Storytelling Mehr als Requisiten: Click Boom Flash # 63 „Kameras und Fotos im Kinofilm" Top 10: Der beste Offroad-E-Scooter – Top-Federung & Riesen-Akku ab 500 Euro Papst veröffentlicht Enzyklika zu Künstlicher Intelligenz Künstliche Intelligenz bei Gericht: Wie die Justiz digital aufrüstet Trump stoppt wichtige Verordnung für KI-Modelle Starship V3: Erfolgreicher Testflug mit kleinen Makeln Musik-Business: Universal schließt Tech-Pakt mit TikTok gegen unautorisierte KI Acemagic Retro X5 im Test: Mini-PC mit Ryzen AI 9 im Design des Nintendo NES Streit über Zukunft von ENUM-Telefon-Domains Machine Learning mit Python – KI und Deep Learning in 5 Sessions erklärt Porsche-Chef Leiters plant umfassenden Konzernumbau Studie: KI bleibt oft im Testlauf stecken iX-Workshop: Grundlagen und Prinzipien eines modernen IT-Managements Missing Link: Aus für De-Mail – warum das „@“ das eingekringelte „e“ besiegte Top 10: Das beste Display für das Auto im Test BOS-Funk: ETSI standardisiert Funk für Behörden Repair-Cafés jubeln: Bundestag beschließt Ökodesign-Reform für Nachhaltigkeit Aus dem Weg! E-Scooter Navee UT5 Max mit Kuhfänger und brachialer Power im Test Google wehrt sich gegen Monopol-Urteil CERN-Rat beschließt Strategie-Update: FCC-ee soll LHC-Nachfolger werden Product Owner AI Day 2026: Konferenz und Workshop für KI im Produktmanagement Taskforce sieht keine Knappheit bei Kerosin Krankenhaus-IT: Geldmangel und schlechte Prozesse gefährden Digitalisierung „The Boroughs“: Opa entdeckt Stranger Things iX-Workshop: Lokales Active Directory gegen Angriffe absichern Google Pics und Tiger-Selfies – die Fotonews der Woche 21/2025 Developer-Häppchen fürs Wochenende – kleinere News der Woche Fitbit-App bekommt großes Update auf Version 5.0 und heißt jetzt Google Health Zwischen Wellen, Weite und Wissenschaft: Die Bilder der Woche 21 Sonnenenergie effizient speichern und nutzen | c’t uplink Cyberangriff auf Abrechnungsdienstleister betrifft viele Kliniken Lizenzstreit und Cloud-Zwang: Bambu Lab unter massivem Druck TV-Deals zur WM: Die besten Fernseher von OLED bis XXL zum Tiefstpreis Vom Postweg ins BundID-Konto: Bundestag stimmt für digitales Führungszeugnis Windows 11 ist ein kompletter Verkehrsunfall Europol legt VPN-Dienst lahm Nvidia will mit Vera-Prozessoren nach der CPU-Krone greifen Googles XR-Brillen auf der I/O: Project Aura & Prototyp ausprobiert Proxmox VE 9.2 mit Dynamic Load Balancer und Linux Kernel 7.0 Großstadt blockiert Überwachungssoftware Palantir Gelöscht und doch nicht weg: Signal speichert Nachrichten länger als erwartet SADAS: Neue Software warnt Fahrer vor Gefahrenzonen im Straßenraum Drei Fragen und Antworten: Wann sich KI-Coding wirklich rechnet Metas KI-Brillen helfen Blinden im Alltag – und werfen neue Fragen auf Navee XT5 Max im Test: Brachialer E-Scooter mit 2200 Watt ist Outdoor-Testsieger Fotoanbieter Portraitbox: Erpressung nach Sicherheitsvorfall? KI-Update: Google I/O-Fazit, Anthropic, Nvidia, Gehirn und KI-Parallelen Avatare und Augmented Reality: Apple schnappt sich kleines Start-up Won’t fix! – Teil 1: Warum Softwareschätzungen so zuverlässig falsch sind Virtual OS Museum: Über 1700 alte Betriebssysteme in einer VM Airbnb personalisiert App mit KI IT-Ausfälle immer teurer für große Unternehmen Betrug im App Store: Apple stoppt laut eigenen Angaben Milliarden-Verluste TGIQF: Das Quiz rund um Hubschrauber Verbraucherschützer fordern Schadensersatz für Nutzer bei Smart-Meter-Problemen Citroën kündigt Elektroauto mit dem Namen „2CV“ an Software Testing: So ändert Agentic Engineering die Softwareentwicklung Post zum Freitag: Clever durch den Urlaub – schlauer reisen, entspannter surfen heise-Angebot: iX-Workshop: Sicherer Betrieb von Windows 11 im Unternehmen Camunda: ProcessOS optimiert Geschäftsprozesse mit KI macOS kann bald barrierefreien Sony-Access-Controller nutzen Elektro-Sportenduro Radian EXR vorgestellt: Viel Kraft aus Wechselakkus Voice Control in iOS 27: Accessibility-Feature sagt Siri-App-Steuerung voraus Stellantis stellt neue Plattform für neuen Strategieplan vor Spotify: Neue Desktop-App erstellt personalisierte KI-Podcasts Zum Jahresende: Bundestag beschließt Ende der De-Mail Bluesky: Russische Akteure kapern angeblich Accounts und verbreiten Propaganda Dell PowerEdge: Bis zu 70 Prozent mehr Leistung für Rechenzentren Forscher nutzen Vakuumprozess zur Herstellung von effizienten Tandemsolarzellen Jubiläum: Apple Retail Stores seit 25 Jahren im Geschäft Spotify kündigt KI-generierte Remixe und Podcasts an heise-Angebot: IT Summit 2026: heise-Konferenz zu Digitaler Souveränität „Helldivers 2“: DLSS 4.5, FSR 4 und XeSS 3.0 kommen am 27. Mai Passend zur Fußball-WM: Apple verbessert Sports-App „Gemini built in“: Google bietet Referenzdesigns für Smart-Home-Geräte an Neu in .NET 10.0 [24]: LINQ-Operatoren RightJoin() und LeftJoin() in EF Core
Kampf dem KI-Training: Immer mehr Nachrichtenseiten sperren Wayback Machine aus
Martin Holla · 2026-05-26 · via heise online News

Im Kampf gegen die nicht genehmigte Nutzung von Inhalten für das Training von KI-Modellen gerät das Internet Archive immer mehr zwischen die Fronten und die Wayback Machine droht zum Kollateralschaden zu werden. Das legt eine Analyse des Nieman Journalism Lab an der Harvard University nahe, laut der immer mehr Nachrichtenseiten Crawler der Archivseite aussperren. Demnach schränken inzwischen mehr als 340 lokale Nachrichtenseiten „den Zugriff des Internet Archive auf ihre Artikel sowie deren Archivierung“ ein, aber auch überregionale und internationale Medien wie die New York Times beteiligen sich demnach. Europäische Medien finden sich ebenfalls auf der Liste, derzeit aber noch keine aus Deutschland.

Für die Analyse haben ein Autor und eine Autorin des Nieman Lab eine umfangreiche Datenbank von robots.txt-Dateien ausgewertet, die von Nachrichtenseiten in aller Welt stammen. Wenn darin eine oder mehrere Crawler ausgesperrt wurden, die vom Internet Archive stammen oder zu stammen scheinen, haben sie sie aufgenommen. Demnach wird der Archivierungsdienst hauptsächlich von Regionalzeitungen blockiert, die zu einem von fünf großen US-Medienhäusern gehören. Allein zwischen Januar und Mai ist die Zahl der Seiten, die die Wayback Machine aussperren, demnach um mehr als 50 Prozent gestiegen. Insgesamt sind es in der Stichprobe jetzt 382, bei der übergroßen Mehrheit handelt es sich um Lokal- und Regionalzeitungen.

Im Januar haben die Autoren Stimmen großer Medien zusammengetragen, in denen die Aussperrung des Internet Archive mit dem Versuch begründet wurde, die eigenen Inhalte KI-Modellen vorzuenthalten. Seit Monaten wird kritisiert, dass KI-Unternehmen alle möglichen Inhalte im Internet für das Training akquirieren und sich dabei auch nicht an Gepflogenheiten wie die robots.txt halten. Damit können Seitenbetreiber KI-Modelle eigentlich aussperren, dazu müssten sich die KI-Firmen aber daran halten. Das tun sie aber nicht. Aber selbst wenn sie das tun würden, wäre der Weg über die archivierten Inhalte bei der Wayback Machine aber ein Umweg, den immer mehr Verantwortliche nun verschließen wollen. Das hat zum Beispiel auch schon Reddit gemacht.

Die Wayback Machine ist zwar nur einer der Dienste des Internet Archive, aber wohl der bekannteste. Darin werden seit Jahrzehnten Internetseiten archiviert. Die Seite ist längst zur mit Abstand umfangreichsten Quelle geworden, in der sich die Entwicklung des Internets nachverfolgen lässt. Das Vorgehen war aber schon immer mit Konflikten verbunden, denn immer wieder sind dabei gegenläufige Interessen aufeinandergetroffen. Schon 2017 hatte das Internet Archive beispielsweise erklärt, Vorgaben in der robots.txt nicht mehr ausnahmslos befolgen zu wollen. Im Fall der jüngsten Aussperrungen scheint das aber der Fall zu sein, wie man etwa für die Seiten von El País oder Le Monde sehen kann.

(mho)