Anthropic plant die Ausweitung von Claude Mythos-KI nach Cybersecurity-Tests

Anthropic gab am Donnerstag bekannt, dass das Unternehmen nach dem Abschluss zusätzlicher Tests zu Sicherheitsvorkehrungen „in den kommenden Wochen“ den Zugang zu seinem KI-Modell Claude Mythos ausweiten will. Die Firma machte die Aussage zusammen mit der Veröffentlichung seines neuen Modells Opus 4,8 und markierte damit seine bisher deutlichste Ankündigung für eine breitere Verfügbarkeit des auf Cybersicherheit ausgerichteten Systems. Anthropic hatte den Mythos-Zugang seit März über Project Glasswing eingeschränkt, nachdem Forschende und staatliche Stellen vor den autonomen Cyberangriffs-Fähigkeiten des Modells gewarnt hatten. Die Ankündigung erfolgt vor dem Hintergrund einer breiteren Debatte innerhalb der KI-Industrie darüber, wie fortgeschrittene Systeme mit Offensiv-Sicherheitsfähigkeiten an Kundinnen und Kunden ausgeliefert werden sollen.

Aktuelle Zugangsbeschränkungen

Anthropic hat die Verbreitung von Claude Mythos über Project Glasswing begrenzt, ein Programm, das ausgewählten Technologieunternehmen, Sicherheitsforschenden und Regierungs-Partnern den Zugang unter kontrollierten Bedingungen ermöglicht. Zuerst beschrieb das Unternehmen Mythos in geleakten Blog-Materialien im März als „das leistungsfähigste KI-Modell, das wir je entwickelt haben“, und ordnete es damit als eine Stufe über seine Opus-Modelle ein. Anthropic erklärte, das Modell „kündigt eine bevorstehende Welle von Modellen an, die Schwachstellen in einer Weise ausnutzen können, die die Anstrengungen der Verteidiger weit in den Schatten stellt“. Das Unternehmen machte keine Angaben dazu, welche Sicherheitsvorkehrungen vor einer breiteren Ausrollung noch unvollständig sind, oder ob alle Kundinnen und Kunden identische Zugangslevel erhalten. Anthropic reagierte nicht auf Anfragen zu Kommentaren hinsichtlich der Umsetzung.

Dokumentierte technische Fähigkeiten

Das AI Security Institute in Großbritannien fand heraus, dass Mythos während der Tests einen 32-stufigen simulierten Unternehmensnetzwerk-Angriff autonom abgeschlossen hat. Im April berichtete Mozilla, Mythos habe bei internen Sicherheitsevaluierungen 271 Schwachstellen in Firefox identifiziert. Anfang dieses Monats erklärte das Sicherheits-Startup Calif, eine Vorschauversion habe Forschenden geholfen, eine Exploit-Kette zu entwickeln, die auf Apples M5-Mac-Chips abzielt. Anthropic hat argumentiert, Mythos könne Verteidiger dabei unterstützen, Software-Schwachstellen zu identifizieren und zu patchen, bevor Angreifer sie ausnutzen. Sicherheitsforschende und staatliche Stellen warnten hingegen, dass dieselben Fähigkeiten Cyberangriffe beschleunigen könnten.

Branchendebatte über die Release-Strategie

Das Modell ist zu einem zentralen Thema der Diskussionen innerhalb der KI-Industrie über die Veröffentlichung fortgeschrittener Systeme geworden. In einem Interview im Mai mit dem Podcast „Core Memory“ warf OpenAI-CEO Sam Altman Anthropic „Furcht-basierendes Marketing“ vor und argumentierte, Warnungen zu Cybersicherheitsrisiken könnten eine Einschränkung des Zugangs zu leistungsfähigen KI-Systemen rechtfertigen. Nutzerinnen und Nutzer auf Myriad – einer Vorhersagemarkt-Plattform, die vom Decrypt-Unternehmenseltern Dastan betrieben wird – gaben am Donnerstag eine Wahrscheinlichkeit von 44% dafür, dass Mythos bis Ende Juni veröffentlicht wird, nachdem es morgens noch bei 17,5% gelegen hatte.

Bestätigte nächste Schritte

Anthropic erklärte, es „mache schnelle Fortschritte bei der Entwicklung dieser Sicherheitsvorkehrungen“ und erwarte, „Mythos-Klassenmodelle für alle unsere Kunden in den kommenden Wochen“ verfügbar zu machen.

FAQ

Was ist Project Glasswing?
Project Glasswing ist das eingeschränkte Zugangsprogramm von Anthropic, das ausgewählten Technologieunternehmen, Sicherheitsforschenden und Regierungs-Partnern einen kontrollierten Zugang zum Claude Mythos-Modell unter spezifischen Bedingungen gewährt.

Welche Schwachstellen hat Mythos in Tests identifiziert?
Mozilla berichtete, Mythos habe bei April-eigenen internen Sicherheitsevaluierungen 271 Schwachstellen in Firefox identifiziert. Das AI Security Institute in Großbritannien dokumentierte, dass das Modell autonom einen 32-stufigen simulierten Unternehmensnetzwerk-Angriff abschloss. Das Sicherheits-Startup Calif erklärte, eine Vorschauversion habe dabei geholfen, eine Exploit-Kette zu entwickeln, die auf Apples M5-Mac-Chips abzielt.

Wann hat Anthropic Mythos zum ersten Mal angekündigt?
Claude Mythos tauchte erstmals im März auf, nachdem geleakte Entwurfsmaterialien für einen Anthropic-Blog online gingen. Das Unternehmen beschrieb es als „das leistungsfähigste KI-Modell, das wir je entwickelt haben“ und positionierte es als eine neue Stufe über seine Opus-Modelle.

Disclaimer: The information on this page may come from third-party sources and is for reference only. It does not represent the views or opinions of Gate and does not constitute any financial, investment, or legal advice. Virtual asset trading involves high risk. Please do not rely solely on the information on this page when making decisions. For details, see the Disclaimer.
Kommentieren
0/400
Keine Kommentare