SWE-rebench neueste Rangliste: Chinesische KI-Modelle belegen die ersten vierzehn Plätze, GLM-5 rangiert auf Platz drei

Gate News Meldung, 25. März: Der SWE-rebench Benchmark-Wartungsteamleiter Ibragim veröffentlichte am 23. März die Aktualisierung der Rangliste. SWE-rebench ist ein monatlicher Echtzeit-Benchmark, der neue Software-Engineering-Aufgaben von GitHub extrahiert. Das Modell kann die Aufgaben nicht im Voraus optimieren. Mit diesem Update wurden die vorherigen Demonstrationsbeispiele und die 80-Schritte-Beschränkung entfernt, außerdem wurden unterstützende Bewertungsaufgaben hinzugefügt.

Die Top 10 der neuesten Rangliste: 1. Claude Opus 4.6 (65,3%); 2. GPT-5.2 medium (64,4%); 3. GLM-5 (62,8%); 4. GPT-5.4 medium (62,8%); 5. Gemini 3.1 Pro Preview (62,3%); 6. DeepSeek-V3.2 (60,9%); 7. Claude Sonnet 4.6 (60,7%); 8. Claude Sonnet 4.5 (60,0%); 9. Qwen3.5-397B-A17B (59,9%); 10. Step-3.5-Flash (59,6%).

Das Open-Source-Modell GLM-5 von Zhipu AI (MIT-Lizenz) belegt mit 62,8% den dritten Platz und ist das höchstplatzierte Open-Source-Modell in der Rangliste. Vier chinesische Modelle sind unter den Top Ten vertreten: Neben GLM-5 auch DeepSeek-V3.2 (Platz 6), Qwen3.5-397B-A17B von Alibaba Tongyi Qianwen (Platz 9) und Step-3.5-Flash (Platz 10). Li Zixuan, Leiter von Zhipu Z.ai Global, sagte, dass bei der letzten SWE-rebench-Aktualisierung alle chinesischen Modelle außerhalb der Top Ten lagen.

Disclaimer: The information on this page may come from third parties and does not represent the views or opinions of Gate. The content displayed on this page is for reference only and does not constitute any financial, investment, or legal advice. Gate does not guarantee the accuracy or completeness of the information and shall not be liable for any losses arising from the use of this information. Virtual asset investments carry high risks and are subject to significant price volatility. You may lose all of your invested principal. Please fully understand the relevant risks and make prudent decisions based on your own financial situation and risk tolerance. For details, please refer to Disclaimer.

Verwandte Artikel

Koreanische-Won-Konten machen 30% des globalen Kryptokassahandels aus, nur noch hinter dem US-Dollar

Laut Cointelegraph machten Won-Handelskonto in Korea am 6. Mai rund 30% des weltweiten Volumens beim Handel mit Krypto an Kassa aus und waren damit nach dem US-Dollar der zweitgrößte Fiat-Markt.

GateNews12Std her

Multicoin Capital sperrt heute 83,9 Millionen US-Dollar in HYPE-Tokens und wird zum Top-3-Inhaber

Laut On-Chain-Daten hat die Investmentfirma Multicoin Capital heute 1,96 Millionen HYPE-Token eingesetzt, die einem Wert von etwa 83,9 Millionen US-Dollar entsprechen. Die Transaktion bestätigte außerdem Multicoins Verbindung zum „Galaxy“-Wallet-Cluster, der 4,11 Millionen HYPE hält (ungefähr 176 Millionen US-Dollar). Multicoin hat nun

GateNews16Std her

Strebt danach, 15.000 Bitcoin-Bestände bei einem Kauf im Wert von 33,9 Millionen US-Dollar zu übertreffen

Strive, Inc. (NASDAQ: ASST), das in Dallas ansässige Unternehmen, das gemeinsam von Vivek Ramaswamy mitgegründet wurde, gab am Montag bekannt, dass sein Bitcoin-Bestand die Schwelle von 15.000 BTC überschritten hat, nachdem es zusätzlich 444 Bitcoin im Wert von rund 33,9 Millionen US-Dollar gekauft hat, wie aus einem Beitrag von CEO Matt Cole auf X und einer

CryptoFrontier20Std her

MicroStrategy hat in diesem Jahr 63.410 BTC hinzugewonnen und hält nun 3,9% des gesamten Bitcoin-Angebots

Laut Michael Saylor auf X hat MicroStrategy in diesem Jahr 63.410 BTC hinzugewonnen, bewertet mit ungefähr 5,1 Milliarden US-Dollar. Das Unternehmen hält derzeit 3,9% der gesamten Bitcoin-Netzwerkversorgung.

GateNews05-05 13:00

Franklin Templeton FOBXX erreicht 19,8 Milliarden US-Dollar auf Stellar und wird zum zweitgrößten RWA

Laut Cointelegraph erreichte der FOBXX-Fonds von Franklin Templeton am 1. Mai 19,8 Milliarden US-Dollar an Vermögenswerten und wurde damit zum zweitgrößten Real-World-Asset-(RWA)-Fonds im Netzwerk von Stellar.

GateNews05-01 00:54
Kommentieren
0/400
Keine Kommentare