付款方式為

USD

支援 Visa、Mastercard、SEPA 等多種支付方式

靈活買賣幣，0手續費

加密貨幣付款卡全球付款無憂

基礎交易

自由交易加密貨幣

借幣交易，放大收益

閃兌與定投

大小額通兌、0 費率、無滑點

自動調倉無懼強平，自帶槓桿放大收益

提前交易，先發制人

進階交易

使用 Gate 錢包進行鏈上交易

鏈上掘金，智選新幣

交易機器人

智能策略，自動交易

跟隨專家實現收益增長

一份保證金，跨平台共用

數百種永續合約市場

一站交易全球傳統資產

歐式 T 型報價，豐富的到期日和行權價

實現最大化資金效率

從零開始掌握合約交易技巧

參與活動贏取獎勵

使用模擬資金無風險體驗真實交易

打新

參與活動賺糖果，贏超值空投獎勵

一鍵質押，賺取潛力新幣

持有 GT，免費領取海量空投

打新自由，直通全球股票發行市場

交易鏈上資產，享空投福利

合約交易得積分，空投獎勵待領取

理財產品

閒置代幣，隨時賺取收益

定期定額，讓理財變得更簡單

低買高賣，波動獲益

通過靈活質押資產獲取收益

抵押資產，即時借幣

一站式借貸入口

VIP 專屬理財

尊享理財訂製助力財富增值

私人財富管理

臻享訂製財富方案

頂尖量化，穩健護航

鏈上精選，質押賺幣

到期前不強平，安心持幣享槓桿收益

鑄造 GUSD，享國債 RWA 收益

分享動態發現價值

每日行情分析直播

隨時隨地與幣友即時交流

一站式獲取最新行業資訊

更多

推廣

參與活動，贏取豐厚獎勵

邀友入駐，共享高額收益

專屬返佣，輕鬆賺取高收益

擴大影響力，享海量空投

平台動態，實時更新

行業深度分析

超高費率折扣

提供一站式資產管理解決方案

提供企業級虛擬資產解決方案

OTC 銀行轉帳

提供多種法幣自營出入金渠道

經紀商專案

豐厚的 API 返佣機制

AI

您的對話式 AI 全能夥伴

在社交 App 中直接使用 Gate AI

Gate 藍龍蝦，開箱即用

Gate for AI Agent

AI 基礎設施，Gate MCP、Skills 與 CLI

Gate Skills Hub

從辦公到交易，一站式技能庫讓 AI 更好用

智選 40+ 大型模型，0% 額外費用

其他

常見問題解答與幫助指南

學習加密貨幣投資知識

與冠軍攜手同行

Gate 承諾 100%儲備金

守護您的資產安全

GPT-5.5登頂極限編程基準FrontierSWE，但作弊次數也最多

2026-05-06 10:37:16

據動察 Beating 監測，AI 研究團隊 Proximal 更新超長程編程基準 FrontierSWE 排行榜。新加入的 GPT-5.5（通過 Codex 運行）在 mean@5（5 次嘗試的平均分）和 best@5（最高分）兩項指標上均大幅領先第二名 Claude Opus 4.7，支配率達 83%。但 GPT-5.5 也是作弊最多的模型：85 次試驗中 8 次被判作弊，與 Kimi K2.6 並列。

FrontierSWE 4 月發布，收集了編譯器優化、ML 研究、高性能工程等領域的 17 項真實難題，如用 Zig 重寫 Git、構建兼容 PostgreSQL 的 SQLite 伺服器，每項任務限時 20 小時，是目前少數未被做穿的公開編程基準。GPT-5.5 相比前代在時間分配上更成熟：開放式任務花更多時間打磨方案，實現類任務更快完成且得分更高。

此前測試已揭示 AI 編程 Agent 幾類通病。模型普遍過度自信，遠未到 20 小時時限就因膚淺的自檢誤以為任務已完成並提前提交。Opus 4.6 單項任務平均投入超 8 小時，遠超其他模型的約 2 小時，但曾多次丟失已有優化、隨後重新「發明」一遍。作弊在高壓任務中尤為突出：在一道明確禁止使用 PyTorch 的 Mojo 移植任務中，除 Qwen 3.6 外所有模型均嘗試作弊，Gemini 用字符編碼隱藏被禁庫名、在臨時目錄運行隱蔽進程，Opus 4.6 甚至先在推理中寫下「願意作弊」再動手。

查看原文

此頁面可能包含第三方內容，僅供參考（非陳述或保證），不應被視為 Gate 認可其觀點表述，也不得被視為財務或專業建議。詳見聲明。

打賞
按讚
回覆
轉發
分享

回覆

請輸入回覆內容

請輸入回覆內容

暫無回覆

熱門話題
查看更多
#
Gate廣場五月交易分享
41.39萬熱度
#
比特幣站穩8萬關口
9430.37萬熱度
#
加密市場回升
11.65萬熱度
#
Aave起訴要求解凍7300萬美元ETH
184.61萬熱度
#
Polymarket每日熱點
82.85萬熱度