阿里開放下一代旗艦Qwen3.6-Max-Preview預覽,主打智能體編程

robot
摘要生成中
ME News 消息,4 月 20 日(UTC+8),據 動察 Beating 監測,阿里千問團隊發布 Qwen3.6-Max-Preview,定位是下一代旗艦模型的早期預覽版,接替現有的 Qwen3.6-Plus。用戶可在 Qwen Studio(chat.qwen.ai)直接對話體驗,隨後通過阿里雲百煉以 qwen3.6-max-preview 的模型名開放 API 調用;接口兼容 OpenAI 的 chat completions、responses 規範以及 Anthropic 的協議。 這一版主要面向智能體編程(agentic coding),讓模型像程序員一樣自己寫代碼、運行、看報錯、調用工具,完成多步驟編程任務。官方相對前代 Qwen3.6-Plus 給出的提升集中在編程:SkillsBench +9.9、SciCode +10.8、NL2Repo +5.0、Terminal-Bench 2.0 +3.8 分;世界知識與工具調用格式遵循另三項各有 2.3 到 5.3 分的提升。官方自稱在 SWE-bench Pro、Terminal-Bench 2.0、SciCode 等六項編程基準上取得最高分,其中 QwenClawBench、QwenWebBench 從命名看是千問自建評測集,需與公開基準分開看。 API 這一側還新增了 preserve_thinking 選項:打開後消息會保留前幾輪的 thinking 內容。推理模型默認每輪只把「本輪思考」返回一次,多輪智能體對話裡上下文缺了前面幾步的思考,模型重新規劃時容易走回頭路或忘記自己已經試過什麼,這個開關補的就是這個斷檔。 (來源:BlockBeats)
查看原文
此頁面可能包含第三方內容,僅供參考(非陳述或保證),不應被視為 Gate 認可其觀點表述,也不得被視為財務或專業建議。詳見聲明
  • 打賞
  • 回覆
  • 轉發
  • 分享
回覆
請輸入回覆內容
請輸入回覆內容
暫無回覆