OpenAI Codex 团队修复 OpenClaw 身份验证错误,显著改善代理行为

Gate News 消息,4 月 23 日——OpenAI Codex 团队正专注于优化 OpenClaw 中的 OpenAI 模型体验,Codex 工程负责人 Tibo Sottiaux 正与 OpenClaw 创作者 Peter Steinberger 协作。Codex 产品负责人 Nik Pash 发现了一个关键身份验证缺陷:当 OpenClaw 配置为使用带有 OpenAI 模型的 Codex harness 时,身份验证过程失败,系统会静默回退到 Pi harness,导致用户误以为 Codex harness 正常工作,但实际上并未运行。

Pash 提交了两个拉取请求来解决该问题:一个用于修复身份验证桥接,另一个用于防止静默回退。这些改进完全来自于切换控制 OpenClaw 与模型 API 通信方式的底层运行时适配器 (harness),而代理的提示词以及更高层级的工作流逻辑保持不变。

修复前后,代理行为呈现明显差异。使用 Pi harness 时,代理在每个心跳中进行浅层轮询:读取心跳文件、检查 Discord、返回 HEARTBEAT_OK,并忽略其他指令。有时它会推断需要执行的操作,但未能发起工具调用。切换到 Codex harness 后,代理进入完整的工作循环:读取工作区上下文、解析任务列表、检查代码库、执行编辑,并尝试进行验证。后续心跳能够继续推进进度,而不是重复工作。

news.article.disclaimer

btc.bar.articles

Google Jules รีแบรนด์เป็นแพลตฟอร์มพัฒนาผลิตภัณฑ์แบบเอเจนต์เชิงปฏิบัติการแบบครบวงจร เปิดรายชื่อรอสำหรับเวอร์ชันใหม่

ข้อความข่าวประตู 23 เมษายน — ทีม Jules ของ Google ประกาศเปิดรายชื่อรอสำหรับผลิตภัณฑ์เวอร์ชันใหม่ โดยปรับบทบาทของ Jules จากเอเจนต์สำหรับการเขียนโค้ดแบบอะซิงโครนัสเป็นแพลตฟอร์มพัฒนาผลิตภัณฑ์แบบเอเจนต์เชิงปฏิบัติการแบบครบวงจร ตามคำอธิบายอย่างเป็นทางการ แพลตฟอร์มที่อัปเกรดจะอ่านบริบทของทั้งผลิตภัณฑ์ได้

GateNews15 นาที ที่แล้ว

Perplexity เปิดเผย Web 搜索代理的后训练方法;基于 Qwen3.5 的模型在准确性与成本上优于 GPT-5.4

Perplexity 使用先用 Qwen3.5 模型进行 SFT,随后再用 RL,并借助多跳 QA 数据集与评分细则校验来提升搜索准确性与效率,从而实现同类最佳的 FRAMES 表现。 摘要:Perplexity 的面向网络搜索代理的后训练流程,将监督微调 (SFT) 与通过 GRPO 算法进行在线强化学习 (RL) 结合。SFT 用于强化遵循指令与语言一致性;RL 则通过 GRPO 优化搜索准确性。RL 阶段使用专有的多跳可验证问答数据集以及基于评分细则的对话数据,以防止 SFT 漂移,并配合奖励门控与组内效率惩罚。评估显示,Qwen3.5-397B-SFT-RL 在 FRAMES 上取得顶级表现:单次工具调用准确率 57.3%,四次调用准确率 73.9%,成本为每次查询 $0.02,且在这些指标上优于 GPT-5.4 与 Claude Sonnet 4.6。定价基于 API,并且不包含缓存。

GateNews48 นาที ที่แล้ว

เปิด OpenAI สำหรับ ChatGPT Workspace Agents: ขับเคลื่อนด้วย Codex, แชร์ร่วมกันในทีม, บูรณาการกับ Slack

OpenAI เปิดตัว Workspace Agents ใน ChatGPT Business/Enterprise/Edu/Teachers เมื่อวันที่ 22 เมษายน โดยใช้ Codex ขับเคลื่อน ทำงานแบบคลาวด์ได้นานขึ้น แชร์ร่วมกันภายในทีม และสามารถทำงานแบบออฟไลน์ได้ สามารถตอบกลับอัตโนมัติบน Slack และจัดทำการออกใบแจ้งหนี้ รวมถึงดำเนินงานหลายขั้นตอนในเวิร์กโฟลว์ และรองรับการตั้งเวลา การทดลองใช้ฟรีสำหรับการดูตัวอย่างการวิจัยมีให้จนถึงวันที่ 6 พฤษภาคม หลังจากนั้นจะเรียกเก็บค่าบริการแบบ credit-based โดยราคาจะประกาศในภายหลัง แข่งขันร่วมกับ GoogleGeminiEnterpriseAgentPlatform และ AnthropicClaudeCowork ทั้งสามเจ้าโฟกัสที่ตัวแทนระดับองค์กร แต่การวางตำแหน่งแตกต่างกันไป

ChainNewsAbmedia2 ชั่วโมง ที่แล้ว

Google Cloud Next 2026: เปิดตัวแพลตฟอร์มตัวแทนสำหรับองค์กรของ Gemini ด้วยเงิน 750 ล้านดอลลาร์สหรัฐ เพื่อช่วยให้ที่ปรึกษานำไปใช้งานได้จริง

Google Cloud ประกาศแพลตฟอร์ม Gemini Enterprise Agent Platform ในงาน Cloud Next 2026 โดยผสานตัวเลือกโมเดล การสร้างเอเจนต์ DevOps การออร์เคสเตรชัน และการควบคุมความปลอดภัยระดับองค์กร และเปิดตัวกองทุนมูลค่า 750 ล้านดอลลาร์สหรัฐเพื่อช่วย McKinsey, Accenture, Deloitte ในการปรับใช้เอเจนต์ระดับองค์กร แพลตฟอร์มนี้มาพร้อม Ironwood TPU, A2A และ MCP สร้างโซลูชันแบบฟูลสแตกของตนเองและช่องทางสำหรับที่ปรึกษา เพื่อรับมือกับ OpenAI Operator และ Anthropic Claude เวอร์ชันองค์กร

ChainNewsAbmedia2 ชั่วโมง ที่แล้ว

Google ขยาย Wiz Cloud Security ไปยัง AWS, Azure และ Google Cloud

Google ประกาศคุณลักษณะความปลอดภัยใหม่และการบูรณาการที่ลึกยิ่งขึ้นของ Wiz ซึ่งเป็นบริษัทรักษาความปลอดภัยบนคลาวด์ของอิสราเอลที่บริษัทเข้าซื้อมาในราคา US$32 billion โดยจะขยายไปทั่ว Google Cloud และแพลตฟอร์มคู่แข่งในงาน Cloud Next '26 ของบริษัท บริษัทได้เปิดตัวตัวแทน AI จำนวนสามตัวสำหรับงานปฏิบัติการด้านความปลอดภัยในโหมดทดลอง ซึ่งออกแบบมาเพื่อ

CryptoFrontier2 ชั่วโมง ที่แล้ว

ตัวแทนค้นพบช่องโหว่ที่ขับเคลื่อนด้วย AI ของ 360 พบการโจมตีแบบซีโรเดย์เกือบ 1,000 ราย แย่งการแข่งขันกับ Mythos

ตัวแทนขับเคลื่อนด้วย AI ของ 360 Digital Security อ้างว่าพบช่องโหว่ใหม่ประมาณ 1,000 ราย รวมถึงใน Office และ OpenClaw ปัจจุบัน AI เป็นแกนหลักของการค้นพบและการเตรียมสายโซ่การโจมตีด้วยช่องโหว่ (exploit-chain) เทียบเคียง Mythos บทคัดย่อ: รายงานที่อ้างอิงโดย Bloomberg ระบุว่า 360 Digital Security Group 的 Vulnerability Discovery Agent ที่ขับเคลื่อนด้วย AI ได้ระบุช่องโหว่ที่ไม่เคยรู้มาก่อนเกือบ 1,000 รายในช่วงไม่กี่เดือนที่ผ่านมา รวมถึงใน Microsoft Office และเฟรมเวิร์ก OpenClaw บริษัทกล่าวว่า AI ได้กลายเป็นกลไกหลักของการค้นพบช่องโหว่ และได้ประกาศเครื่องมือ AI เพื่อเร่งการสร้าง exploit chain Benincasa อธิบายว่า 360 เป็นคู่แข่งของ Mythos ของ Anthropic โดยอิงจากการตรวจสอบประกาศที่เป็นภาษาจีนของบริษัทโดย Natto Thoughts.

GateNews14 ชั่วโมง ที่แล้ว
แสดงความคิดเห็น
0/400
ไม่มีความคิดเห็น