根据 Anthropic 官方模型退役文件,Claude Haiku 3(模型 ID:claude-3-haiku-20240307)已于 2026 年 4 月 19 日正式停止服务。此日期之后,所有对该模型的 API 请求将直接回报错误,Anthropic 不会自动将流量导向新版本,开发者必须主动更新程序代码中的模型 ID 至 Haiku 4.5。这是本年度第一个大型 Claude 模型的生命周期终止事件。
影响范围以轻量应用为主
Claude Haiku 3 于 2024 年 3 月推出,是 Anthropic 当时最便宜、最快的模型,广泛用于客服 bot、摘要、分类、内容审核等高频但轻量的任务。两年后的今日,不少中小型 SaaS 与内部工具仍在使用此模型,理由是 prompt 与成本已深度调教、替换需重跑 QA。本次退役预告期自 2 月起已开始,Anthropic 通过官方通知、email、dashboard 警告对所有企业合约客户发出至少 60 天事前通知。
迁移至 Haiku 4.5 的两项破坏性变更
官方建议的替代方案为 Claude Haiku 4.5,但迁移并非仅修改字符串即可。开发者需留意两项破坏性变更:一是 temperature 与 top_p 两个采样参数现在仅允许择一设置,若既有代码两者都有明确数值,Anthropic 的 API 将回报错误;二是 Haiku 4.5 新增 refusal stop reason,当模型拒绝回应时会回传此标记,而非像 Haiku 3 一样直接 error 或回复 placeholder — 产品代码必须将 refusal 当成正常路径处理。
此外,上周 Opus 4.7 tokenizer 变更造成账单暗涨的争议,同样可能套用在 Haiku 4.5 上 — 即使 rate card 标示更低的 per-token 价格,实际业务任务的 token 消耗可能因 tokenizer 不同而异,建议所有迁移计划在切换当日实测对比成本。
AI 模型生命周期管理成为企业必修课
本次退役提醒企业 AI 基础设施的一个结构性变化:LLM 已从“一次性采购”进入“持续版本管理”的阶段,类似云端服务与作业系统。Anthropic 官方 deprecation 页面同时预告 Claude Opus 4、Sonnet 4 将于 2026 年 6 月 15 日退役,时程密集。企业 AI 采购条款应加入“最低支援期”、“替代模型自动可用”、“迁移测试补贴”等合约项目,否则生产服务可能因模型下架而中断。
对台湾开发者与 SaaS 团队的行动建议
三个立即动作:第一,搜索所有代码仓库与设定文件,把 claude-3-haiku-20240307 改成 claude-haiku-4-5;第二,检查 API 调用中是否同时设置 temperature 与 top_p,择一保留;第三,在 handler 中新增 refusal stop reason 的处理分支,避免意外的 user-facing error。对 使用按量计费企业合约的组织而言,切换当周监控 token 消耗变化也是必要动作,避免 tokenizer 差异带来意外超支。
这篇文章 Claude Haiku 3 于 4/19 正式退役:Anthropic 强制迁移至 Haiku 4.5,开发者须改模型 ID 与参数设置 最早出现于 鏈新闻 ABMedia。
免责声明:本页面信息可能来自第三方,不代表 Gate 的观点或意见。页面显示的内容仅供参考,不构成任何财务、投资或法律建议。Gate 对信息的准确性、完整性不作保证,对因使用本信息而产生的任何损失不承担责任。虚拟资产投资属高风险行为,价格波动剧烈,您可能损失全部投资本金。请充分了解相关风险,并根据自身财务状况和风险承受能力谨慎决策。具体内容详见
声明。
相关文章
OpenClaw、Hermes 和 SillyTavern 已确认纳入 GLM 编程计划支持
智谱AI产品经理李宣布 OpenClaw、Hermes 和 SillyTavern 作为受支持的 GLM 编程计划项目;其他工具将逐案评估。不要共享凭据或使用订阅作为 API 访问;遇到错误 1313 请联系支持。
智谱AI产品经理李宣布 OpenClaw、Hermes 和 SillyTavern 在 GLM 编程计划下已获官方支持,其他工具将逐案评估。该说明提醒用户不要共享凭据或将订阅用作 API 访问,并指引遇到错误 1313 的用户联系支持。
GateNews15 分钟前
Google Cloud 首席执行官:Gemini 将在 2026 年驱动苹果的个性化 Siri 推出
摘要:Gemini 将在 2026 年为个性化的 Apple Siri 提供支持,该产品基于苹果的 Foundation Models,并与 Gemini 展开合作;苹果正在测试 iOS 27/macOS 27 中类似聊天的 Siri,预计将在 2026 年 WWDC 上发布。
概述:到 2026 年,Google Cloud 的 Gemini 将为个性化的 Apple Siri 提供支持,将 Gemini 与苹果的 Foundation Models 进行融合,并在一项大约 $1 十亿美元的合作框架下推进。苹果正在 iOS 27/macOS 27 中测试一款重新设计、类似聊天的 Siri,采用 Dynamic Island 界面并提供新功能,距离 6 月 8 日举行的 2026 年 WWDC 揭晓仅在前期。
GateNews46 分钟前
SpaceX $60B Cursor 合作点燃 SBF 的赦免推动,FTX 的 $200K 持仓现价值达 30 亿美元
Gate News 消息,4月22日——SpaceX 今天宣布与 AI 编程初创公司 Cursor 达成重大合作,并提供了以 $60 十亿美元收购该公司的选项。该交易为 Sam Bankman-Fried (SBF) 提供了新的弹药;他目前身陷囹圄,正推动总统赦免,因为这表明了他长期所声称的 FTX 本可以实现的潜在价值回收。
在 2022 年 4 月,Alameda Research(SBF 创立的交易公司)向 Cursor 的母公司 Anysphere 投资了 200,000 美元,获得约 5% 的股权。当 FTX 在 2022 年 11 月崩溃时,破产法院接管了该公司。2023 年 4 月,FTX 破产财产将这同样的 5% 股权以 200,000 美元出售——正是 Alameda 投资的相同金额。基于 SpaceX 今天公布的 十亿美元估值,这 5% 的股权如今将价值约 十亿美元,代表 15,000 倍回报。
SBF 长期以来一直声称 FTX 并不是真正资不抵债,并认为破产律师通过过早清算资产摧毁了价值。2026 年 2 月,他分享了预测,暗示 FTX 在资产回收后本可以达到 十亿美元的净资产价值。他的父母在寻求赦免方面也一直很活跃,3 月出现在 CNN 上,辩称 FTX 客户获得了全额偿付。然而,债权人指出,赔付基于的是 2022 年的估值,而非当前市场价格。特朗普总统表示他不会赦免 SBF,而预测市场目前估计 2026 年获得赦免的概率仅为 5%。
GateNews53 分钟前
Chegg 股票暴跌99%,AI 冲击教育科技市场
摘要:Chegg 在在线教育需求带动下飙升,随后 AI 工具扰乱了其商业模式,引发大规模裁员,并使股价跌破 $2;与此同时,受更广泛的 AI 驱动变革影响,面向加密货币的矿企和金融科技公司也遭遇冲击。
摘要:本文考察了 Chegg 在疫情时期作为在线教育宠儿的崛起,以及在生成式 AI 的快速采用下它随后的衰落。生成式 AI 能提供快速答案,从而削弱了 Chegg 的价值主张。文章记录了 2025 年的裁员情况以及股价朝退市方向的大幅下跌,并将 Chegg 的经历置于更广泛的 AI 颠覆之中:这种颠覆正在重塑科技与加密领域——比特币矿工转向 AI 运维,而金融科技及其他领域的 AI 原生策略重新定义了竞争力。
Crypto Frontier1小时前
OpenAI 发布开源隐私过滤器模型,用于检测与脱敏 PII
摘要:OpenAI 的隐私过滤器是一种开源、可在本地运行的模型,用于检测并在文本中脱敏个人身份信息(PII)。它支持大上下文,识别多种 PII 类型,并旨在用于注重隐私的工作流程,例如数据准备、索引、日志记录和内容审核。
OpenAI 的隐私过滤器是一种在本地运行的开源模型 (128k-token 上下文),可检测并在文本中脱敏个人身份信息(PII),用于隐私工作流程,涵盖联系方式、金融和凭据数据。
GateNews1小时前
OpenAI 计划在 2030 年前部署 30GW 算力
OpenAI 计划在 2030 年前实现 30GW 的算力,以满足不断增长的 AI 需求,其中已完成 10GW 目标中的 8GW(对应 2025 年)。这次扩张表明了一项扩展基础设施的战略,以支撑下一代 AI 的开发与部署。
OpenAI 打算在 2030 年前达到 30GW 的算力,以适应日益增长的 AI 需求,且已完成 2025 年 10GW 目标中的 8GW。此举体现了为支撑下一代 AI 的开发与部署而对基础设施进行战略性扩张。
GateNews1小时前