AI 快讯 · 5月31日

AI 快讯 · 5月31日
💡

Jason

今天最值得警惕的信号:GitHub Copilot 按 Token 收费 + 某公司单月烧掉 5 亿美元 Claude 费用——AI 工具的「成本失控时代」已经来临,企业和独立开发者必须开始认真做 AI 用量治理,不然账单会教你做人。

🛠️
AI 工具动态TechCrunch AI

GitHub Copilot 改按 Token 计费,开发者集体炸锅

GitHub Copilot 宣布从订阅制转向按 Token 用量计费,开发者社区强烈反弹,有人直呼「What a joke」。这标志着「AI 编程工具免费午餐」时代正在终结——当用户量和用量双双爆炸,平台必然要把成本转嫁回去,对重度用户影响尤其显著。

🛠️
AI 工具动态Tom's Hardware / HN

某神秘公司单月意外烧掉 5 亿美元 Claude 费用

一家身份未披露的企业因未给员工 Claude 许可证设置用量上限,单月 API 账单高达 5 亿美元。事件折射出两个现实:Anthropic Opus 系列 token 消耗极其激进,以及企业 AI 成本治理几乎还是盲区。这对任何在内部大规模部署 Claude 的团队都是警示。

🛠️
AI 工具动态OpenAI Blog

OpenAI 推出 Rosalind Biodefense:把 GPT 开放给美国生物防御机构

OpenAI 正式发布 Rosalind Biodefense 项目,向通过审核的开发者及美国政府合作伙伴开放专用 GPT-Rosalind 模型,聚焦生物防御、公共卫生和大流行病准备。这是 OpenAI 首次为国家安全场景专门定制模型访问权限,意味着 AI 在高风险政府场景的渗透进一步加深。

🛠️
AI 工具动态TechCrunch AI

Meta 据报正在研发 AI 项链穿戴设备

据报道 Meta 正在开发一款 AI 驱动的穿戴式项链(pendant),这是继 Ray-Ban 智能眼镜之后 Meta 在 AI 硬件上的又一次押注。AI 硬件战场正式从手机配件延伸至「贴身可穿戴」,Humane AI Pin 的失败显然没有浇灭大厂热情。

📚
AI 论文HuggingFace Papers

论文:用「置信度」智能管理 KV Cache,长文推理显存降一个数量级

CONF-KV 提出用模型每步解码时的「下一 token 预测置信度」来动态决定保留多少 KV Cache,高置信时激进压缩、低置信时保留更多上下文。对开发者的意义:在不换模型的前提下,长文档处理的 GPU 显存和推理成本可大幅降低,部署 10 万 token 以上长文本应用的工程成本有望实质性下降。

订阅获取每日 AI 快讯推送 + 免费出海手册

📘 免费订阅