Claude Code 助力 Ångstrom 训练出击败 Meta 顶模的新模型↗
Ångstrom 团队使用 Claude Code 完成了完整的模型训练流程,最终在基准测试中超越了 Meta 的 UMA-OMC 模型。这是 Claude Code 作为科研工程工具的真实落地案例,证明 AI 编程助手正在从「写代码」升级到「跑实验、打榜」的深度科研场景。

Jason 说
今天最值得关注的信号:G7 领导人怕被美国「断 AI」,企业 tokenmaxxing 遭遇预算反噬,加上 LLM 遗忘技术被证明形同虚设——AI 行业正同时面临地缘、ROI 和安全三重信任危机,2026 下半年会很有意思。
Ångstrom 团队使用 Claude Code 完成了完整的模型训练流程,最终在基准测试中超越了 Meta 的 UMA-OMC 模型。这是 Claude Code 作为科研工程工具的真实落地案例,证明 AI 编程助手正在从「写代码」升级到「跑实验、打榜」的深度科研场景。
马克龙与莫迪在 G7 峰会上公开表达对美国 AI「随时断供」的担忧,而 Anthropic 封禁事件已将这种恐惧变为现实。这不仅是地缘政治问题,更将直接推动各国政府加速布局本地化与开源模型,重塑全球 AI 供应链格局。
OpenAI 与 Molecule.one 合作展示了由 GPT-5.4 驱动的「近全自主 AI 化学家」,成功改进了一个医药化学中关键但极具挑战性的合成反应。这是 AI Agent 在湿实验室科学中自主执行高专业度任务的重要里程碑,预示 AI 加速药物研发的时代正在到来。
Uber 数月内烧完全年 AI 预算,Meta 关闭内部 AI 使用排行榜,部分企业削减 Claude 席位——曾席卷硅谷的「Token 极限主义」正在遭遇 ROI 拷问。投资方 NEA 指出,企业还没搞清楚 AI 真正带来了多少回报,这将重塑 2026 年下半年的企业 AI 采购节奏。
Google AMIE 对话式医疗 AI 在《Nature》发表研究,证明其在复杂慢性病管理场景中的表现已与初级保健医生相当。顶级学术期刊背书大幅提升可信度,医疗 AI 从「辅助工具」走向「替代场景」的叙事正在被主流科学界接受。
研究者发现多智能体 LLM 系统在共享内存、向量索引和工具注册表时,存在「过时生成」「幽灵工具」「因果级联」「工具效果乱序」四类并发 Bug,并用 TLA+ 形式化证明了每类异常的存在。**对开发者的意义**:你的 Multi-Agent 系统可能正在悄悄产生错误结果——这篇论文给出了诊断清单和防御设计模式。
RepSelect 论文揭示了 LLM「遗忘」(Unlearning)领域的核心漏洞:现有方法只是浅层压制,只需少量微调或 few-shot 提示就能把「遗忘」的内容找回来。**对开发者的意义**:依赖遗忘技术做合规或版权保护的产品,安全假设可能从根本上就是错的——这个问题比想象中严重得多。
早年预判 Facebook 崛起的 VC Chi-Hua Chien 表示,下一轮 AI 财富将属于那些「用 AI 解决具体行业问题」的公司,而非销售 AI 能力本身的平台。对独立开发者和出海 SaaS 创业者来说,这个判断意味着:垂直深耕 > 做通用 AI 工具。
订阅获取每日 AI 快讯推送 + 免费出海手册
📘 免费订阅