AI 快讯 · 6月15日

AI 快讯 · 6月15日
💡

Jason

Fable/Mythos 被封存这件事比它本身更重要——它第一次把「模型训练出来但不能发布」变成了现实,AGI 治理从哲学讨论变成了操作手册,而印度、中国、欧洲都在用各自的方式回应这个信号。

🛠️
AI 工具动态Latent Space

Anthropic Fable 与 Mythos 正式被判定「太危险」不得发布

Anthropic 旗下两款新模型 Fable 与 Mythos 被官方确认不会公开发布,原因是安全风险过高。这是 AI 行业首次如此高调地主动封存已训练完成的前沿模型,标志着 AGI 治理从理论走向实际操作,对整个行业如何处理「训练出来但不能发布」的模型设立了先例。

🛠️
AI 工具动态Interconnects

AGI 治理新纪元:我们还没准备好就推开了那扇门

Interconnects 发布深度评论文章,指出 Anthropic 封存 Fable/Mythos 事件标志 AI 治理正式进入 AGI 阶段——政府、企业和社会对于如何应对「能力超出可控阈值的模型」毫无预案。文章认为这是不可逆转的历史节点,决策者必须立即重构监管框架而非继续观望。

🛠️
AI 工具动态TechCrunch AI

Anthropic 封模型引爆印度 AI 独立性大辩论

Anthropic 暂停新模型访问权限一事,意外成为印度 AI 战略的催化剂。印度科技领袖们以此为例,激烈辩论是否应该加速建设本土 AI 基础设施——完全依赖美国闭源模型的风险已被真实呈现:一个封禁决定就能让整个国家的 AI 能力归零。

🛠️
AI 工具动态X/@bindureddy

智谱 GLM 5.2 发布:达 Opus 4.7 水平,中国开源再缩差距

智谱 AI 发布 GLM 5.2,性能评测达到 Anthropic Opus 4.7 级别。背景是美国因 Fable 封禁事件陷入停滞,中国开源模型却以极快节奏迭代——Kimi 2.7、DeepSeek Flash、GLM 5.2 密集发布,形成开源阵营对闭源美国模型的持续追赶态势,值得出海开发者关注作为 fallback 方案。

📚
AI 论文HuggingFace Papers

HF 论文:LLM「偏见根深蒂固」——额外提示信息几乎无法纠正零样本错误

研究发现 LLM 内化的训练先验(priors)会严重干扰标注任务表现——即便在 prompt 里明确给出纠正信息,模型依然倾向于「坚持己见」(decision stickiness)。对开发者的实际意义:用 LLM-as-Judge 或零样本标注构建数据集时,结果可靠性远低于预期,需要系统性验证而非简单信任模型输出。

📚
AI 论文HuggingFace Papers

HF 论文:WebChallenger——无需昂贵推理模型也能高效完成网页自动化

WebChallenger 提出三项人类认知优势的架构模拟:选择性注意力(只看页面相关区域)、网站结构持久记忆、以及程序化操作流畅度。研究结论是网页 Agent 性能瓶颈不在模型能力不足,而在架构设计失当——意味着开发者无需调用昂贵推理模型,优化 Agent 架构即可大幅提升网页自动化效果。

📚
AI 论文HuggingFace Papers

HF 论文:LLM 心理测评真的有效吗?自我报告与实际行为的解离之谜

研究重新审视用心理测量量表(如大五人格)评估 LLM 行为倾向的有效性。发现过去观测到的「自我报告与行为不一致」,部分原因是测量方法本身的问题(用宽泛人格特质预测具体行为本来就难),而非 LLM 完全不一致。对 AI 安全评估和部署前测试具有重要方法论意义。

订阅获取每日 AI 快讯推送 + 免费出海手册

📘 免费订阅