AI 快讯 · 5月22日

AI 快讯 · 5月22日
💡

Jason Says

今天最震撼的是 OpenAI 模型用不到 1000 美元干掉了 80 年数学难题——这不是「AI 辅助数学」,这是 AI 自己做数学研究了;与此同时 Daytona 和 Railway 的增长数据也在告诉你:Agent 基础设施才是这波最稳的生意。

🛠️
AI 工具动态OpenAI Blog

OpenAI 模型独立推翻 80 年 Erdős 猜想:AI 数学推理迎来里程碑

OpenAI 最新推理模型自主解决了困扰数学界 80 年的单位距离问题(Erdős 猜想),借助 Golod-Shafarevich 理论将离散几何与数论深度连接,耗费不到 1000 美元算力。成果已获 Noga Alon、Tim Gowers 等顶级数学家验证,被称为「AI 数学里程碑」。

💰
变现案例Latent Space

Daytona:Agent 沙箱云 74% 月环比增长,日运行量突破 85 万次

专为 AI Agent 提供隔离运行环境的云平台 Daytona 披露最新数据:月环比增速 74%、每日运行量 85 万次。CEO Ivan Burazin 详述裸金属沙箱架构、RL 评估方案,以及如何让长时 Agent 任务在安全隔离环境中稳定执行,展示了 Agent 基础设施赛道的真实爆发速度。

📚
AI 论文HuggingFace Papers

SaaSBench 论文:首个面向企业级全栈 SaaS 的编码 Agent 评测基准

现有编码 Agent 基准多为单栈简化项目,无法反映真实企业 SaaS 的复杂度。SaaSBench 填补这一空白:引入异构技术栈、全栈编排与系统级依赖,测试 Agent 完成端到端 SaaS 工程任务的能力。对独立开发者和企业工程师衡量 Agent 实际可用性有直接参考价值。

Subscribe for daily AI updates + free playbook

📘 Subscribe Free