AI 快讯 · 5月20日

AI 快讯 · 5月20日
💡

Jason

今天最大的事就是 Google I/O——Gemini 3.5 Flash 直接 GA 无限速,开发者说比 Sonnet 还能打还更便宜。Google 这次不再是「发布即难用」,AI 赛道格局真的在重排了。

🛠️
AI 工具动态Google AI Blog

Google I/O 2026:Gemini 3.5 正式发布,主打「智能+行动力」

Google I/O 2026 重磅发布 Gemini 3.5 系列模型,定位「前沿智能+行动力」,主打 Agent 能力。Gemini 3.5 Flash 正式 GA,无速率限制,定价约为前代 3 倍但仍远低于 GPT-5.5 和 Claude Opus 4.7。开发者早期评测认为指令跟随能力出色、Agent 编码表现亮眼,且并非单纯 bench-maxxed 模型。

🛠️
AI 工具动态Google AI Blog / TechCrunch AI

Google I/O 2026:AI Agent 进驻 Gmail/Workspace,搜索全面自然语言化

Google I/O 宣布 Gmail 新增语音对话 AI Inbox、Docs 和 Keep 加入语音能力;Search 推出「信息 Agent」可后台监控话题主动推送更新;AI Mode 上线一年已显著改变搜索行为,用户从关键词转向自然语言长句查询。Google 正将整个产品线推向 Agent 化。

🛠️
AI 工具动态Product Hunt AI

Cursor 发布 Composer 2.5:AI 编码体验再度升级

Cursor 在 Product Hunt 上线 Composer 2.5 版本更新,作为目前最受开发者青睐的 AI 编程工具,此次升级时间节点正值 Google I/O 和各大模型集中发布期,预计在 Agent 模式和多模型切换方面有针对性增强,值得 Cursor 用户关注。

📚
AI 论文HuggingFace Papers

OSCAR 论文:2-bit KV Cache 量化新方案,长上下文推理成本有望大幅压缩

为什么对开发者重要:跑长上下文 LLM 最贵的不是算力而是 KV Cache 内存。OSCAR 提出一种「离线估算注意力感知协方差结构」的方法,把 KV Cache 压缩到 2-bit 还不掉精度——相当于同样的显存能塞进 4 倍更长的上下文。对本地部署和 API 成本敏感的开发者是重大利好。

订阅获取每日 AI 快讯推送 + 免费出海手册

📘 免费订阅