AI 快讯 · 4月30日

AI 快讯 · 4月30日
💡

Jason

今天最值得盯的是 Skills 生态的集体爆发——Matt Pocock 的 Claude Skills 库和 Composio 的 Codex Skills 合集同日登上 GitHub Trending,Agent 工具层的基础设施正在快速补全,这波红利属于最早把 Skills 用进真实项目的开发者。

🛠️
AI 工具动态TechCrunch AI

微软 Nadella:将「充分利用」与 OpenAI 的新合作协议

微软 CEO Nadella 表示将全面「榨取」与 OpenAI 新协议的价值——微软可向云客户提供 OpenAI 全套技术能力,且无需额外付费。这意味着 Azure 客户将更低成本获得 GPT 系列模型,对 AWS Bedrock 和 Google Cloud 形成直接压力。

📚
AI 论文HuggingFace Papers

TIDE 框架:让小模型「跨架构」学会扩散式语言模型的能力

扩散式大语言模型(dLLM)支持并行解码和双向上下文,推理效率高,但需要巨大参数量才能达到竞争级别。TIDE 是首个跨架构 dLLM 知识蒸馏框架,让小模型可以从架构完全不同的大模型中学习,对开发者意味着:未来可能用更小、更便宜的模型实现接近 GPT-4 级别的推理速度。

📚
AI 论文HuggingFace Papers

强化学习训练加速新法:推测解码让 Rollout 生成提速不损精度

RL 后训练的最大瓶颈之一是 Rollout 生成太慢。这篇论文将 Speculative Decoding 引入 RL 训练流程,在不改变模型输出分布的前提下实现无损加速。对做模型微调或 RL 训练的开发者而言,这意味着相同算力下可跑更多训练轮次,显著降低迭代成本。

订阅获取每日 AI 快讯推送 + 免费出海手册

📘 免费订阅