mattpocock 开源 Claude Skills 合集:真工程师的 .claude 目录↗
知名 TypeScript 教育者 Matt Pocock 开源了自己日常使用的 Claude Skills 合集,强调小而精、可组合,区别于 GSD/BMAD 等重流程方案。专为真实工程场景设计,而非「氛围编码」,对想用 Claude Code 提升工程质量的开发者很有参考价值。

Jason Says
今天最值得盯的主线:开源模型正在以「性价比碾压」的方式逼迫闭源 API 降价,DeepSeek V4 / Kimi 2.6 / Grok 4.3 三连击——付费 API 的护城河在快速消失,现在建产品要认真考虑开源路线了。
知名 TypeScript 教育者 Matt Pocock 开源了自己日常使用的 Claude Skills 合集,强调小而精、可组合,区别于 GSD/BMAD 等重流程方案。专为真实工程场景设计,而非「氛围编码」,对想用 Claude Code 提升工程质量的开发者很有参考价值。
Warp 宣布开源,定位「Agentic 开发环境」,OpenAI 为联合创始赞助商。内置编码 Agent,同时支持接入 Claude Code、Codex、Gemini CLI 等外部 CLI Agent,是目前最完整的多 Agent 终端集成方案之一。
独立评测者 Bindu Reddy 称 DeepSeek V4 Pro 在 evals 上已超越 Opus 4.7 Medium;同时 DeepSeek V4 Flash 被评为目前最快、最实用的轻量开源模型。叠加 Kimi 2.6 / GLM 5.1 逼近闭源水平,开源模型正在蚕食付费 API 市场。
Grok 4.3 正式上线,评测显示智能水平与 Claude Sonnet 4.6 相当,但速度更快、成本降低约 5 倍。对于高频调用 API 的开发者和产品团队,这是一个值得认真测试的成本替代方案。
Cursor 据报正与 SpaceX 就 600 亿美元收购进行谈判,Replit CEO Amjad Masad 在 StrictlyVC 活动上表示暂不考虑出售。AI 编程工具赛道估值飙升,头部玩家的并购走向将深刻影响整个开发者工具生态。
奥斯卡学院正式宣布,AI 生成的演员形象及剧本内容不具备参赛资格。这是好莱坞对 AI 创作内容最高级别的制度性限制,将直接影响影视制作公司在 AI 工具上的投入策略和合规边界。
论文提出「步骤级优化」方案:现有 Computer-use Agent 每步都调用大模型,成本高且慢;新方法让 Agent 区分「简单步骤用小模型、复杂决策用大模型」,大幅降低推理成本。对构建 GUI 自动化产品的开发者极具参考价值。
研究分析了 100 个微调模型(含医疗、法律领域),发现基础模型的安全对齐在微调后普遍发生「漂移」——即使微调数据本身无害。对所有在生产环境部署微调模型的开发者来说,这意味着上线前必须重新评估安全性,不能沿用基础模型的测试结论。
Subscribe for daily AI updates + free playbook
📘 Subscribe Free