天眼早报

科技|2026年07月04日|约 60 分钟阅读

来源：686 条推文 + 35 篇 RSS 文章·Lanyun·BatchV2 生成·2026-07-03 — 2026-07-04

AI 速读18 条精选

🤖 AI 大模型

GitHub Copilot新增Kimi K2.7 Code，称其为首个可在模型选择器中使用的开源权重模型，主打低成本与高性能代码工作流。这意味着开源权重代码模型开始进入主流 IDE 辅助编程入口。

Thinking Machines将Bridgewater私有专家判断转为训练信号，用于投资信息筛选任务，错误率减少29.8%，推理成本降低至13.8 倍以下。该案例展示了将领域专家判断结构化为模型训练数据的效果。

LiveKit Inference推出Gemma 4 31B，面向语音代理场景优化，首句延迟为381ms、任务完成率 88%，输出价格为1.20 美元/百万 token。该模型定位于低延迟实时语音交互。

Mistral AI发布Leanstral 1.5，称其为首个面向Lean 4证明助手的开源代码智能体，用于复杂数学对象和软件规格表达。该发布将大模型代码能力进一步延伸到形式化证明和严谨软件验证场景。

Mercor公布Fable 5重发版 APEX-SWE 结果：7 月版Pass@1 为 54.8%，低于 6 月版 65.5%，但仍高于Opus 4.8的 45.3%。该结果补充了 Fable 5 在软件工程任务上的最新基准表现。

Wafer AI测试显示，GLM-5.2在AMD MI355X上达到2626 tok/s/node，成本较 Blackwell 方案低逾 2 倍。该结果为大模型在 AMD 加速卡上的高吞吐部署提供了性能和成本参考。

Cline新增Poolside Laguna M.1免费模型，参数规模225B、上下文长度256k，面向智能体编程和长周期任务。该接入为开发者提供了一个大上下文、面向代码代理工作流的免费模型选项。

腾讯云 TokenHub计划7 月中旬直接从DeepSeek网络提供DeepSeek-V4模型服务。该信息指向云厂商模型分发入口与 DeepSeek 新模型服务之间的潜在接入安排。

Together AI称开放模型用量从 AI Token 的10%升至30%，显示开放模型和模块化 AI 的采用率正在上升。该数据反映出闭源模型之外的推理流量份额在扩大。

Anthropic确认Claude Fable 5在7 月 7 日后退出常规订阅额度，改为 usage credits 计费；当前订阅仅可使用周额度的50%。该变化影响订阅用户继续访问 Fable 5 的方式和成本。

Garry Tan称每年花10 万美元买 token 可提前体验 2028 年能力，并预计3 年内推理量增长90000 倍。这一判断强调推理计算规模可能成为 AI 能力扩张的重要变量。

美团官宣旗下大模型LongCat-2.0使用国产芯片训练，区别于仅使用国产芯片推理的方案。该表述突出训练环节本身对国产算力的使用，信息增量在于训练与推理口径的区别。

GLM-5.2已可借助Hugging Face Inference Providers与hf-claude在 Claude Code 中调用。该路径为开发者在 Claude Code 工作流里使用 GLM-5.2 提供了新的接入方式。

GLM-5.2已在NVIDIA NIM开放免费使用，发布者称模型质量略低。该消息提供了一个通过 NVIDIA 推理服务入口试用 GLM-5.2 的新渠道。

EVENT-DRIVEN INTELLIGENCE

每篇公开内容都对应三步：订阅每日情报、查看同主题历史上下文、升级 Pro 解锁搜索、研究和事件详情。

NEXT STEP · 留下邮箱

每天一封精选情报，先用邮件建立复访，再决定是否升级到更深的追踪能力。