天眼晚报
🤖 AI 大模型
𝕏 Claude Sonnet 5 发布,支持 100 万上下文并面向 Agent 工作流降价
Anthropic发布Claude Sonnet 5,支持100 万上下文,Claude Code 默认升级到该模型;API 标准定价为输入 3 美元/百万 token、输出 15 美元/百万 token,8 月 31 日前优惠为输入2 美元/M、输出 10 美元/M,主打低成本 Agent 工作流。
𝕏 Qwen3-Omni 实时语音服务优化:首音延迟从 6 秒降至 0.6 秒
vLLM与蚂蚁 SCT团队拆解并优化Qwen3-Omni服务管线,通过仅复制 Talker 与 Code2Wav 语音阶段等方式,在高并发下将首音延迟从 6 秒降至0.6 秒,吞吐提升 5.4 倍。
𝕏 Gemini Omni Flash 登顶 Video Arena,Elo 领先第二名 101 分
Google DeepMind的Gemini Omni Flash在Video Arena以1404 Elo排名第一,领先第二名 Seedance 2.0 Mini 101 分,并较 Veo 系列跃升 7 位,显示其视频生成评测表现显著提升。
阿里据称将自 7 月 10 日起内部禁用 Claude Code
阿里将Claude Code列入高风险软件名单,据称因后门风险自7 月 10 日起在内部禁用,并推荐Qoder作为替代方案;相关通知也覆盖 Sonnet、Opus、Fable 等 Anthropic 工具。
𝕏 Claude Code 推出 Artifacts,可将会话产物变成可分享页面
Claude Code Artifacts可将 PR 说明、项目仪表盘、交互页面等会话产物变成独立页面,并支持随会话运行自动刷新,让开发过程中的中间成果更容易分享与复用。
𝕏 Google 发布 Nano Banana 2 Lite 与 Gemini Omni Flash
Google发布Nano Banana 2 Lite和Gemini Omni Flash,两款模型均已开放 API;其中 Nano Banana 2 Lite 可在 4 秒内生成 1K 图片,面向快速图像生成与多模态应用场景。
𝕏 GLM-5.2 可通过 Hugging Face 接入 Claude Code
GLM-5.2已可通过Hugging Face Inference Providers和hf-claude在 Claude Code 中选择使用,为开发者提供除 Anthropic 模型外的替代接入路径。
𝕏 Ai2 更新 OlmoEarth v1.2 遥感基础视觉模型
Ai2发布OlmoEarth v1.2,模型规模仅0.1B,支持单图和时间序列遥感图像分析,面向更轻量的地球观测与遥感视觉任务。
𝕏 Fable 5 第三方基准显示调试与重构能力大幅下滑
BridgeBench重测Fable 5后显示,其 Debugging 分数从 86.2 降至25.9,Refactoring 分数从 73.6 降至38.4,第三方评测结果显示软件工程相关能力出现明显回落。
腾讯云 DeepSeek-V4 正式版计划 7 月中上线
腾讯云计划7 月中上线DeepSeek-V4正式版,并引入峰谷定价机制,为模型调用成本随时段动态变化提供新的计费方式。
𝕏 Together 称 GLM 5.2 软件工程能力约为 Sonnet 5 的 80%
Together AI使用DeepSWE比较GLM 5.2与 Sonnet 5,称 GLM 5.2 以约20%价格达到约 80%能力,为软件工程场景中的性价比替代模型提供了评测依据。
𝕏 Claude Code 会将部分 Fable 5 请求路由到较低模型
Claude Code的分类器会判断任务难度,部分用户指定Fable 5的请求会被降级到Opus 4.8,日志显示“不需要 Fable 5”,显示其模型调用并非完全按用户显式选择执行。
EVENT-DRIVEN INTELLIGENCE
免费先跟踪重点,再决定是否升级
每篇公开内容都对应三步:订阅每日情报、查看同主题历史上下文、升级 Pro 解锁搜索、研究和事件详情。