天眼晚报

科技|2026年07月03日|约 73 分钟阅读

来源：855 条推文 + 131 篇 RSS 文章·Lanyun·BatchV2 生成·2026-07-03

AI 速读18 条精选

🤖 AI 大模型

𝕏 Claude Sonnet 5 发布，支持 100 万上下文并面向 Agent 工作流降价

Anthropic发布Claude Sonnet 5，支持100 万上下文，Claude Code 默认升级到该模型；API 标准定价为输入 3 美元/百万 token、输出 15 美元/百万 token，8 月 31 日前优惠为输入2 美元/M、输出 10 美元/M，主打低成本 Agent 工作流。

𝕏 Qwen3-Omni 实时语音服务优化：首音延迟从 6 秒降至 0.6 秒

vLLM与蚂蚁 SCT团队拆解并优化Qwen3-Omni服务管线，通过仅复制 Talker 与 Code2Wav 语音阶段等方式，在高并发下将首音延迟从 6 秒降至0.6 秒，吞吐提升 5.4 倍。

𝕏 Gemini Omni Flash 登顶 Video Arena，Elo 领先第二名 101 分

Google DeepMind的Gemini Omni Flash在Video Arena以1404 Elo排名第一，领先第二名 Seedance 2.0 Mini 101 分，并较 Veo 系列跃升 7 位，显示其视频生成评测表现显著提升。

阿里据称将自 7 月 10 日起内部禁用 Claude Code

阿里将Claude Code列入高风险软件名单，据称因后门风险自7 月 10 日起在内部禁用，并推荐Qoder作为替代方案；相关通知也覆盖 Sonnet、Opus、Fable 等 Anthropic 工具。

𝕏 Claude Code 推出 Artifacts，可将会话产物变成可分享页面

Claude Code Artifacts可将 PR 说明、项目仪表盘、交互页面等会话产物变成独立页面，并支持随会话运行自动刷新，让开发过程中的中间成果更容易分享与复用。

𝕏 Google 发布 Nano Banana 2 Lite 与 Gemini Omni Flash

Google发布Nano Banana 2 Lite和Gemini Omni Flash，两款模型均已开放 API；其中 Nano Banana 2 Lite 可在 4 秒内生成 1K 图片，面向快速图像生成与多模态应用场景。

𝕏 GLM-5.2 可通过 Hugging Face 接入 Claude Code

GLM-5.2已可通过Hugging Face Inference Providers和hf-claude在 Claude Code 中选择使用，为开发者提供除 Anthropic 模型外的替代接入路径。

𝕏 Ai2 更新 OlmoEarth v1.2 遥感基础视觉模型

Ai2发布OlmoEarth v1.2，模型规模仅0.1B，支持单图和时间序列遥感图像分析，面向更轻量的地球观测与遥感视觉任务。

𝕏 Fable 5 第三方基准显示调试与重构能力大幅下滑

BridgeBench重测Fable 5后显示，其 Debugging 分数从 86.2 降至25.9，Refactoring 分数从 73.6 降至38.4，第三方评测结果显示软件工程相关能力出现明显回落。

腾讯云 DeepSeek-V4 正式版计划 7 月中上线

腾讯云计划7 月中上线DeepSeek-V4正式版，并引入峰谷定价机制，为模型调用成本随时段动态变化提供新的计费方式。

𝕏 Together 称 GLM 5.2 软件工程能力约为 Sonnet 5 的 80%

Together AI使用DeepSWE比较GLM 5.2与 Sonnet 5，称 GLM 5.2 以约20%价格达到约 80%能力，为软件工程场景中的性价比替代模型提供了评测依据。

𝕏 Claude Code 会将部分 Fable 5 请求路由到较低模型

Claude Code的分类器会判断任务难度，部分用户指定Fable 5的请求会被降级到Opus 4.8，日志显示“不需要 Fable 5”，显示其模型调用并非完全按用户显式选择执行。

EVENT-DRIVEN INTELLIGENCE

免费先跟踪重点，再决定是否升级

每篇公开内容都对应三步：订阅每日情报、查看同主题历史上下文、升级 Pro 解锁搜索、研究和事件详情。

订阅每日情报查看同主题历史事件升级 Pro 解锁搜索 / 研究 / 事件详情

NEXT STEP · 留下邮箱

获取下一次重大事件提醒

每天一封精选情报，先用邮件建立复访，再决定是否升级到更深的追踪能力。

查看同主题历史事件升级 Pro 解锁事件详情