天眼早报
🤖 AI 大模型
𝕏 【重磅】美国商务部解除对 Anthropic Claude Fable 的出口管制
根据 WIRED 独家报道,美国商务部长 Howard Lutnick 致信 Anthropic 的 Tom Brown,撤回对 Claude Mythos 5 和 Claude Fable 5 的出口管制,不再需要许可证即可出口、再出口或在境内转让。此前白宫高级官员已提前透露此消息。
𝕏 ⭐ Anthropic 发布 Claude Sonnet 5,主打低成本 Agent 能力
Anthropic 推出 Claude Sonnet 5,官方称其为"最具 Agent 能力的 Sonnet",支持 1,000,000 token 上下文窗口。它能自主制定计划、使用浏览器和终端,自主运行水平数个月前还需要更大更贵的模型才能实现。OpenRouter 上线促销价:输入 $2/M tokens,输出 $10/M tokens(优惠至 8 月 31 日,之后恢复 $3/$15)。系统卡共 145 页,评测显示 CyberGym 得分 52.7%,MASK 谎言率仅 3.1%,每任务成本 $2.29。
𝕏 ⭐ 美团发布 LongCat-2.0:1.6T 参数开源模型,基于纯国产芯片训练
美团 发布开源模型 LongCat-2.0,1.6T 参数 MoE(33B–56B active),1M token 上下文窗口。该模型在 50,000 片国产华为芯片 上完成预训练与推理,是业界首个全程在国产算力集群上训练的万亿模型,编码和 Agent 基准表现不俗。
𝕏 ⭐ Anthropic 推出 Claude Science 科学科研工具
Anthropic 发布 Claude Science 测试版,集成代码追踪、60 个科学数据库、3D 蛋白/基因组可视化,可提交任务至实验室 HPC 或 Modal 计算。早期用户报告 10 次审稿草稿不超过 100 页,种系分析仅需十分之一时间。这是 Anthropic 生命科学与医疗健康计划的一部分。
𝕏 ⭐ OpenAI 通过新方法将推理成本降低一半以上
据 The Information 报道,OpenAI 已通过量化、KV 缓存、批处理、推测解码等技术,将部分现有模型的推理成本降低 一半以上。未登录 ChatGPT 流量仅需两三百块英伟达 GPU。此举有望推动毛利率从 2025 年的 33% 升至 2026 年的 52%。
𝕏 ⭐ NVIDIA Blackwell 推理栈一个月内将 DeepSeek V4 代币成本降低 5 倍
NVIDIA 最新报告称,其 Blackwell 推理栈通过优化,在 一个月内 将 DeepSeek V4 的代币成本降低了最高 5 倍。
𝕏 ⭐ GLM-5.2 成为最智能的开源权重模型,但也是最啰嗦的模型之一
Artificial Analysis 评测显示,GLM-5.2(智谱)在 CritPt 物理基准上追平 Claude Opus 4.8(均 21%),但在 AA 智能指数上为 51 分,低于 Opus 4.8(56)和 GPT-5.5(55)。其输出 token 数高达 1.41 亿(95% 推理),是 GPT-5.5 的 2 倍,幻觉率更高。
𝕏 ⭐ 华为开源 openPangu-2.0-Flash:920 亿参数模型
华为 开源 openPangu-2.0-Flash,参数规模 920 亿,在国产昇腾芯片上训练。该模型展示中国在软硬件全栈 AI 自主化方面的持续进展。
𝕏 ⭐ OpenAI 发布 GeneBench-Pro 基准,评估 AI 在生物数据分析中的能力
OpenAI 推出 GeneBench-Pro,这是一个研究级基准,用于测试 AI Agent 处理混乱生物数据、选择正确分析路径、做出类似真实计算研究判断的能力。旨在推动 AI 在计算生物学领域的进步。
EVENT-DRIVEN INTELLIGENCE
免费先跟踪重点,再决定是否升级
每篇公开内容都对应三步:订阅每日情报、查看同主题历史上下文、升级 Pro 解锁搜索、研究和事件详情。