天眼早报

科技|2026年06月25日|约 61 分钟阅读

来源：1238 条推文 + 162 篇 RSS 文章·Lanyun·BatchV2 生成·2026-06-24 — 2026-06-25

AI 速读15 条精选

🤖 AI 大模型

𝕏 Mirendil AI 获 a16z 和 Kleiner Perkins 领投 2 亿美元种子轮，构建自主 AI 研究系统

Mirendil AI 由前 Anthropic、xAI、Google DeepMind、OpenAI 研究员创立，获得 2 亿美元 种子轮融资，由 a16z 和 Kleiner Perkins 领投，NVIDIA 等跟投，用于构建自主进行 AI 研发的智能体系统。该融资标志着前沿 AI 研究从少数实验室走向更开放的格局。

𝕏 Krea 2 开源图像模型发布，DiT 架构性能进前十

Krea 2 开源系列图像生成基础模型，采用 DiT 架构，集成 iREPA、改进 VAE 和 Qwen3-VL。五阶段训练管道（预训练→SFT→偏好优化→强化学习），在 Artificial Analysis 文生图排行榜进入前十。权重和推理代码宽松许可证开源。

𝕏 GPT-5.5 Instant 更新：理解意图与复杂约束能力提升

OpenAI 发布 GPT-5.5 Instant 新版本，核心提升：对话更有趣、更能理解问题背后意图、处理复杂约束更可靠，并在购物和 本地推荐 场景优化。付费用户今日可用，免费用户明天推送。

𝕏 OpenThoughts-Agent 发布，32B 模型平均 44.8% 性能

斯坦福 NLP 组发布 OpenThoughts-Agent 和 OpenThinkerAgent-32B，基于 Qwen-3 开源数据训练的强 agentic 模型，在 7 项 agent 基准 上平均得分 44.8%。

𝕏 Gemini 3 Pro 首次在 ARC-AGI-2 上达到 23% 以上

Gemini 3 Pro 于 2025 年 11 月成为首个在 ARC-AGI-2 上得分超过 23% 的模型（实际得分 31%）。闭源与开源模型之间仍存在 8-12 个月 差距，但开源模型表现更不均衡。

𝕏 OpenAI 发布首款自研 AI 芯片 Jalapeño

OpenAI推出首款自研 AI 芯片Jalapeño，与博通合作设计，专为推理优化，9 个月完成流片，能效和利用率显著提升。这标志着 OpenAI 从购买算力向垂直整合转型。

𝕏 Kog 在 Hugging Face 开源 2B 模型，推理速度超 3000 tokens/s

Kog 在 Hugging Face 上开源了 2B 参数模型，该模型曾演示运行速度超过 3000 tokens/s，推理性能突出。

𝕏 Qualcomm 与 Hugging Face 合作，将开放模型带到 Qualcomm 平台

Qualcomm 与 Hugging Face 宣布合作，用户可将任何模型部署到 Qualcomm 平台及通过 Modular 扩展到更广范围。Hugging Face 将为 Pro 订阅者部署 Qualcomm 平台支持推理。

𝕏 字节发布豆包 Doubao-Seed-2.1-Pro 模型，实测 coding 能力突出

字节跳动发布新模型Doubao-Seed-2.1-Pro，集成在TRAE Work CN中免费使用。实测可一键生成完整产品落地页、VLM 界面还原、3D 小游戏自测自修，复杂长任务仍与主力模型有差距，但日常 coding 实用性较高。

𝕏 OpenAI 用 GPT-5 Pro 理解实验结果，模型独立发现关键机制

OpenAI 研究员使用 GPT-5 Pro 分析多年前实验结果，模型成功识别出背后的关键机制。相关文章和图表已发布。

𝕏 GLM 5.2 在 ARC-AGI-2 上达 22.8%，成本 0.25 美元/任务，为最佳中国模型

GLM 5.2 在 ARC-AGI-2 基准上取得 22.8% 成绩，为中国模型最佳，与 Opus 4.5 (16K) 持平；Grok 4.20 达到 65%，与 Opus 4.7 相当。GLM-5.2 每任务成本仅 0.25 美元，仅为 GPT-5.5 的 1/7.5，较 2025 年 5 月最佳模型的 3.0% 提升 7.6 倍。

𝕏 Gemini 3.5 Flash 原生支持 Computer Use 功能

Google DeepMind 的 Gemini 3.5 Flash 获得原生 Computer Use 能力，支持操控浏览器、手机和桌面环境，内置提示注入防护与用户确认机制，在 Cua-Bench 测试中取得最高平均奖励。成本较低，适合长期运行的 agent 任务。

𝕏 Grok 1.5 支持静态图转 720p 视频，带运动与音效

xAI 的 Grok 1.5 现可在 Leonardo 平台上将静态图片转换为 720p、15 秒 长的电影级视频，包含运动和音效，一步完成。

𝕏 Gemini 两位核心贡献者离职加入 Anthropic

据 Bloomberg，Gemini关键贡献者Jonas Adler（AI 编码负责人）和Alexander Pritzel（基础训练核心）离开 Google DeepMind，加入Anthropic，分别补强编码和预训练能力。

𝕏 Unsloth 团队用 1-bit 压缩 GLM 5.2，可在 Mac Studio 本地运行达 21 tok/s

Unsloth团队采用1-bit 压缩技术优化开源模型GLM 5.2，转换为 GGUF 格式后可在256G 内存 Mac Studio上本地运行，速度达21 token/s，性能媲美 Claude 4.8 Opus 和 GPT-5.5。

𝕏 Sakana AI 的 Fugu Ultra 多模型系统上线 OpenRouter

Sakana AI的Fugu Ultra（多模型集体智能系统）已在OpenRouter上线。该系统整合多个前沿模型工作，代表 AI 开发架构从单一模型向多模型协作转变。

𝕏 Gemini 新检查点存在知识截止日期与实际能力不匹配问题

新检查点标注 2026 年 3 月知识截止，却不了解 2025 年底的重大事件，暗示 Gemini 恢复进度约 12-18 个月。

𝕏 Claude Fable 在 AWS 重新上线

Claude Fable已在AWS恢复服务，可能很快所有渠道都会恢复。

EVENT-DRIVEN INTELLIGENCE

免费先跟踪重点，再决定是否升级

每篇公开内容都对应三步：订阅每日情报、查看同主题历史上下文、升级 Pro 解锁搜索、研究和事件详情。

订阅每日情报查看同主题历史事件升级 Pro 解锁搜索 / 研究 / 事件详情

NEXT STEP · 留下邮箱

获取下一次重大事件提醒

每天一封精选情报，先用邮件建立复访，再决定是否升级到更深的追踪能力。

查看同主题历史事件升级 Pro 解锁事件详情