06月25日 · 科技早报

天眼早报

科技|2026年06月25日|61 分钟阅读
来源:1238 条推文 + 162 篇 RSS 文章·Lanyun·BatchV2 生成·2026-06-24 — 2026-06-25
分享
AI 速读15 条精选

🤖 AI 大模型

𝕏 Mirendil AI 获 a16z 和 Kleiner Perkins 领投 2 亿美元种子轮,构建自主 AI 研究系统

Mirendil AI 由前 Anthropic、xAI、Google DeepMind、OpenAI 研究员创立,获得 2 亿美元 种子轮融资,由 a16zKleiner Perkins 领投,NVIDIA 等跟投,用于构建自主进行 AI 研发的智能体系统。该融资标志着前沿 AI 研究从少数实验室走向更开放的格局。

𝕏 Krea 2 开源图像模型发布,DiT 架构性能进前十

Krea 2 开源系列图像生成基础模型,采用 DiT 架构,集成 iREPA、改进 VAE 和 Qwen3-VL。五阶段训练管道(预训练→SFT→偏好优化→强化学习),在 Artificial Analysis 文生图排行榜进入前十。权重和推理代码宽松许可证开源。

𝕏 GPT-5.5 Instant 更新:理解意图与复杂约束能力提升

OpenAI 发布 GPT-5.5 Instant 新版本,核心提升:对话更 有趣、更能理解问题背后 意图、处理复杂 约束 更可靠,并在 购物本地推荐 场景优化。付费用户今日可用,免费用户明天推送。

𝕏 OpenThoughts-Agent 发布,32B 模型平均 44.8% 性能

斯坦福 NLP 组发布 OpenThoughts-AgentOpenThinkerAgent-32B,基于 Qwen-3 开源数据训练的强 agentic 模型,在 7 项 agent 基准 上平均得分 44.8%

𝕏 Gemini 3 Pro 首次在 ARC-AGI-2 上达到 23% 以上

Gemini 3 Pro 于 2025 年 11 月成为首个在 ARC-AGI-2 上得分超过 23% 的模型(实际得分 31%)。闭源与开源模型之间仍存在 8-12 个月 差距,但开源模型表现更不均衡。

𝕏 OpenAI 发布首款自研 AI 芯片 Jalapeño

OpenAI推出首款自研 AI 芯片Jalapeño,与博通合作设计,专为推理优化,9 个月完成流片,能效和利用率显著提升。这标志着 OpenAI 从购买算力向垂直整合转型。

𝕏 Kog 在 Hugging Face 开源 2B 模型,推理速度超 3000 tokens/s

KogHugging Face 上开源了 2B 参数模型,该模型曾演示运行速度超过 3000 tokens/s,推理性能突出。

𝕏 Qualcomm 与 Hugging Face 合作,将开放模型带到 Qualcomm 平台

QualcommHugging Face 宣布合作,用户可将任何模型部署到 Qualcomm 平台及通过 Modular 扩展到更广范围。Hugging Face 将为 Pro 订阅者部署 Qualcomm 平台支持推理。

𝕏 字节发布豆包 Doubao-Seed-2.1-Pro 模型,实测 coding 能力突出

字节跳动发布新模型Doubao-Seed-2.1-Pro,集成在TRAE Work CN中免费使用。实测可一键生成完整产品落地页、VLM 界面还原、3D 小游戏自测自修,复杂长任务仍与主力模型有差距,但日常 coding 实用性较高。

𝕏 OpenAI 用 GPT-5 Pro 理解实验结果,模型独立发现关键机制

OpenAI 研究员使用 GPT-5 Pro 分析多年前实验结果,模型成功识别出背后的关键机制。相关文章和图表已发布。

𝕏 GLM 5.2 在 ARC-AGI-2 上达 22.8%,成本 0.25 美元/任务,为最佳中国模型

GLM 5.2 ARC-AGI-2 基准上取得 22.8% 成绩,为中国模型最佳,与 Opus 4.5 (16K) 持平;Grok 4.20 达到 65%,与 Opus 4.7 相当。GLM-5.2 每任务成本仅 0.25 美元,仅为 GPT-5.5 的 1/7.5,较 2025 年 5 月最佳模型的 3.0% 提升 7.6 倍。

𝕏 Gemini 3.5 Flash 原生支持 Computer Use 功能

Google DeepMindGemini 3.5 Flash 获得原生 Computer Use 能力,支持操控浏览器、手机和桌面环境,内置提示注入防护与用户确认机制,在 Cua-Bench 测试中取得最高平均奖励。成本较低,适合长期运行的 agent 任务。

𝕏 Grok 1.5 支持静态图转 720p 视频,带运动与音效

xAIGrok 1.5 现可在 Leonardo 平台上将静态图片转换为 720p15 秒 长的电影级视频,包含 运动音效,一步完成。

𝕏 Gemini 两位核心贡献者离职加入 Anthropic

据 Bloomberg,Gemini关键贡献者Jonas Adler(AI 编码负责人)和Alexander Pritzel(基础训练核心)离开 Google DeepMind,加入Anthropic,分别补强编码和预训练能力。

𝕏 Unsloth 团队用 1-bit 压缩 GLM 5.2,可在 Mac Studio 本地运行达 21 tok/s

Unsloth团队采用1-bit 压缩技术优化开源模型GLM 5.2,转换为 GGUF 格式后可在256G 内存 Mac Studio上本地运行,速度达21 token/s,性能媲美 Claude 4.8 Opus 和 GPT-5.5。

𝕏 Sakana AI 的 Fugu Ultra 多模型系统上线 OpenRouter

Sakana AIFugu Ultra(多模型集体智能系统)已在OpenRouter上线。该系统整合多个前沿模型工作,代表 AI 开发架构从单一模型向多模型协作转变。

𝕏 Gemini 新检查点存在知识截止日期与实际能力不匹配问题

新检查点标注 2026 年 3 月知识截止,却不了解 2025 年底的重大事件,暗示 Gemini 恢复进度约 12-18 个月

𝕏 Claude Fable 在 AWS 重新上线

Claude Fable已在AWS恢复服务,可能很快所有渠道都会恢复。


EVENT-DRIVEN INTELLIGENCE

免费先跟踪重点,再决定是否升级

每篇公开内容都对应三步:订阅每日情报、查看同主题历史上下文、升级 Pro 解锁搜索、研究和事件详情。

分享

NEXT STEP · 留下邮箱

获取下一次重大事件提醒

每天一封精选情报,先用邮件建立复访,再决定是否升级到更深的追踪能力。