天眼早报
🤖 AI 大模型
𝕏 Mirendil AI 获 a16z 和 Kleiner Perkins 领投 2 亿美元种子轮,构建自主 AI 研究系统
Mirendil AI 由前 Anthropic、xAI、Google DeepMind、OpenAI 研究员创立,获得 2 亿美元 种子轮融资,由 a16z 和 Kleiner Perkins 领投,NVIDIA 等跟投,用于构建自主进行 AI 研发的智能体系统。该融资标志着前沿 AI 研究从少数实验室走向更开放的格局。
𝕏 Krea 2 开源图像模型发布,DiT 架构性能进前十
Krea 2 开源系列图像生成基础模型,采用 DiT 架构,集成 iREPA、改进 VAE 和 Qwen3-VL。五阶段训练管道(预训练→SFT→偏好优化→强化学习),在 Artificial Analysis 文生图排行榜进入前十。权重和推理代码宽松许可证开源。
𝕏 GPT-5.5 Instant 更新:理解意图与复杂约束能力提升
OpenAI 发布 GPT-5.5 Instant 新版本,核心提升:对话更 有趣、更能理解问题背后 意图、处理复杂 约束 更可靠,并在 购物 和 本地推荐 场景优化。付费用户今日可用,免费用户明天推送。
𝕏 OpenThoughts-Agent 发布,32B 模型平均 44.8% 性能
斯坦福 NLP 组发布 OpenThoughts-Agent 和 OpenThinkerAgent-32B,基于 Qwen-3 开源数据训练的强 agentic 模型,在 7 项 agent 基准 上平均得分 44.8%。
𝕏 Gemini 3 Pro 首次在 ARC-AGI-2 上达到 23% 以上
Gemini 3 Pro 于 2025 年 11 月成为首个在 ARC-AGI-2 上得分超过 23% 的模型(实际得分 31%)。闭源与开源模型之间仍存在 8-12 个月 差距,但开源模型表现更不均衡。
𝕏 OpenAI 发布首款自研 AI 芯片 Jalapeño
OpenAI推出首款自研 AI 芯片Jalapeño,与博通合作设计,专为推理优化,9 个月完成流片,能效和利用率显著提升。这标志着 OpenAI 从购买算力向垂直整合转型。
𝕏 Kog 在 Hugging Face 开源 2B 模型,推理速度超 3000 tokens/s
Kog 在 Hugging Face 上开源了 2B 参数模型,该模型曾演示运行速度超过 3000 tokens/s,推理性能突出。
𝕏 Qualcomm 与 Hugging Face 合作,将开放模型带到 Qualcomm 平台
Qualcomm 与 Hugging Face 宣布合作,用户可将任何模型部署到 Qualcomm 平台及通过 Modular 扩展到更广范围。Hugging Face 将为 Pro 订阅者部署 Qualcomm 平台支持推理。
𝕏 字节发布豆包 Doubao-Seed-2.1-Pro 模型,实测 coding 能力突出
字节跳动发布新模型Doubao-Seed-2.1-Pro,集成在TRAE Work CN中免费使用。实测可一键生成完整产品落地页、VLM 界面还原、3D 小游戏自测自修,复杂长任务仍与主力模型有差距,但日常 coding 实用性较高。
𝕏 OpenAI 用 GPT-5 Pro 理解实验结果,模型独立发现关键机制
OpenAI 研究员使用 GPT-5 Pro 分析多年前实验结果,模型成功识别出背后的关键机制。相关文章和图表已发布。
𝕏 GLM 5.2 在 ARC-AGI-2 上达 22.8%,成本 0.25 美元/任务,为最佳中国模型
GLM 5.2 在 ARC-AGI-2 基准上取得 22.8% 成绩,为中国模型最佳,与 Opus 4.5 (16K) 持平;Grok 4.20 达到 65%,与 Opus 4.7 相当。GLM-5.2 每任务成本仅 0.25 美元,仅为 GPT-5.5 的 1/7.5,较 2025 年 5 月最佳模型的 3.0% 提升 7.6 倍。
𝕏 Gemini 3.5 Flash 原生支持 Computer Use 功能
Google DeepMind 的 Gemini 3.5 Flash 获得原生 Computer Use 能力,支持操控浏览器、手机和桌面环境,内置提示注入防护与用户确认机制,在 Cua-Bench 测试中取得最高平均奖励。成本较低,适合长期运行的 agent 任务。
𝕏 Grok 1.5 支持静态图转 720p 视频,带运动与音效
xAI 的 Grok 1.5 现可在 Leonardo 平台上将静态图片转换为 720p、15 秒 长的电影级视频,包含 运动 和 音效,一步完成。
𝕏 Gemini 两位核心贡献者离职加入 Anthropic
据 Bloomberg,Gemini关键贡献者Jonas Adler(AI 编码负责人)和Alexander Pritzel(基础训练核心)离开 Google DeepMind,加入Anthropic,分别补强编码和预训练能力。
𝕏 Unsloth 团队用 1-bit 压缩 GLM 5.2,可在 Mac Studio 本地运行达 21 tok/s
Unsloth团队采用1-bit 压缩技术优化开源模型GLM 5.2,转换为 GGUF 格式后可在256G 内存 Mac Studio上本地运行,速度达21 token/s,性能媲美 Claude 4.8 Opus 和 GPT-5.5。
𝕏 Sakana AI 的 Fugu Ultra 多模型系统上线 OpenRouter
Sakana AI的Fugu Ultra(多模型集体智能系统)已在OpenRouter上线。该系统整合多个前沿模型工作,代表 AI 开发架构从单一模型向多模型协作转变。
𝕏 Gemini 新检查点存在知识截止日期与实际能力不匹配问题
新检查点标注 2026 年 3 月知识截止,却不了解 2025 年底的重大事件,暗示 Gemini 恢复进度约 12-18 个月。
𝕏 Claude Fable 在 AWS 重新上线
Claude Fable已在AWS恢复服务,可能很快所有渠道都会恢复。
EVENT-DRIVEN INTELLIGENCE
免费先跟踪重点,再决定是否升级
每篇公开内容都对应三步:订阅每日情报、查看同主题历史上下文、升级 Pro 解锁搜索、研究和事件详情。