Home
avatar

taoleb

每日AI新闻速递-11月25日:谷歌发布嵌套学习范式,OpenAI承认落后谷歌将推新模型

每日AI新闻速递-11月25日

🎨 生成式AI

谷歌发布《Attention Is All You Need》V2版,嵌套学习范式重构AI训练

谷歌发布革新性的嵌套学习(Nested Learning)机器学习范式,以全新方式重新审视模型训练流程。该范式将模型视为一组嵌套的优化问题,每个子问题都拥有独立的工作流程和优化目标。

核心创新突破

  • 通过关联记忆机制保留历史信息
  • 采用更新频率分层实现差异化训练
  • 引入优化器即记忆模块实现智能决策
  • 实现”早期层高频刷,后期层低频整合”的新训练框架

显著优势

  • 可减轻甚至避免”灾难性遗忘”问题
  • 基于此推出的HOPE模型在语言建模困惑度上表现最优
  • 常识推理准确率达到业界领先水准
  • 在长上下文大海捞针任务中展现出卓越的内存管理能力

意义分析

  • 标志着深度学习训练范式的重大进步
  • 为解决持续学习问题提供新思路
  • 预示着更高效模型架构的新方向

OpenAI内部备忘录曝光:奥特曼承认谷歌威胁,新模型Shallotpeat即将推出

根据The Information获得的OpenAI内部文件,OpenAI CEO萨姆·奥特曼在最近的员工会议中坦诚面对谷歌在AI领域的强势进展。

竞争态势确认

  • 奥特曼向员工承认谷歌最近的AI突破可能给公司带来短期经济压力
  • OpenAI研究员早已知晓谷歌开发了超越OpenAI的Gemini 3模型
  • 奥特曼间接承认当前处于被追赶的位置
  • 预计外界会对此有一阵子的负面评价

应对策略

  • OpenAI计划在未来几个月推出代号”Shallotpeat”的新模型
  • 该新模型专门针对预训练过程中发现的问题进行修复
  • 目标是追赶谷歌在预训练方面的技术突破
  • 力求重新建立竞争优势

行业影响

  • 预示着两大AI巨头的竞争将进一步加剧
  • 新模型的发布可能带来模型能力的新一轮飞跃
  • 行业创新节奏将继续加快

Lovart设计Agent正式接入Nano Banana Pro,创意工具全面升级

设计AI Agent Lovart正式宣布与谷歌Nano Banana Pro深度整合,为创意工作者带来专业级的设计辅助能力。

功能特性

  • 支持一次性处理14张图片元素进行组合设计
  • 能够直接生成专业级设计成品
  • 支持输出视频格式创意内容
  • 拥有完整的设计工具链

创新编辑能力

  • 推出独家Touch Edit功能
  • 通过简单点击动作即可精准修改细节
  • 无需编写复杂Prompt描述
  • “编辑元素”功能将图片分层可编辑

用户优惠

  • 11月30日前订阅Basic及以上用户可享365天优惠
  • 在会员期间可无限量使用Nano Banana Pro
  • 完全免除积分消耗
  • 大幅降低创意工作成本

MCP社区推出MCP Apps提案,告别纯文本交互时代

由OpenAI和Anthropic核心维护者共同推出的MCP社区发布MCP Apps提案(SEP-1865),标志着AI交互方式的重大进化。

提案核心内容

  • 规范对交互式用户界面的支持标准
  • 引入拼接轨迹图技术
  • 实现状态转移场管理
  • 支持预先声明的资源机制

技术革新

  • 使MCP服务器能直接向主机提供可视化操作界面
  • 基于MCP-UI框架构建
  • 集成OpenAI Apps SDK能力
  • 实现真正的图形化交互

生态采用

  • 已被Postman采用
  • Shopify集成该标准
  • Hugging Face正式支持
  • 极有可能成为未来行业通用范式

🚀 创新应用

北大哲学博士打造AI短剧生成神器,一人干翻一个剧组

北大哲学博士刘耕创办的Elser.AI正在革新视频创作行业,用AI技术实现”创作平权”。

产品特色

  • 完整的AI短剧生成Agent
  • 支持从剧本到分镜到成片的全流程创作
  • 用户可精细控制角色形象、构图景深、运镜动作等所有细节
  • 极大降低专业视频制作门槛

用户规模

  • 在完全没有宣传的情况下积累了20万全球活跃用户
  • 用户满意度和保留率双高
  • 海外需求强劲

后续计划

  • 海外版将于12月1日正式上线
  • 全线接入Nano Banana Pro能力
  • 所有Waitlist登记用户将收到首波邀请
  • 预计上线后增长将显著加速

创意意义

  • 打破专业视频制作的高技术壁垒
  • 赋能全球创意工作者
  • 预示着短视频创作工具的新趋势

🔬 前沿科技突破

陶哲轩亲测Gemini:十分钟破解困扰学界多年的数学难题

菲尔兹奖得主陶哲轩通过Gemini Deep Think在十分钟内完成了困扰数学界多年的Erdős #367号问题的证明补全。

研究进展

  • 该问题涉及连续整数结构的乘法数论领域
  • 陶哲轩使用Gemini Deep Think十分钟完成主要证明思路
  • Boris Alexeev随后用Harmonic的Aristotle工具用2-3小时完成Lean形式化
  • 问题在AI与人类协同下最终得到完整解决

行业成就

  • 近期Erdős问题网站上陆续有6个难题通过AI辅助得以解决
  • 许多研究者开始系统性使用AI工具进行文献查询
  • AI数学辅助能力获得国际数学界认可

深远意义

  • 证明AI可直接参与基础数学研究
  • 加速科学发现进程
  • 人机协作模式在学术界日趋成熟

Android Quick Share将兼容苹果AirDrop,平台壁垒正式松动

Google宣布Pixel 10系列正式支持原生AirDrop能力,标志着Android和iOS生态首次在核心功能层面打破隔阂。

功能实现

  • Pixel 10系列可直接向iPhone隔空投送照片及文件
  • iPhone反向亦可向Android设备投送
  • 实现真正跨平台无缝传输

实现背景

  • 该功能实现得益于欧盟《数字市场法》
  • 该法案要求苹果在iOS 26支持Wi-Fi Aware标准
  • Google借此标准实现了与AirDrop的兼容

使用条件

  • Android设备需为Pixel 10系列
  • iPhone/iPad需升级至iOS 26
  • 需启用AirDrop”所有人”模式
  • Google承诺将扩展至更多Android设备

产业影响

  • 预示着平台间互操作性增强趋势
  • 用户体验将显著改善
  • 生态开放程度达到新高度

港科大机器人完美上篮!宇树G1打造篮球Demo新纪录

香港科技大学团队使用宇树G1机器人实现了全球首个能在真实场景中完成篮球动作的demo。

技术成就

  • 1米3高度的机器人完成三步上篮等复杂技能
  • 在真实环境中完成多种篮球动作
  • 展现出卓越的动作协调能力

技术基础

  • 基于SkillMimic-V2技术框架
  • 通过拼接轨迹图实现精确运动控制
  • 采用状态转移场管理复杂状态
  • 自适应轨迹采样提高泛化能力

发展轨迹

  • 2023年PhysHOI在仿真环境验证可行性
  • 2024年实现真实环境应用
  • 得益于机器人本体性能提升
  • 技术落地速度显著加快

未来展望

  • 机器人运动能力逐步接近人类水准
  • 动作学习效率大幅提升
  • 复杂任务协作成为可能

💡 产业观点

DeepMind掌门人Demis Hassabis谈Gemini 3:谷歌从”追赶者”变身”领先者”

DeepMind CEO Demis Hassabis在最新采访中详细阐述了谷歌AI战略的转变和对AGI路线的思考。

战略地位转变

  • 谷歌AI叙事正从”奋力追赶”转变为”处于领先地位”
  • Gemini 3在”人类终极考试”得分从21.6%飙升至37.5%
  • 性能提升幅度创历史新高
  • 竞争态势彻底逆转

通往AGI的路径

  • 预计还需5-10年及一两个重大突破
  • 需要攻克世界模型等关键技术
  • 物理智能将成为重要突破口
  • 目前扩展定律仍然有效但存在边际效用递减

对AI泡沫的看法

  • 认为”泡沫”这个说法过于二元化
  • 种子轮投资确实存在泡沫风险
  • 但应用层蕴含真实价值
  • 前沿科技领域(药物发现、机器人)具有巨大潜力

产业建议

  • 需要区分不同阶段的投资价值
  • 应重视落地应用而非概念炒作
  • 长期投资仍有丰厚回报

🏆 今日总结

本日AI行业呈现出多层次、多领域的创新态势:

技术突破层面:谷歌发布嵌套学习范式、Gemini 3性能飙升,推动AI能力跃升

竞争格局演变:OpenAI承认落后、准备反击,两大巨头竞争白热化

应用创新加快:Lovart、Elser.AI等创意工具接入新模型,赋能各行业创意工作

跨平台互操作:Android与iOS隔阂消除,平台生态开放趋势强化

人机协作深化:AI在数学研究、机器人运动中展现核心价值,学术与工业应用齐飞

标准体系完善:MCP Apps提案出台,AI交互方式步入规范化阶段

这一天的发展充分说明AI技术正在从理论研究走向全面实用化。谷歌的技术突破不仅推动自身进步,更是激发整个行业的创新竞争。从底层算法到应用工具,从基础科研到文化创意,AI正在以前所未有的速度渗透各个领域。这种多层次的同步进化,预示着AI在2026年将迎来更加广泛而深入的应用普及时代。

AI周报 谷歌 OpenAI 嵌套学习 Nano Banana Pro MCP 机器人 AI应用 数学AI 设计工具