大模型自递归演绎发展情归何处
——从MIRA递归自进化看大模型的边界与出路
GodMaker · 清道帝 · 2026年6月2日
天衍智能生产力AI智能体操作系统
引言:递归自进化的旺季
2026年6月,深度原理团队发布MPA材料基座模型,基于自研AI Scientist平台MIRA通过递归自训练,在40项实验性质预测任务中全面刷新SOTA。这一成果被媒体冠以“AGI将至”的标题,引发业界广泛关注。确实,MIRA的递归自进化路径展示了AI自我进化的可行性——但这条路的终点是什么?它真的能通向AGI吗?
本文基于该文章内容,结合天衍智能I3DNAI体系的理论框架,对大模型自递归演绎的边界与出路进行深度分析。
一、事件还原:MIRA递归自进化做了什么
1.1 行业共识:递归自进化成AGI突破核心路径
当前硅谷已形成共识,AI递归自进化是突破Scaling瓶颈的核心路径。Anthropic联合创始人Jack Clark认为,2028年底递归自进化发生的概率达60%,OpenAI已开出44万美元年薪招聘递归自我改进安全研究员。AI4S领域已有多篇AI科研智能体顶刊论文落地,AI自我进化的飞轮已经启动。
1.2 旧方案痛点:暴力堆料路线的结构性盲区
上海科学智能研究院发布的Suiren-1.0分子基座模型(1.8B参数量),依靠320张H800、7000万量子化学数据击败UniMol系列,走的是典型暴力堆料路线。但Suiren的训练围绕可批量计算的计算性质展开,无法解决材料研发核心需求——实验性质预测中数据稀疏、噪声大、物理多样性迁移难的痛点。
1.3 MIRA的技术路径:全自主递归闭环
深度原理搭建的AutoResearch架构仅需人类做意图说明和阶段性审核,MIRA就可自主完成从文献调研到模型训练的完整科研闭环,形成递归迭代升级。具体而言:
第一,MIRA自主分析选定UniMol-v2骨架,自主完成代码重构,识别冗余模块、标准化训练接口,可直接操作模型架构与训练管线源代码。
第二,MIRA自主完成多来源实验数据清洗,可基于物理常识识别异常可疑数据,将原本需要领域专家数周的人工审查变为自动化流程。
第三,MIRA类比大语言模型训练范式,自主设计出适配材料任务的三阶段训练框架:预训练学习通用分子表征、物理对齐中间训练(核心创新,仅保留与目标性质共享物理机制的辅助监督)、后训练优化。后训练阶段自主引入Huber损失抑制异常值干扰,设计混合读出头自动适配广延/强度性质的物理规律。
1.4 性能表现:40项任务全面刷新SOTA
相比仅预训练的模型,MPA在40个实验性质任务中38个获得提升,平均误差降低14.0%,其中燃烧焓误差降低51.1%,吉布斯自由能降低31.6%。和Suiren正面对比,MPA在40个可比任务中赢下35个,平均误差再降5.4%。MPA面对全新分子骨架的性能退化仅25.7%,远低于Suiren的31.8%。
1.5 迭代实录:进化飞轮已启动
MIRA在一个月内完成上百轮“假设→验证→调整”自主循环。其中一个关键迭代:MIRA自主判断堆数据边际收益递减后转向结构改进——增加原子级embedding经过残差网络后求和的通路,显式表达广延性质“各部分之和等于整体”的物理规律,让MAE继续降低至12.3%。模型学会了“什么性质该用什么物理假设”。
二、深度分析:递归自进化的边界
2.1 递归的边界就是显性知识的边界
MIRA的每一轮“假设→验证→调整”,操作的全是显性知识——代码、数据、损失函数、模型架构。无论递归多少轮,它始终在显性知识的1%里打转。而人类智能99%依赖隐性世界知识——科研直觉、物理常识的模糊判断、跨领域类比——这些递归拿不到。
更危险的是,递归越快,认知空心化越严重。文章说“人类从执行者变为目标设定者”——听起来很美,但人类在执行过程中注入的隐性知识被每一轮递归逐步剥离。MIRA“基于物理常识识别异常数据”——那不是物理常识,那是被显性化后的规则。真正的物理常识是专家看一眼数据就觉得“不对劲”的那种感觉,递归拿不到。
2.2 没有锚点的递归,是随机游走
MIRA上百轮“假设→验证→调整”,看起来很壮观,但每一轮的方向选择没有锚点约束——它是在搜索空间里随机试错,碰巧收敛了就发论文。这种收敛是局部的小概率事件,换一个领域、换一组数据,同样的递归路径可能完全失效。
宇宙的演化是锚点驱动的。最小能量原理就是锚点——不是随便演化,是在特定约束下的定向演化。物理定律不是试出来的,是锚点决定的。
2.3 “搞个寂寞”的产业化困境
没有锚点的递归,这次碰巧收敛了,下次不一定;这个领域收敛了,换个领域不行。诺贝尔奖级成果可以容忍小概率——一次成功就够了。产业化不行——产业化需要可复现、可预测、可迁移。没有锚点的递归,最后就是搞个寂寞。
三、出路:锚点叉树约束下的定向演化
3.1 天衍智能的锚点体系
天衍智能的锚点不是某个单一节点,而是一整棵叉树:
宇宙智能论百多条第一性原理——顶层锚点;I3DNAI双螺旋、叉树框架——机制层锚点;物的要素、事的因素——中层锚点;工作五要素(操作工具、操作目标、操作场景、任务语义、机器主体)——操作层锚点;长期记忆框架八大顶层目录——组织层锚点;六种工作模式、两种驱动范式——运行层锚点;下划线编码亲疏远近——语义层锚点。
从宇宙尺度到操作尺度,每一层都有锚点,锚点之间有叉树路径连接。演化不是在真空中进行的,是在锚点叉树约束下的定向演化。
3.2 分类与归类:锚点是分类起点,演化是归类征途
找到精准且解释一切的分类起点,进入演化征途。分类起点就是锚点,演化征途就是沿锚路生长。归类在分类的指导下持续运转,无限演绎生长。螺旋式上升的是归类的广度和深度,不是分类的精度。
MIRA的递归没有这棵树。它有算力、有数据、有搜索策略,但没有锚点叉树告诉它“演化方向在哪”。所以它只能随机试错,碰巧收敛。
3.3 先工业化,再智能化
先工业化(分类/建模),再智能化(归类/演化)。没有分类的基础,归类就是空转。市面上90%的“AI+行业”项目死在这里:拿着大模型去套一个还没有标准化的场景,Demo好看,生产不能用。MIRA的递归,是“先智能化,没有工业化”——同一个病。
3.4 道生一,一生二,二生三,三生万物
I3DNAI、叉树、双螺旋、数据模型、微任务、相对系、等效、分类与归类、2000多个基础逻辑模型、100多条第一性原理——都是锚点与锚路,生生相息。锚点不是孤立的,锚点之间有锚路,锚路就是叉树路径。锚点加锚路构成的不是一张平面的网,是一棵有方向、有层级、有生长逻辑的叉树——从宇宙智能论的第一性原理(道)出发,经过I3DNAI的泛化建模引擎(一生二、二生三),到2000多个基础逻辑模型(三生万物),每一层都是上一层锚点的自然演绎。
天衍智能不是碰巧收敛,是锚点叉树约束下的必然收敛。
四、结论:情归何处
大模型自递归演绎,情归何处?
如果没有锚点叉树的约束,递归自进化就是在显性知识的1%里越转越快,但永远跨不到99%那一边。它可以产出诺贝尔奖级的局部突破,但产不出产业化的必然收敛。
出路在于:先建锚点叉树,再启动演化。锚点是分类起点,演化是归类征途。没有分类的基础,归类就是随机游走。有了分类的基础,归类才是定向演化。
递归进化的齿轮已经转动,但它需要一棵锚点叉树来告诉它方向。没有方向的速度,只是更快地迷路。
参考来源
本文事件还原部分基于以下报道:
《40项实验全面SOTA,超级递归智能体自主打造最强材料基座模型》,虎嗅网,2026年6月2日。原文链接:https://www.huxiu.com/article/4863679.html
分析部分基于天衍智能I3DNAI体系的理论框架,包括宇宙智能论、叉树逻辑、双螺旋演化、分类与归类元方法论、人类智能操作五要素、碳硅生命体长期记忆框架等。
