提示
×
取消
确定
当前位置:首页 > 新闻资讯
钱旭红院士元宵穿越:人工智能、量子、化学的超学科欢宴:“思维跃迁,从量子化学到人工智能——字节Seed眼中的DeepSeek和GPT“
来源:道器   发布时间:2026-03-11 09:49
简述
引言:钱旭红院士元宵穿越:人工智能、量子、化学的超学科欢宴日前,道器转发了 “量子位”题为 “字节Seed用化学思想搞AI,把DeepSeek-R1的脑回路拆成了分子结构” 推文。

引言:钱旭红院士元宵穿越:人工智能、量子、化学的超学科欢宴


微信图片_2026-03-11_094941_371.png


日前,道器转发了 “量子位”题为 “字节Seed用化学思想搞AI,把DeepSeek-R1的脑回路拆成了分子结构” 推文,钱旭红院士阅读后,溯源阅读并评论了字节Seed的黄文灏和哈尔滨工业大学、字节Seed的陈麒光等发表在预印本平台arXiv上 的论文原文“The Molecular Structure of Thought: Mapping the Topology of Long Chain-of-Thought Reasoning” (思维的分子结构:长链推理拓扑结构的绘制),并撰文如下。


道器(淘气)网/号创始者、Chinese Chemical Letters(中国化学快报)主编、TAO(道)主编


微信图片_2026-03-11_094945_287.png


跨学科与超学科的人工智能发展,量子思维也能成为导演


推文认为此论文的作者们,用化学思想去理解并优化开发大模型推理,创造性地提出了思维的分子结构“深度推理是共价键、自我反思是氢键、自我探索是范德华力”等新颖概念,创立了“语义异构体”和“分子合成框架”,并赞叹此论文的这波操作有点像当年薛定谔拿量子物理学公式推出分子生物学那感觉(意指《生命是什么》),给大模型推理这一已经风起云卷的领域,开了个挺清爽的新脑洞!


阅读了该论文原文后,甚为感慨和兴奋! 发现此推文和原论文内容确实非常好,值得一读!但有意犹未尽之处。比如,这里实际运用的化学思想即包括异构体、合成化学等思想内容,更包括了共价键、氢键、范德华力等(事实,还应该包括离子键、配位键)内容;既包括了分子结构,也包含了超分子结构。严格意义上讲,此论文是建立在量子化学原理和量子思维底层逻辑基础之上的,是经验化的量子思维运用。我之所以讲其经验化,是指何时何地用哪种思维模式、哪种键型或者作用力类似的思维,仍然需要试错,并无可清晰的规律,只有模糊感觉,目前还是由实践摸索而得出。


微信图片_2026-03-11_094948_324.png


图1. 基于三种关键“化学”键的假设:长思维链中的稳定分子结构


需要指出的是,文中有关氢键和离子键的表述和应用有模糊混淆之处,如进一步清晰,可能效果更好;如能把更多的化学键键型、各种相互作用力纳入进来(如生物体有基于分子的四种作用力:共价键、氢键、范德华力、远距离的疏水力),构建更广泛的分子结构、超分子结构类似的思维模式,效能可能更为突出。


无论如何,这是一篇可以让化学、量子科学、人工智能领域的人们深受启发的好文!如果我们能深入揭秘其中包含的超限思维、超学科特质、量子思维,如能对此论文和推文作进一步挖掘,将能够启发更多各行各业不同的人们,从而鼓励卓越的勇敢者在学科分化、固化、僵化的当今世界,为玉宇澄清而大闹天宫!因此,元宵节到来之际,故写下本文,以示庆贺。


现代化学自带量子思维模式,没有量子化学就没有现代化学


共价键为强键,其特点是两原子间的电子成对;氢键为弱键,是在氢原子供体、受体间因电负性差异而导致的静电相互作用或者电子的量子隧穿;范德华力为相邻分子基团或者原子的电子云跨空间的相互影响(因为瞬时/诱导偶极而产生的相互吸引或者排斥)。


如将这些量子化学概念与思维模式和人工智能大模型搭建关联在一起,其描述就成为:


1. 深度推理(共价键):是“强键”和“电子成对”。这对应于深度推理中紧密耦合、核心逻辑骨架的确立、其一旦断裂,整个结构就会崩塌。


2. 自我反思(氢键):是一种“弱键”,但它在“供体和受体间”形成连接。这类比了在反思行为中,将后续步骤(氢原子)与早期步骤(电负性原子受体)连接起来,形成“折叠”以稳定整体结构的功能。它的“弱”意味着连接可以动态地形成和断开,进行动态修正。


3. 自我探索(范德华力):是一种“很弱的相互作用”,且“跨空间”。这对应了探索行为在逻辑空间中建立松散、暂态的远距离关联,以探测新可能性,而不会立即形成强约束。它随时可以建立,也随时可以消散。


这些键在长思维链建构中的作用,可以用蛋白质这种有机大分子化合物的构建来比喻,包括:“深度推理”:形成并致密化核心逻辑结构(类比蛋白质一级结构形成);“自我反思”:致密化并稳定全局逻辑,压缩不一致的分支,引导向稳定状态收敛(类比蛋白质折叠);“自我探索”:扩展逻辑空间,避免陷入局部最优。从而让长思维链模仿了蛋白质折叠的三个阶段:骨架形成、稳定折叠和空间探索。为提升模型推理性能和RL稳定性提供了新思路。


这些量子化学类比不仅生动,而且在物理和化学层面上都相当严谨,确实能为理解大模型的复杂推理行为提供了一个极具洞察力的框架。而人的神经元、血流管道、信号通道都基于氨基酸多肽的蛋白质、基于碱基芳香杂环的核酸链、多糖链的折叠聚合等,其中涉及最多的即是此三类键或作用。而人类的认知和推理、思考,就是建立运行在这些神经元、蛋白质、核酸链、多糖链等承载体之上的。因此,这些量子化学模型或者思维方式对深刻理解人类的思考必有帮助。


微信图片_2026-03-11_094952_168.png


图2.两个稳定分子结构间冲突学习


谈及化学键的本质,不能忘记美国化学家莱纳斯·鲍林以及量子化学的早期遭遇。鲍林因为发现化学键的量子化学本质而获得诺贝尔化学奖(1954),此后还获得和平奖(1962)。他的研究兴趣包括量子力学、晶体结构学、矿物学、结构化学、麻醉学、免疫学、医学、进化理论。他所著的《化学键的本质》,被称为“化学史上的圣经”。他围绕共价键、离子键和金属键等化学键类型,通过简化量子力学方程,提出杂化轨道理论、电负性、共振理论、价键理论等核心概念,构建了化学键与物质性质的关联框架,探讨了氢键对蛋白质等生物大分子结构的影响,为结构生物学研究提供了方法论基础。


微信图片_2026-03-11_094955_844.png


图3.莱纳斯·鲍林所著的《化学键的本质》


鲍林依据量子化学而提出的有机化学共振论,于20世纪50至70年代,因不见容于苏共意识形态, 在苏联和东欧遭到了反复批判。受此影响,我国学术界也对共振论进行了长期批判。结果导致此后我国几代化学家、化工专家学者都无法正确运用共振论,也不能正确地画出有机分子的共振结构,严重影响了我国当时在材料、医药、生物等领域的教育和科研发展。此外,我国在翻译出版鲍林著作时也曾经出现过一些小错误。


基于化学键的量子本质,再阅此文,会更有感触


这篇论文提供了一个理解大模型复杂推理行为的新范式。其在AI领域的潜在贡献和可能局限性略述几点:


1. 新颖的跨学科视角:将实验化学、量子化学中的分子结构(共价键、氢键、范德华力)和蛋白质折叠的概念引入AI领域,用以解释LLM的长思维链现象。这个比喻非常精妙且富有跨界解释力,能够直观地描述不同推理行为(深度、反思、探索)之间的内在关系和相互作用,为理解复杂的推理动态提供了一个统一的理论框架。


2. 实用的方法学贡献(MOLE-Syn):基于理论洞察,提出了MOLE-Syn(思维的分子合成)这个实用框架。它巧妙地解决了高质量长思维链数据稀缺的问题,能够用成本更低的指令模型“合成”出媲美强模型蒸馏效果的数据。这不仅验证了理论的实用性,也为实际训练提供了更高效、更可控的路径。


3. 对AI行业现象的深刻解释:论文最后一部分分析了为什么现有LLM(如Gemini, Claude)的推理过程难以蒸馏。通过实验证明,总结和压缩等看似简单的步骤,实际上破坏了关键的“分子结构”(如氢键、范德华力),从而阻止了结构层面的模仿。这为当前AI行业的竞争态势提供了一个合理的科学解释。


此论文主要基于Llama、Qwen、DeepSeek-R1等主流模型。虽然结论具有很强的启示性,但其普遍性可能需要在更多样化(不同架构、不同规模)的模型上进行验证。如“局限性”部分所述,观察到的模式可能存在架构或训练配方偏差。


结语和展望


此文涉及到大语言模型中很重要的工作,即思维链,就是如何模仿人类思考问题过程,早期研究者把这个思考过程抽象成了一个线性的链式过程,这样方便计算和优化。但是这个抽象过于简单,不符合人类的真实思考过程,所以很多人在尝试如何让大模型的思维过程更接近人类,但挑战是长思维链设计过于复杂,计算和优化就很困难。此论文借鉴了化学分子式的构成,两者之间有很强的相似性,而同样的化学分子式结构的计算和优化早已在化学领域有很好的解决,将这个思想借鉴过来,就可能取得比原来线性思维链好得多的结果。


目前的论文和推文尚未明确涉及价键背后更本质的量子化学规律,如能在量子化学和AI思维模式之间建立更广泛的关系,历史上薛定谔量子力学理论导致DNA双螺旋结构发现的类似故事可能再次发生,未来大模型的 “AI基因”真可能会被发现,从而促使人工智能更快更好的发展;通过量子化学的介入、薛定谔熵减理论和普利高津耗散结构理论等化学热力学、分子热力学的介入,未来有可能走出一条更低能耗的大模型发展路径;如果在逻辑上和物质上能够同步打通大模型和人脑运行模式的基础,那么未来甚至可能基于此发展出类脑大模型。


目前这个针对LLM的推演,似乎没有定义出清晰的尺度层级,而只是在现象学层面“模拟”了价键,故可以说是经验化。从量子力学到价键理论再到分子结构的推演,其中必有大量的简化,如何把控跨尺度层级的规律演变是个难题。此外,价键理论本身并非是底层物理原理,而是量子力学在化学体系的“近似”;而LLM则更接近于宏观世界。这里面层级是容易含混,可能需要“介科学”在其中发挥作用。


特别申明,我无意表达"AI 推理的机制本质上是量子化学过程",只是强调量子化学提供了描述复杂系统中多尺度相互作用的成熟语言,其对理解AI 推理的拓扑结构具有独特的解释力——但这种解释力来自结构性的类比对应,而非物理机制的同一同构。量子化学思维一定程度上具有"元语言"的普适价值。如能根据键型理论预测哪些尚未尝试的推理结构能否有效,从而探索或者实现从"解释"到"预测"的跨越,如此跨学科超学科的范式就会有质的提升,甚至可能催生全新的大模型结构。


此文也告诉我们,不同学科背后有一些共同规律,比如这里的神经科学、大语言模型和化学分子式,背后的结构和计算有非常相似的地方,正好能够相互启发和借鉴。某个领域很难的问题,可能在另一个领域早就解决了,只是因为领域的“外衣”不一样,人们很难想到一块去。这也说明了跨界超限思维和协同的重要性。


我们已进入学科、专业、行业、领域大融合的时代,已进入物质发现和生产极度加速的时代。人工智能如同台风眼,驱动并引领加速了这些进程,并从各学科专业行业领域凝聚获得能量进一步加速飓风的形成和提升。在此过程中思维方式跨界超限的跃迁将对教育、科技、人才发展产生深远影响!