物理AI上限何在?凌迪科技以形变体仿真给出行业答案

2026-04-07 15:58   来源: 互联网

在上篇中,我们讲到:

仿真,是AI获取数据的关键来源。

但问题来了:什么样的仿真,才真正有价值?

答案是——并不是所有仿真都一样。

本期「SynReal Decode」,我们继续上一个问题:如果仿真是AI进入真实世界的关键,那么——什么样的仿真才真正有用?当AI开始面对真实世界时,很快就会发现:模拟一个“看起来像”的世界,并不难;但要模拟一个“行为正确”的世界,却极其困难。尤其是当对象从刚性物体,变成布料、软体等可形变物体时,问题的复杂度会急剧上升。这一期,我们就来解码:为什么形变体仿真,正在成为物理AI的关键分水岭。

1775546210423761.png

一、仿真的三个层次

从技术角度来看,仿真并不是一个单一概念,而是可以分成不同的层次。至少在当前的人工智能和机器人研究中,我们可以将仿真粗略划分为三个层次:由浅入深,难度与价值也逐级提升。

第一层:三维环境与空间仿真

第一个层次,是对物理世界中三维环境的仿真。这一层的核心目标,是还原真实世界中的空间结构和三维几何关系,让人工智能具备基本的三维感知和空间理解能力,从而在环境中做出合理决策。

例如,在一些视频生成模型中,常常会出现物体大小不一致、空间关系混乱的问题,本质原因就在于模型并没有真正理解三维空间结构。通过构建三维虚拟环境,让模型在其中观察、推理和学习,可以显著改善这类问题,使其形成更稳定的空间认知。

再比如机器人导航和自动驾驶。通过搭建三维虚拟城市、道路和室内场景,可以训练人工智能在复杂空间中进行定位、避障和路径规划。当人工智能具备了对三维空间的理解能力,我们可以将其称为一种“空间智能”。

第二层:刚性物体的物理仿真

第二个层次,是刚性物体的物理仿真。如果说在第一层中,三维物体主要是静态存在的,那么在这一层中,重点转向了机器人与物理世界交互时,对物体位置和状态产生的影响

在现实中,机器人的本体本身就是由多个刚性部件通过关节连接而成的系统(关节刚体系统)。机器人行走、攀爬、保持平衡,本质上都是在与地面等刚性物体进行物理交互。今天我们看到机器人能够在复杂地形甚至崎岖路面上稳定行走,很大程度上得益于刚性物理仿真结合强化学习所取得的成功。

同样,机械臂抓取杯子、手机等刚性物体,也可以通过刚性物理仿真来训练完成。这一层次的仿真在工业界和学术界已经相对成熟,并取得了大量成功应用。

第三层:形变体与复杂物理仿真

如果说前两个层次已经取得了较为显著的进展,那么第三个层次的挑战就要大得多,也是当前研究中的难点所在。

第三个层次,是对可形变物体以及流体等复杂物理现象的仿真。在真实世界中,除了刚性物体之外,更多的是各种各样的可形变物体——从我们穿的衣服、家里的窗帘和床单,到塑料袋、包装材料、植物,甚至水和空气。严格来说,流体本身没有固定形状,也可以视为一种极端的可形变物体。

1775546219124630.png

与刚性物体不同,可形变物体没有唯一的稳定形态,而是会随着环境、受力和接触方式不断改变形状。这使得机器人想要正确识别、理解并操作这些物体,难度大幅提升。

这一点在现实的人工智能系统中表现得尤为明显。以叠衣服为例,虽然今天已经有不少机器人展示了叠衣服的能力,但这些系统大多依赖真实世界中的大量示范数据,通过模仿学习实现。

本质上,它们是在成千上万次人工操作的基础上,做有限范围内的泛化。一旦换成更复杂的衣服款式,或者仅仅更换一种不同材质的面料,原有模型就可能无法正常工作。

从仿真到物理智能

我们认为,只有让人工智能真正理解物理世界、掌握物理规律,才能在复杂环境中稳定地与物理世界交互,从而实现更高层次的智能。具备这种能力的人工智能,才能被称为物理智能。

在这一过程中,形变体物理仿真具有决定性意义。它代表了仿真和数据合成能力的最高层次,直接决定了人工智能能够学习到多复杂、多真实的物理行为,也在很大程度上定义了物理智能所能达到的上限。

二、形变体物理仿真从何而来?

了解了形变体物理仿真的重要性,接下来一个自然的问题就是:形变体物理仿真从何而来?

从技术发展的角度看,形变体物理仿真并不是凭空出现的,而是与两个重要研究领域长期交汇、共同演进的结果。

一类来源:计算物理与工程模拟

第一个领域,是计算物理、机械工程等传统工程学科中广泛使用的数值模拟技术。这类方法主要用于模拟各类物体在受力条件下的形变过程,目的是判断结构是否安全、材料是否可靠、设计是否可行。

因此,这类仿真技术最关注的是数值结果的准确性。仿真计算出来的应力、形变、稳定性等结果,往往直接关系到工程上的成败,容不得太多误差。

但从人工智能与数据合成的角度看,这类仿真也存在明显局限。首先,它们通常并不强调视觉效果,很多时候只是以较简化的方式呈现结果。例如,在工程力学中,常见的是对二维截面进行分析,而不会完整模拟三维外观。其次,这类仿真往往对复杂的物体接触与碰撞处理得不够充分。更重要的是,工程仿真通常不以吞吐量为首要目标,计算成本较高、速度较慢。

而对于数据合成来说,仿真的核心优势恰恰在于“性价比”。如果一次仿真就需要大量计算资源和时间,就很难支撑大规模的数据生成。

另一类来源:计算机图形学

第二个重要来源,是计算机图形学。计算机图形学最早主要服务于影视特效、动画和游戏等数字娱乐行业。我们今天在电影中看到的逼真布料、头发、烟雾和流体效果,背后都离不开图形学中的物理仿真技术。

这类仿真有一个非常突出的特点:高度重视视觉效果。只要在视觉上“像真的”,哪怕在数值精度上做出一定简化,也往往可以接受。而这种特性,恰好与人工智能训练所需要的合成数据高度契合——对于学习感知与操作能力来说,视觉与交互层面的真实感往往比工程级数值精度更重要。

另一方面,计算机图形学长期面临性能约束。为了降低成本、提升效率,如何在有限计算资源下实现尽可能逼真的仿真,一直是图形学研究的核心问题之一。

一个极端但非常典型的例子,就是电子游戏。在游戏中,物理仿真可用的算力通常非常有限,这迫使研究者在仿真效果与计算开销之间不断权衡。也正是在这样的背景下,许多高效的物理仿真技术被发展出来。比如,今天在机器人仿真中被广泛使用的NVIDIA Isaac Sim 所采用的 PhysX 引擎,其最早的设计目标正是为游戏提供实时物理仿真。

多条路线的汇合

需要指出的是,这两个领域并不是彼此割裂的。事实上,它们之间一直存在交流和相互借鉴。从实际应用角度看,计算机图形学发展出的物理仿真技术,与人工智能对仿真和数据合成的需求非常接近。

更进一步来看,计算机图形学和计算机视觉(人工智能中负责理解图像和视频的重要分支)甚至可以被看作一枚硬币的两面:一方面,图形学致力于构建虚拟世界、生成图像和视频;另一方面,计算机视觉则试图从图像和视频中理解真实世界。

正是在这两条技术路线的交汇处,形变体物理仿真逐渐成为连接虚拟世界与真实世界、支撑物理智能发展的关键基础设施。

三、形变体物理仿真的挑战

既然形变体物理仿真如此重要,那么一个自然的问题是:为什么这一问题直到今天仍然如此困难?

从实践来看,形变体仿真的核心挑战主要集中在两个方面:真和快。

第一个挑战:真

“仿真”这个词本身就意味着希望通过数值计算,得到尽可能接近真实世界的结果。在这一点上,如何缩小仿真结果与真实世界之间的差距,也就是常说的 Sim-to-Real Gap,成为形变体仿真的首要难题。

真实世界中的物体具有丰富而复杂的材质特性。不同的面料、厚度、弹性和摩擦行为,都会显著影响形变体的运动和外观。但这些材质属性本身就难以准确测量,更难以通过统一模型精确描述。很多时候,仿真只能在模型层面做近似处理,这不可避免地带来与真实世界之间的偏差。

另一方面,形变体往往伴随着大量复杂的接触与摩擦关系,而且这些关系会随着物体形状变化不断产生和消失。例如,在叠衣服的过程中,布料既会与桌面接触,也会与自身形成多层自接触。如何在仿真中稳定处理这种动态、多点、多层次的接触关系,并避免穿透,是形变体仿真中最棘手的问题之一。即便在刚性物体仿真中,接触处理已经非常复杂,而在形变体场景下,这一难度还会被进一步放大。

第二个挑战:快

第二个重要挑战是效率。在电影特效中,我们确实可以实现以假乱真的视觉效果,但往往是在不计成本的前提下完成的。而一旦仿真被用于大规模数据合成,效率就成为无法回避的核心问题。只有仿真跑得足够快,数据才能被规模化地产生。

在这一前提下,效率相关的问题便会浮出水面。一种最常见、也最直接的做法,是为了速度牺牲真实性:降低仿真精度、使用更粗的时间步长,往往能显著提升运行速度,但代价是真实感与物理合理性的下降。

以前面提到的NVIDIA PhysX 引擎为例,它基于 Position-Based Dynamics(PBD)方法,在小规模问题上具有很高的效率,因此被广泛应用于游戏等实时场景中。但这种方法在物理正确性上存在先天不足,而且当问题规模增大、精度要求提高时,其效率往往会迅速下降。

真与快的权衡

因此,在很大程度上,“真”和“快”这两个目标彼此制约。形变体物理仿真的发展历程,本质上就是在两者之间不断寻找平衡的过程。

长期以来,计算机图形学一直致力于在真实感和效率之间取得更好的折中。而这种平衡也会随着计算能力的发展而不断演进。过去十多年中,以GPU 为代表的并行计算技术快速发展,极大推动了形变体仿真在速度与规模上的提升。如何让仿真算法更好适配 GPU 等并行硬件,实现更高的数据吞吐率,也成为形变体仿真研究中的重要方向。

四、我们的工作:面向物理智能的形变体仿真

前面我们讨论了形变体物理仿真为什么重要,也分析了它为什么困难。在这样的背景下,我们三个人——王华民、蒋陈凡夫和杨垠——所做的工作,正是试图回答一个现实而具体的问题:能否构建一种既“足够真实”,又“足够高效”,同时还能稳定扩展的形变体仿真体系,真正服务于人工智能的训练与学习?

围绕这一目标,我们在计算机图形学、物理仿真与人工智能的交叉领域,从不同侧重点出发持续开展研究。这些工作并非彼此孤立,而是逐步汇聚到同一个方向:把形变体物理仿真从“研究原型”,推进为面向物理智能的数据与仿真基础设施。

真:从“模型”到“材料”的物理真实(王华民)

形变体仿真的真实感,在很大程度上取决于材质本身。不同的布料、橡胶或软性材料,在弯曲、拉伸、摩擦等方面的行为差异巨大。如果材质模型与真实世界偏差过大,即便仿真在数值上再稳定,也很难为人工智能提供真正有价值的训练数据。

1775546233820951.png

因此,我们的一个重要方向是物理材质模型以及真实材质参数的采集与建模。这部分研究主要围绕两点展开:一是如何用合理、可控的模型刻画不同材料在受力和接触下的关键行为差异;二是如何通过实验和测量手段,从真实世界中获取材质参数,并将其映射到仿真模型中。

这一过程的目标,并不是追求工程级的极限精度,而是让仿真中的材料在行为层面“像真的”,同时具备足够的可控性和可泛化性。只有这样,仿真生成的数据才能在面对不同物体、不同材质时,依然对人工智能的学习过程有意义。

快:为什么必须是GPU 形变体仿真(王华民、杨垠)

对于人工智能而言,仿真不是偶尔运行一次的工具,而是一个需要长时间、高频率、大规模运行的数据引擎。这意味着,传统以CPU 为主、以单次高精度计算为目标的仿真方式,很难满足实际需求。

因此,我们从一开始就将形变体仿真的实现重心放在GPU 上。围绕 GPU 的并行架构,我们重新设计了形变体仿真的整体流程,使其能够在保证基本物理合理性的前提下,大幅提升仿真的吞吐能力,从而支持大规模数据生成。

1775546240211699.png

在这一方向上的工作,重点不在于“算得最精确”,而在于“在可接受的真实度下,跑得足够多、足够快”,使仿真真正具备工程可用性,能够跟上人工智能模型规模持续增长的节奏。

稳:用IPC 解决复杂接触下的稳定性问题(王华民、杨垠、蒋陈凡夫)

在形变体仿真中,最容易导致失败的往往不是形变本身,而是接触。对于机器人的训练而言,如何稳定处理机械臂与形变体之间的摩擦和接触,是能否学会可靠操作的核心关键。

尤其是在衣服、布料等场景中,物体既会与环境接触,也会与自身发生大量自接触。如果接触处理不稳定,仿真很容易出现穿透、抖动,甚至直接崩溃。

为此,我们共同参与并推进了基于IPC(Incremental Potential Contact)思想的接触处理方法。IPC 的一个重要优势在于,它能够在数值层面严格避免穿透,即使在多点、多层、自接触频繁变化的情况下,也能保持仿真的稳定性。

通过将IPC 与 GPU 形变体仿真相结合,我们在稳定性和效率之间取得了更好的平衡,这对于需要长期运行的数据合成任务尤为关键。

多:引入MPM,应对大形变和复杂材料行为(蒋陈凡夫)

除了基于网格的形变体模型之外,我们也系统性探索了MPM(Material Point Method)等连续介质方法在形变体仿真中的潜力。这一方向主要聚焦于如何更稳健地处理大形变、材料分离与重组,以及复杂接触行为。

相比传统网格方法,MPM 在面对剧烈形变、折叠和拓扑变化时,往往表现得更加稳定。这使其非常适合模拟布料、颗粒、软体物质,甚至某些流体行为。我们进一步探索了如何将 MPM 的思想与 GPU 并行计算结合,使其在保持物理合理性的同时,也具备足够的效率,从而能够用于大规模仿真和数据生成。

把这些工作放在一起,需要强调的是,我们并不把材质建模、GPU 仿真、IPC 或 MPM 看作彼此孤立的技术模块。真正重要的问题在于:它们能否组合起来,形成一个真正可用、可扩展的形变体仿真系统。

在这样一个系统中:

● 材质模型与真实参数采集提供物理真实感;

● GPU 形变体仿真提供规模化的数据吞吐能力;

● IPC 保障复杂接触下的稳定性;

● MPM 扩展可模拟的形变范围和材料类型。

它们共同服务的目标,是让人工智能能够在仿真环境中反复接触、理解和操作真实世界中最复杂、也最常见的柔性物体。

结语

回到最初的问题,人工智能要真正走向现实世界,关键不只是“看得懂”,而是能否可靠地与物理世界交互。而在这个过程中,形变体无处不在,也最难处理。

正因如此,形变体物理仿真是通向物理智能不可绕开的关键一环。只有当我们能够以足够真实、足够高效、足够稳定的方式模拟这些柔性物体,仿真数据才能真正支撑人工智能从感知走向行动、从理解走向实践。

这并不是终点,而是一项基础设施的建设。

物理智能的未来,正在从形变体仿真开始逐步展开。

本文由凌迪科技技术专家团队撰写与审核发布

凌迪科技技术专家团队

王华民

凌迪科技首席科学家,长期从事高性能、高精度物理仿真研究,是GPU 形变体仿真与柔性材料(面料)物理建模领域的国际知名学者。加入凌迪科技前,曾任美国俄亥俄州立大学计算机科学与工程系终身副教授,并在加州大学伯克利分校从事博士后研究。他在 SIGGRAPH、CVPR 等计算机图形学与计算机视觉顶级会议和期刊发表论文 80 余篇,其中包括 4 篇 SIGGRAPH 唯一作者论文。2025 年当选 ACM 杰出会员与 IEEE 资深会员,并担任 SIGGRAPH Asia 2026 论文委员会副主席。

蒋陈凡夫

美国加州大学洛杉矶分校(UCLA)数学系教授,人工智能与视觉计算实验室(AIVC Lab)主任,研究方向涵盖 物理 AI、3D 视觉计算、3D 生成式模型与具身智能。他是多项广泛使用的物理仿真方法与系统的提出者与推动者,包括 APIC、MLS-MPM 与 IPC,这些方法已成为学术界和工业界的重要基础工具。其研究获得 NSF、DOE 以及 Toyota、Amazon、Sony、Adobe、Style3D 等机构与企业支持,并多次在 SIGGRAPH、ICRA、IROS 等顶级会议获得最佳论文或荣誉提名。

杨垠

美国犹他大学Kahlert School of Computing 副教授,联合领导 Utah Graphics Lab,并同时隶属于 Utah Robotics Center,具有图形学、仿真与机器人深度交叉的研究背景。曾在新墨西哥大学和克莱姆森大学任教,博士毕业于德州大学达拉斯分校(David Daniel Fellowship)。曾获 NSF CRII 奖与 CAREER 奖,研究重点是为图形学、物理仿真、深度学习、视觉和机器人等领域开发高效、可扩展、面向真实应用的计算方法。


责任编辑:Linda
分享到:
0
【慎重声明】凡本站未注明来源为"中华财经网"的所有作品,均转载、编译或摘编自其它媒体,转载、编译或摘编的目的在于传递更多信息,并不代表本站赞同其观点和对其真实性负责。如因作品内容、版权和其他问题需要同本网联系的,请在30日内进行!