英伟达重磅落地!物理AI进入新纪元!(附A股核心标的)

专栏头像

热门主题产业链

放松眼睛听

在2026中国台北GTC大会上,英伟达正式官宣重磅产品——NVIDIACosmos3,这款面向物理AI的开放世界基础模型,凭借全新混合Transformer架构,打通视觉推理、世界生成、动作预测三大核心能力,成为全球首款完全开放的全模态物理AI模型。

物理AI是人工智能从虚拟智能迈向具身智能的关键桥梁。随着部署量提升、数据持续回流,物理AI有望进入“数据增长—模型迭代—能力提升—场景扩张”的飞轮。

一、物理AI是从虚拟智能迈向具身智能的关键桥梁

物理AI(PhysicalAI)这个词在2024年由黄仁勋率先广泛使用,是指使用运动技能理解现实世界并与之进行交互的模型,它们通常封装在机器人或自动驾驶汽车等自主机器中。利用物理AI,自主机器能够感知、理解并在现实(物理)世界中执行复杂的操作。从外延上看,物理AI至少覆盖三个明确场景:

1)人形机器人:以接近人体形态、能在为人设计的环境中作业为目标,是物理AI最具想象空间的应用。

2)智能驾驶:本质上是一个移动的、约束化的具身智能体,或成为物理AI最先规模化落地的场景。

3)工业机器人:包括协作机器人、自主移动机器人、专用机械臂等,已获得规模化收入的领域。

人工智能和机器人技术的发展并非孤立进行,而是相互促进、共同演进的。人工智能为机器人赋予了“大脑”,使其具备感知、思考和决策能力;而机器人则为人工智能提供了“身体”,使其能够与真实世界进行交互,获取经验和知识。具身智能的兴起是人工智能和机器人技术各自发展到一定阶段的必然结果,是两者深度融合的体现。人工智能的持续进步需要与物理世界的交互能力,而机器人的未来发展也离不开更高级别的智能化水平。

物理AI的核心价值,在于赋予自主机器在真实物理世界中实现“感知—理解—执行”闭环能力,使人工智能从虚拟智能向具身智能演进的关键桥梁。

二、三类基础模型

基础模型分别为VLM、VLA、WFM。WFM能够作为后台合成数据工厂,生成物理感知视频和仿真环境,为下游模型提供低成本训练数据与闭环评估场景;VLM作为运行时的“大脑”,负责视频理解、物理常识推理和高层任务规划;VLA可作为“小脑+脊髓”,把语言指令和视觉感知直接转化为机器人关节级动作。

VLM(视觉语言模型/推理型VLM):代表是NVIDIA的CosmosReason2。CosmosReason通过对视频和图像输入进行推理来回答查询。具身推理需要人工智能系统与物理世界交互并从中学习。与被动理解不同,具身人工智能中的推理通常以行动为基础,使机器人不仅能够理解它们当前观察到的内容,而且还能在不确定和动态的环境中为未来规划智能行为。

VLA(视觉语言动作模型):将视觉、语言和动作整合到一个统一的多模态系统中,使机器人能够理解人类指令并将其转化为物理操作。执行流程包括语义解析、目标检测、路径规划和动作执行,从而完成“理解语义→感知世界→完成任务”的完整循环。代表性项目包括GoogleRT-X、MetaEgo-Exo和FigureHelix等。

WFM(世界模型):世界模型在2024年之前主要用在强化学习领域(Dreamer系列),2024年之后被OpenAISora、NVIDIACosmos、GoogleGenie等广泛引用。当下世界模型的技术路线主要有视频生成、3D生成和物理引擎混合三种。

三、被严重低估的工具层

谁掌握了高质量仿真平台,谁就握住了基础模型训练的核心来源。仿真平台目前由英伟达Omniverse/Isaac主导,开源生态加速追赶。

仿真平台的核心能力包含几个主要方面:

1)物理引擎:刚体、流体、接触动力学、变形等物理求解器的精度与速度。

2)渲染引擎:把仿真器输出转化为接近真实的视觉,用于训练视觉为主的VLA。

3)生成式数据引擎:用自然语言或文本提示生成各种任务场景和生成数据。

物理引擎是仿真平台中技术门槛最高的环节。

国内仿真平台与海外的差距依旧存在,但开源生态在快速追赶。智元GenieSim3.0在CES2026发布并开源,是国内首个对标IsaacLab+Cosmos的综合性平台。索辰开物平台基于生成式物理AI技术和实景渲染技术,实现真实场景下的四维时空耦合多物理场设计、仿真、优化和训练,并应用于工业装备的研制和部署。开物平台提供一系列的工具集和应用服务,使开发者和工业用户能够轻松开发和部署物理AI应用。

物理AI正在从两个维度拉动工业软件需求。

1)仿真训练直接需求:物理AI的训练数据中,仿真合成数据需要CAE求解器提供精确的物理一致性。每一台部署的物理AI设备背后,都对应着数千小时的CAE仿真。

2)数字孪生开始规模落地,物理AI给出了数字孪生的实用场景:用于训练机器人在真实工厂部署前先在数字孪生中迭代。NVIDIAOmniverse+ABB/西门子的工厂数字孪生案例已经在汽车、电子、物流行业规模化落地。GTC2026上NVIDIA同时宣布与Cadence、达索系统、PTC、西门子、Synopsys五大全球工业软件巨头深度合作,把CUDA-X、Omniverse注入工业软件生态。

四、核心标的

索辰科技A股首家国产CAE软件企业,依托仿真底座和物理AI能力,在具身智能训练领域为客户运控算法训练提供支撑,相关虚拟训练环境产品正在开发中,计划2026年发布。

凡拓数创拥有自主的AI3D数字孪生引擎FTE,可构建高保真三维空间为物理AI提供训练场;围绕“物理AI”战略构建了全栈式产品体系,包括具身智能数据仿真与合成平台、具身拓展背包等,2026年将重点迭代物理AI工具链。

天娱数科正通过基于VLA的方案,积极加速物理AI技术的落地应用,“高质量纹理3D铰接数据”等10项具身智能数据集已在北京国际大数据交易所完成资产登记。

华如科技围绕XSim®军事智能体系,以军事大模型为底座,面向智能决策、虚拟训练等五大领域提供全栈解决方案。

能科科技“灵智”具身智能AI训推平台研发项目支持人形、四足等10+类机器人运动控制算法验证,已构建物理AI全链条能力。

美格智能5G模组已用于国内人形机器人并小批量发货,高算力AI模组为合作伙伴人形机器人原型机提供端侧AI算力。

奥比中光NVIDIA全球产业数字化生态布局的合作伙伴之一,持续与NVIDIAOmniverse生态深入融合并将更多视觉生态产品融入到NVIDIA平台中。

天准科技布局智能驾驶域控制器和具身智能控制器,大脑域控制器持续获得智元、银河通用、傅里叶等主流人形机器人厂商订单。

(特别说明:文章中的数据和资料来自于公司财报、券商研报、行业报告、企业官网、百度百科等公开资料,本报告力求内容、观点客观公正,但不保证其准确性、完整性、及时性等。文章中的信息或观点不构成任何投资建议,投资人须对任何自主决定的投资行为负责,本人不对因使用本文内容所引发的直接或间接损失负任何责任。)

来源:策金说

展开阅读全文