热点新闻
2024年12月18日,商汤科技联合创始人王晓刚在其创立的“大晓机器人”发布会上,展示了搭载“开悟”世界模型3.0的具身超级大脑模组A1,该技术使机器狗具备空间智能和自主决策能力。发布会地点位于上海,王晓刚现场演示了十只机器狗同时执行任务:部分机器狗巡查路面违停车辆并拍照回传,另一些则排查禁飞区违规无人机信号并发出语音警告。关键突破在于世界模型3.0通过理解物理规律,使机器人能泛化适应新环境,例如学会开门后即可应对不同门型,无需重复训练。此技术解决了传统VLA模型依赖海量数据、泛化能力差的问题,目前正与徐汇公安合作推进城市治理应用。王晓刚透露商业化路径:先以四足机器狗切入安防巡检,2-3年后扩展至无人物流仓,最终进军家庭场景。新闻来源:36氪专访。
TA分析
从TA沟通分析心理学视角,王晓刚团队的技术突破体现了“成人自我状态”主导的问题解决模式。TA理论将人格分为父母、成人、儿童三种自我状态,其中“成人自我状态”以理性、数据驱动和客观分析为特征,恰与世界模型3.0的开发逻辑高度吻合。新闻中王晓刚强调“世界模型必须通过下游验证闭环建立信任”,这反映了成人状态对现实检验的重视——不同于VLA模型的机械模仿(类似“儿童状态”的依赖式学习),世界模型要求机器人掌握物理规律的通用公式,如同成人状态通过逻辑推理而非情感反应处理问题。
该技术对应的TA核心概念是“脚本分析”(Script Analysis)。人类在童年形成的生活脚本会无意识重复,而世界模型3.0本质上是在改写机器人的“脚本”:从依赖特定场景数据的局限脚本(类似VLA的刻板行为),升级为基于物理规律理解的适应性脚本。例如,机器狗学会开门后能泛化至不同门型,正如个体通过TA治疗识别并修改限制性脚本,从而获得更自由的行为选择。
技术特点上,世界模型3.0具备三重优势:一是多模态理解(感知环境深度信息),二是多模态生成(创造训练场景),三是多模态预测(规划动作轨迹)。这与TA的“合约法”原理相通——合约法要求明确目标、检验现实并制定行动步骤,而世界模型通过预测和验证实现决策闭环,正如个体在TA中通过合约打破旧模式、建立新行为。
应用范畴涵盖城市治理、工业检测及家庭服务。学习此技术需结合TA的“结构分析”训练:首先分解任务(如开门需识别把手、施力方向),其次通过强化学习在仿真环境试错(类似TA的角色扮演),最后在真实场景校准(对应TA的现实检验)。例如,开发者可模拟机器狗遇障碍物的反应,通过反复调整参数强化适应性行为。
新闻隐含的问题是技术信任缺失:行业初期对世界模型“不太信”,因缺乏验证闭环。TA解决方案是建立“共生关系”打破怀疑——王晓刚将模型嵌入上汽智己智驾系统,用实车数据校准生成策略,正如TA中通过真实互动修正认知偏差。此方案可推广至五类类似问题:一是医疗机器人因环境变异导致的误操作(通过世界模型模拟手术场景校准);二是教育AI无法适应个性化学生(生成多模态教学场景验证);三是金融风控模型过度依赖历史数据(用世界模型预测未知欺诈模式);四是家居AI在陌生家庭失效(模拟多样化布局训练泛化能力);五是自动驾驶应对极端天气(生成暴雨/暴雪场景优化决策)。
综上,世界模型3.0的开发与TA的成人状态理性、脚本改写理念高度协同,其成功依赖于持续的现实验证与迭代——这不仅是一场技术革命,更是人机互动中“信任契约”的重构。