同样在3月13日,大晓机器人正式开源开悟世界模型3.0(Kairos 3.0)-4B系列具身原生世界模型,这是全球首个可端侧驱动具身智能本体控制的世界模型,彻底打破传统具身智能“行为模仿”的技术局限,让机器人真正从“会表演”走向“能干活”,一经开源便受到科研领域和机器人开发者的高度关注。
不同于传统生成式模型仅侧重视频生成,缺乏对物理世界的深度认知,Kairos 3.0-4B从架构底层为机器人在真实世界的运行进行设计,以自然界基本物理规律与因果规律为认知根基,构建起跨本体的统一世界理解框架,解决了具身智能行业数据稀缺、部署算力成本高、状态预测物理一致性差等瓶颈问题。
核心亮点(原创拆解,聚焦具身智能优势)
-
端侧驱动突破:部署于Jetson Thor T5000端侧平台,算力可达517 TFlops,可直接输出机器人从上肢到手指再到下肢的全方位控制指令,省去中间转译环节,让机器人“想到即可做到”,实现真实场景下的自主作业。
-
实时性能卓越:在THOR端侧平台达成1:1.5(视频生成时间:视频时长)实时生成,云侧实现1:1实时推理,推理速度较同类模型提升72倍,刷新全球具身世界模型性能纪录,可满足实时控制需求。
-
场景适配广泛:不仅能在3D仿真环境中精准生成机械臂运动形态、完成运动轨迹的预测与规划,还可在家庭场景中实现全流程自主作业,如整理物品、投放衣物、制备早餐等,同时适配工业、科研等多领域场景。
-
长时序能力突出:可将用户复杂交互指令进行层级化解析,依托对物理规则、场景动态的精细化预测,生成长达7分钟的具身动态交互视频,解决传统模型长时序交互不足的问题。
-