真实案例:公共广场 / 古城门
同一段 9 秒手机视频,左边是客户输入,右边是我们重建出的感知视图。不是“画一个模型”,而是把真实空间拆成机器人能用的语义层。
客户输入 — 9 秒手机视频
竖屏 720×1280,约 9.14 秒。镜头从街道摇到古城门:城墙、城楼、门洞、游客人群、路桩、街灯、招牌、石板广场全在画面里。
感知重建 — 9 秒孪生视频
类 Tesla / Waymo 感知界面:每一帧真实画面上叠加语义分层、空间网格、检测框和机器人路线,严格同步原视频 9 秒。
交付 — robot-ready 场景包
客户拿到的不是一句“AI 生成”,而是一包可验收、可讨论、可继续导入仿真的材料。