全职,普通岗位。职位描述
世界模型研发:基于扩散模型 (Diffusion Models) 或 Transformer (DiT) 架构,构建具备时空预测能力的驾驶/操作世界模型,实现高保真度的多视角视频生成与动作条件下的未来演化模拟。
神经场景重建:利用 3DGS / 4DGS (Gaussian Splatting) 技术进行大规模场景重建与动态物体建模,解决 Real-to-Sim 过程中的高保真度还原与实时渲染问题。
合成数据闭环:研发高保真合成数据生成管线,针对自动驾驶中的 Corner Cases(如极端天气、违规行为)或具身智能中的复杂交互(如精细抓取、柔性体)生成大规模标注数据。
物理一致性优化:探索如何将物理引擎(如 Isaac sim, MuJoCo)与生成式模型结合,确保世界模型生成的序列符合物理定律(碰撞、重力、运动学约束)。
职位要求
精通扩散模型 (Diffusion Models):熟悉 Stable Diffusion, DiT, Video Generation 等相关架构及训练优化。
精通神经渲染 (Neural Rendering):在 3DGS (3D Gaussian Splatting) 或 4DGS 领域有深入研究或落地经验。
熟悉常用的 3D 表示(如点云, Voxel, Mesh)及多模态学习方案。
熟练使用 PyTorch/JAX,具备大规模分布式训练经验。
具备较强的 C++/CUDA/Python 开发能力,有物理仿真,计算机渲染经验优先。
教育背景:计算机、机器人、自动化等相关专业硕士/博士。
五年及以上自驾/具身智能仿真开发,感知/预测/规划模型开发,视觉重建相关经验优先考虑。
【加分项】
在 CVPR, ICCV, NeurIPS, ICRA, IROS 等顶会有高质量论文发表。
在开源社区(如 GitHub 热门相关项目)有核心贡献。
有将大规模生成式模型落地到量产智驾系统或真机机器人系统的经验。
联系我时就说是在 广西领才招聘网 上看到的
职位发布者
地址:广东省/惠州市/仲恺高新技术产业开发区惠环街道办事处