ImmerseGen：由代理引导的、轻量级的、高度逼真的下一代虚拟现实场景生成

24/07/2025

三个要点
✔️ 轻量级几何体和 RGBA 纹理可高效生成高度沉浸式 3D VR 场景
✔️ 代理选择和放置资产，以实现视觉一致性和空间准确性
✔️ 动态效果和环境音效可提供多感官的实时 VR 体验

ImmerseGen: Agent-Guided Immersive World Generation with Alpha-Textured Proxies
written by Jinyan Yuan, Bangbang Yang, Keke Wang, Panwang Pan, Lin Ma, Xuehai Zhang, Xiao Liu, Zhaopeng Cui, Yuewen Ma
(Submitted on 17 Jun 2025 (v1), last revised 18 Jun 2025 (this version, v2))
Comments: Project webpage: this https URL
Subjects: Graphics (cs.GR); Computer Vision and Pattern Recognition (cs.CV)

code：

本文所使用的图片要么来自论文、介绍性幻灯片，要么是参考这些图片制作的。

概述

本文提出了一种在沉浸式 VR 空间中自动生成高质量三维场景的新方法 ImmerseGen。

与依赖复杂的高多边形建模和三维高斯表示法的传统方法不同，ImmerseGen 使用轻量级几何代理和高质量 RGBA 纹理进行分层场景合成。其核心技术是根据用户输入的文本提示生成以视点为中心的地形纹理，简化中景和前景物体的放置，以及通过自然声音和动态效果整合多感官体验。特别是，通过让代理选择和放置资产，该方法解决了传统方法的瓶颈问题，如缺乏空间理解和冗余资产生成。

该方法还在搭载骁龙 XR2 的移动 VR 设备上实现了近 80 FPS 的渲染性能，在实时性能和沉浸式体验方面都达到了较高水平。实验结果表明，与之前的方法相比，该方法在美学质量、逼真度和文本一致性方面都更胜一筹。