4月29日,由虛擬現實制造業技術創新戰略聯盟主辦、南昌虛擬現實研究院股份有限公司承辦、江西省工業和信息化廳與南昌市人民政府擔任指導單位的“虛擬現實制造業技術創新戰略聯盟(VRMTA?)2022年度工作會議暨VR產業創新高峰論壇”將于江西南昌正式開幕。
在高峰論壇的多人對話環節,中國信通院江西研究院副院長張夢妮擔任主持人,與小派科技副總裁李杰、Unity大中華區平臺技術總監楊棟、英偉達中國區XR/CloudXR業務負責人周錫健就VR人機交互探索進行了深入的交流,分別從VR頭顯供應商、引擎平臺以及GPU芯片制造商的角度,探討了虛擬現實技術、靈境(元宇宙)與下一代人機交互技術的緊密聯系。
以下為嘉賓分享內容:
小派科技副總裁 李杰:“高性能VR設備是高沉浸感的保證,也是人機交互的硬件使命”
未來在VR硬件方面關于人機交互方向,從小派而言,可能是更足夠更核心的一個能力,為用戶提供足夠高的一個高沉浸感。因為只有在硬件性能表現足夠好的時候,高沉浸感才能帶領用戶進入一個元宇宙空間,也是需要完成人機交互的一個硬件的使命,也是沉浸感最核心的一個根本原因。
高沉浸感的層面我們如何定義?可以通過模擬物理環境,光聲音、氣味以及甚至于運動等模擬影響我們的眼睛、耳朵、鼻子、舌、觸覺等與由此產生的化學激素與腦電信號,從而影響我們的意識。VR技術需要足夠高的沉浸感,小派在提高沉浸感上有這樣的標準,我們也向全球發布過VR3.0的標準,擁有完全沉浸感需要符合自然、自由、自我三個硬件標準,就是視覺沉浸感、物理沉浸感與認知沉浸感三個方向。
首先在視覺沉浸感上,對應的是自然。例如PPD即角分辨率、FOV即視場角、刷新率等層面。人眼的PPD在60~65之間,人眼的FOV在220~230之間,人眼的刷新率在200赫茲左右,如果畫面刷新率大于180赫茲的話,人眼幾乎無法分辨是否有延遲。PPD、FOV、刷新率這三個指標分別除以它們的天花板水平可以得到各自的百分比,三個百分比的加權調和平均數就是UVI(Unit of Visual Immersion)即視覺沉浸感當量,所以基于這三個指標的綜合考量得出的UVI,是我們衡量的標準。
在物理沉浸感方向上,對應的是自由。現在大部分的頭顯,6DoF幾乎是標配,同時還需要在無線化、空間影響、體感外設、人體工程學設計等方向達到一定的要求,最后再考慮重量和體積的優化工作。之前主流的定位方向是Outside-in,定位精準,但價格較高,要配備燈塔基站,移動不靈活。新的主流方向則是Inside-out,精確度足夠高,價格也便宜,未來幾乎可以形成全視野AR功能的雛形,為VR過渡到MR打下基礎。
在認知沉浸方向上,對應的是自我。如果你在元宇宙當中覺得自己是一個元宇宙人、虛擬人,如何在其中擁有自我存在感呢?就像你在看一面鏡子,你動他也動,如何實現?除了需要物理沉浸感,還需要Face-tracking(面部追蹤)、Eye-tracking(眼動追蹤)和Body-tracking(全身動作捕捉),你的眼神在動,虛擬人的眼神跟著你動,你的情緒在變化,虛擬人的情緒也跟著變化。
所以我們認為視覺、物理、認知三個層面互相配合,能夠產生足夠高的沉浸感,元宇宙能讓人覺得置身其中,這就需要我們致力于做高性能VR硬件,把更符合人體體驗標準的產品帶給大家。
Unity大中華區平臺技術總監 楊棟:“致力于打造和完善開發者生態,才能從本質上推動內容開發和技術創新”
Unity目前專注的領域是研發互動式內容創作工具,這些工具鏈提供給VR/AR/MR各種手游和 PC端的各種應用,只要是三維實時互動內容,都可以進行研發。本質上我們要解決的問題是,當內容創作者去研發這些內容的時候,能夠滿足用戶手里多種多樣的設備的特性。我們要降低開發者的技術門檻,讓他們去創造新的內容而不是重復建輪子。所以,以前我們的平臺叫引擎,但現在我們把它定義為內容創作平臺。
目前Unity支持將近30個計算平臺,大到PC,小到Switch一類的游戲機或者Xbox、PlayStation這一類主機游戲,甚至安卓的機頂盒,都可以用來開發。也有許多客戶在非游戲行業里使用,例如數字孿生這些領域。其實用Unity來做VR相關的內容,也是支持的,而且針對VR相關設備一共有完整的三種方式的支持。
第一種方式,像Oculus、Pico、Window Mixed Reality、Magic Leap都是我們的官方合作伙伴,有專門的團隊對口這些VR廠商做SDK研發和市場推廣相關工作。作為技術工具,市場推廣和普通的產品廣告是不同的,需要提供很多的教程、開發者大會這類服務,現場或線上幫助大家解決研發過程中遇到的實際問題。
第二種方式,我們稱之為VSP,即Verified Solution Provider。對于我們認證的解決方案供應商,可以在我們的平臺上幫助他驗證自己的技術,再通過各種手段和渠道進行推廣,讓更多人可以使用他的技術去做各式各樣的內容。
第三種方式是針對非官方合作伙伴的,XR領域相關的,如果只從VR角度上來說,我們的工具鏈相關的API實際上會開放給所有的廠商,他們會拿我們的SDK集成到他們的設備商,通過自己的渠道宣傳推廣,然后讓他們自己的開發者來開發內容。在內容為王的時代,如果沒有優質的內容,其實很難進行相應的硬件設備的推廣。
除了技術層面的快速進步,我們不斷兼容更多的平臺,更多的設備,把我們的工具鏈使用門檻做得更低,其實就是在進行開發者生態建設。我2016年加入Unity中國,我的團隊就一直在進行開發者生態建設工作。目前國內的Unity開發者已經超過了220萬,全球大約2000萬,已經形成了完整的開發者生態閉環。
那么在內容為王的時代,我們其實擁有最大的實時渲染3D內容的開發者社區,所以目前Unity可以說是制作 VR內容的首選引擎,我們也非常希望通過各種渠道與大家深入交流。
英偉達中國區XR/CloudXR業務負責人 周錫健:“云計算的突破使創新者獲取巨大算力,AI提升人機交互的更多可能與體驗”
首先我們從云計算開始,云計算其實是一個永恒的話題,也非常熱門。例如通過高級的醫學影像技術抗擊癌癥,自動化的客戶服務,電影級的游戲體驗,AI,還有高性能HPC和顯卡領域的新一代功能,正在不斷突破界限。現在全球所有的云平臺都已經全面支持NVIDIA,也就是英偉達的GPU加速方案,世界各地的創新者也能據此輕松獲取巨大的算力。
針對XR來講,NVIDIA在2019年發布了CLOUD XR SDK技術,是一項基于NVIDA的RTX技術構建的突破性創新,它可以通過跨越5G和WiFi網絡,實現無線的VR和AR。RTX技術即實時光線追蹤,對很多VR/AR場景而言是必須的,可以塑造更加逼真的場景效果。NVIDIA的這一技術可以通過RTX虛擬工作站軟件,針對數據中心和邊緣網絡實現全面擴展。我們的SDK也包含了服務器的安裝組件以及開源的應用程序,用于Open XR的應用程序,例如Android或者Windows的設備都可以實現串流的功能。
其實經過這么多年的發展,VR的交互已經比較成熟了,高分辨率的VR頭盔和高性能的GPU都是完備的,那么我們還可以做什么?我們的回答是AI,AI的加入大大加強了VR體驗的真實感和智能化,特別是將原來人機交互的復雜操作變得更加簡單。
例如上述的CLOUD XR SDK的最新版本支持雙向Audio音頻傳輸,這表示AI語音正在逐漸改變各個行業的企業與客戶的交互方式。NVIDIA在AI語音方面有Viva這一先進模型,有全方位加速的流程和各種工具,能夠輕松地開發虛擬助手、實時轉錄或者聊天機器人等應用程序。這些都是可定義的,可以部署在任意的云平臺、本地或者邊緣的技術中心。
再回到具體的操作層面,目前一些語音助手已經可以實現很多交互,例如在評審里改變車身的顏色、打開車門、場景變化等都可以做到,但AI可以進一步提升整體體驗。如果放到VR操作中,對于非專業人士而言還是比較復雜的,但我們可以通過對場景的分類,對各種場景進行一些AI訓練,就能實現更多的復雜功能。比如你想找一個汽車里的零部件,你通過普通的手柄交互可能無法精準找到,但如果使用AI語音就可以快速精準地實現。
所以,云端的串流技術和AI的加持,可以提升算力,進行更加復雜的人機交互,帶來更好的用戶體驗和多樣化的體驗方式。