從視覺到聽覺,帶你走進虛擬世界——VR全景聲效

伴隨着近幾年AR與VR市場的大爆發,許多與之關聯的影音技術亦逐漸受到各方關注。伴隨着VR技術的發展,其相關的模擬環境、感知、自然技能和傳感設備等方面的技術亦隨之得到極大的發展。如何增加VR使用者的沉浸感使得整個虛擬環境表現更加真實?VR全景聲效能夠幫助到廣大的影音愛好者。

VR全景聲是什麼?為什麼會出現這種技術?

在現實生活中,人一般會有五感:觸覺、味覺、嗅覺、視覺和聽覺。然而在VR使用者體驗虛擬現實環境時,所能運用到的往往只有兩種:視覺和聽覺。伴隨着現代顯示技術的提升,聲效技術如何才能緊跟其步伐共,同發展創造出最完美的VR技術呢?在VR的世界裏,視覺和聽覺的比例各50%,因為現代的顯示技術已經提升到一個較高的層次了,VR生產與技術商想要繼續提升VR的沉浸感就只能從聽感方面入手,因此VR全景聲就開始逐漸被廣大技術廠商留意。

聲音在很多媒介中都屬於從屬的地位,從電影到遊戲等等的娛樂媒體,聲音似乎都是以一種配合畫面的形式出現到大眾心目中。為了增強音效所處的地位,增加試聽者的感受,由此VR全景聲,3D音效,沉浸式音頻等等的理念逐漸被影音業界提出並且被開發出來。

最簡單的理解,當我們處在環境中,從不同的角度聽同一個聲源所得到的聲音是不同的。在整個環境中,聲源和其所在的位置、時間信息共同構成一個聲場。記錄了聲場數據,也就知道了整個環境的聲音狀態,VR全景聲正是解決如何還原視頻場景聲的問題。全景聲場不僅可以模擬VR裏面的音場,還原視頻中場景的聲音,增加沉浸感,更能引導觀眾的注意力。

伴隨着VR技術的發展

2016年被稱為VR的發展元年,從產業的生態角度看,VR產業已經將從技術到硬件內容全部變成可以使用的現實,而不僅僅是一個概念。由於VR系列的產品擁有巨大的潛在市場,各大商家紛紛投資湧入這片VR技術的浪潮。

2014年6月網絡巨頭谷歌率先推出Google Carboard——一款以紙盒製造的可摺疊智能手機頭戴式顯示器,可以使用手機提供虛擬實境體驗。

2014年7月,Facebook宣布以20億美元的價格收購VR技術商Oculus,在外界看來無疑是一場為未來買單的措舉。另一方面,國內企業也紛紛將視線聚焦到VR技術,阿里巴巴、百度、小米、騰訊等國內互聯網巨頭亦希望能夠構建國內的VR產業。即便是沒有VR技術的知名網絡企業如華誼兄弟、迅雷科技、樂視、暴風科技等等亦通過資本投入涉足到VR產業中。對VR產業的投資無疑是直接對VR行業打了一劑強心針,伴隨着VR技術的發展,VR全景聲也在其中分到了發展投資的一杯羹。

其實全景聲的概念早已經在影音界為大眾所知,2012年杜比實驗室研發了杜比全景聲。它突破了傳統意義上5.1、7.1聲道的概念,能夠結合影片內容,呈現出動態的聲音效果。不同於以往一路音頻信號控制影院中一側音箱發出相同的聲音,它可以使一側的多個音箱逐個發出不同聲響,更真實的營造出由遠及近的音效;配合頂棚加設音箱,實現聲場包圍,展現更多聲音細節,提升觀眾的觀影感受。之後,杜比實驗室和在線全景視頻資源網站Littlstar宣布,Littlstar的VR觀影應用將會在今年秋季開始支持杜比全景聲,帶來沉浸式聲效體驗。

今年5月Nvidia推出了VR Work開發包,能夠基於物理聲音技術,使用光線追蹤對環境進行渲染,之後該技術也被運用於聲音渲染中,旨在創建精確的物理聲波反饋。之後,AMD也順應潮流,開發了一個TrueAudio Next。

獨特的聲音製作過程

目前,VR全景聲場的製作方式為兩種,一是現場收聲,二是後期製作。VR視頻中加入配合全景視頻製作聲音是一個新的挑戰,雖然可以借鑒傳統音頻製作的經驗,但是全新的錄製方式與完全不同的後期合成處理方式,帶來了新的需求和新的技術難點。現場收聲時,因為環境因素的影響,採集商可能收集不到完美的聲音,而且干擾源不能自行控制,採集者亦不好控制那些聲音需要增強那些聲音要弱一些。

但若是後期製作,聲音會很純凈,但是後期製作聲音的工作量會非常大,而且成本高。全景聲錄製之後還需要後期加工,比如需要將音軌的相位和VR視頻畫面相位進行匹配,以使得具體的某個徑向來源的聲音和對應的畫面在觀看時,來自同一個源。在VR影視中,專業人員需要能夠精準還原全景聲場中所有聲源的位置、方向、距離和運動軌跡,這需要大量音軌來支撐VR所需的聲音細節。

高質素的音效離不開高素質的技術,時代拓靈,國內唯一一家能夠將全景視頻和全景聲音打包製作的公司。推出了拓靈VR360聲場錄製機,和拓靈VR全景聲引擎(Twirling VR Audio SDK)這兩大核心產品。為了滿足立體聲被動式接收的不同,VR全景聲將需要滿足觀眾頭部旋轉和經常改變角度的需要,最大程度創造沉浸式的體驗。利用獨有的全景聲場模擬算法,將環境聲和虛擬聲源精確的還原在三維空間里。

支持頭部旋轉和移動下的聲場重建。特別適合對運算複雜度有較高要求的移動端應用。也是真正的跨平台引擎,可以靈活的用於Android/iOS/Windows/Mac OS以及unity等各個平台。產品的架構十分高效,理論上可以同時提供128軌的音頻,並根據陀螺儀給出的頭部旋轉和位置等信息,隨時加入音源,並「實時渲染」 。

剛獲得數百萬天使投資的森聲科技,主要的研發產品為基於雙耳錄音(Binaural recording)技術的VR音頻採集設備,以及基於人頭傳遞函數(HRTF)的聲場模擬軟件,可應用於VR影視、遊戲、新聞、娛樂和體育現場直播。首先用他們的採集設備錄製聲音,之後把音軌導入視頻軟件對位和編輯視頻,成片輸出後,在播放中調用森聲的SDK,以便能正常播放出全景聲。

之所以說簡便,是因為森聲的方案中,採集設備輸出的是正常的音軌,唯一的區別就是數量比較多,成片也是H.264壓縮格式的「.mp4」視頻文件,整個流程不會打破原有的視頻製作流程。

VR全景聲帶來的聽覺革新

VR全景聲為廣大的VR和影音愛好者提供了一個擴展的虛擬現實,它超越了原有遊戲設備在視覺上的局限,為使用者提供了360°無死角的聽感體驗。聲音往往可以引導人的注意力,有了VR全景聲效之後,用戶的注意力會大大提高,增加用戶的沉浸體感。

對於許多VR遊戲玩家來說一個沒有VR全景聲的VR遊戲是失敗的,VR設備的畫面往往可以將玩家帶入遊戲的世界並且沉浸其中。然而,失敗的音效表現卻將他們生生拉回到現實世界,因為所有的聲音都是從同一個聲源發出的,而且音效的表現非常僵硬。絲毫沒有體現諸如物體由遠到近飛過,走進建築物時的附近的聲音變化等等的細節音效。

使得一款製作精美,情節優良的遊戲總是差這麼一點「火候」。另外,聲音往往是營造環境氛圍的必要成分,但僅僅止步於營造氛圍嗎?能否在VR遊戲中實現聲控人物角色,讓玩家更融合到遊戲世界中,顯然,使用語言數據庫是個解決的方法。其實在VR里,VR聲效所表現的最重要的是位置信息,VR全景聲所表現的是聲音在VR空間的運用與作用。

舉個例子,倘若使用VR設備玩反恐精英,你帶着遊戲外設模擬的槍支,忽然附近傳來軍靴踩踏地面的腳步聲。找一個藏身之所!這是引起玩家行動的第一反應。這樣的遊戲是不是會讓你感覺到真正的身臨其境,緊張刺激猶如一個真正持槍者?由VR技術帶來的VR全景聲,無論是聲效的音質還是聲距感都需要能夠完美表現出來,用戶在使用時能夠輕易「聽」到自身所處的位置。

VR全景聲的真實感受

在VR游戲裏就有一個主題先天就有VR聲音指令的優勢,即VR恐怖。每當夜幕降臨的時候,氣氛及詭異的聲音渲染之下,鬼這個詞就會在心底按捺不住的滋生。當人類對於未知的恐懼在VR環境中被無限放大時,你是否還會認為這只是一個遊戲?VR全景聲可以帶給你在空蕩蕩的房子里卻傳出樓上有腳步踩踏木質地板的咯吱聲的感受。

VR全景聲效所帶來的其實就是視覺+聽覺的組合,區別於傳統的3D環繞聲效,全景聲可以打造出不同層次的聲音效果,體驗者甚至可以在其中感覺到超越耳朵靈敏度的體驗。筆者曾經體驗過貞子紀念版本的VR電影,臨場驚悚!在VR中竟然可以聽到這種令人毛骨悚然的鬼聲,不僅近在眼前,更「近在耳前」。