明敏 發自 凹非寺
量子位 報道 | 公眾號 QbitAI
英偉達是推出黃仁勳手辦了嗎???

看上去還挺可愛的呢。
不過事情可沒有這麼簡單,接下來這一幕或許就會讓你大為震撼。
因為,這個萌版老黃,是 會 動 的。
不僅如此,他還能說會道,上知天文下知地理的那種。

氣候變化帶來的最大威脅是什麼?天文學家如何尋找行星?蛋白質在細胞中的作用是什麼?
這些問題通通難不倒他,簡直是行走的百科全書。

而且連說話的聲音都是老黃同款,反差感極大。
所以,這麼一個集可愛智慧與成熟男人魅力的化身,到底是什麼來頭啊?
老黃的AI化身
以上這個萌物,當然不是手辦,但也不是機器人,甚至你都無法摸到它。
這其實是老黃在GTC 2021上發佈的虛擬人形象——Toy-Me。

它最擅長的事情就是和人聊天,可以快速回答人們提出的問題。
怎麼有點語音助手那味兒了?
還真是,這不老黃還帶來了一個Toy-Me的同類,它就是一個可以引導顧客點餐的餐廳客服虛擬形象。

螢幕中這個小機器人,可以通過語音識別、眼神追蹤來推斷顧客的意圖,並能在2秒左右作出反應,回答顧客提出的問題或要求。

並且還放在更多場景裡,比如自動駕駛。
小機器人能夠在和駕駛員溝通後,調整車輛的行駛模式,搖身一變成為小管家。

而除了這些可愛的虛擬助手,老黃的「虛擬大法」還用在了視訊會議上。

平常我們視訊會議時,難免會出現需要低頭看手機、或者查看其他窗口的情況,這會造成不好的觀感。
由此,英偉達就做出了一個虛擬的畫像,讓人們即使沒有注視螢幕時,也能保持和螢幕的眼神交流。

並且還能將人們講的話實時翻譯成多種語言,聲音也會貼合本人原聲。

背後全是英偉達自家技術
以上這些所有炫酷的效果,其實都來自於英偉達在GTC 2021上發佈的一個新平臺——NVIDIA Omniverse Avatar。
(就是阿凡達那個Avatar)
它可以讓人們可以在此創造不同的虛擬形象,還是有光追的那種哦。

△看老黃眼鏡上的反光
這背後當然也需要多種技術的支持,比如語音識別、自然語言理解、計算機視覺等等。
其中最讓人眼前一亮的,莫過於軟體開發包Riva。
它能識別多種語言的語音,還能生成類人聲音。
據英偉達官方介紹,Riva只需要30分鐘的音訊資料,就能合成出相似的語音效果。
Q版老黃的聲音、視訊會議中實時翻譯後保持原聲,靠的都是這項技術。

而能讓「黃仁勳」陪你聊星辰大海,就要靠Megatron 530B了。
其實就是一個月以前發佈的全球最大規模NLP模型威震天-圖靈(Megatron Turing-NLG)。
5300億參數、4480塊英偉達A100 GPU訓練後,該模型能夠很好識別、理解和生成人類語言。
官方介紹,Megatron 530B可以在很少或沒有訓練的情況下完成句子、回答主題廣泛的問題、總結長而複雜的故事、翻譯成其他語言,並應對許多它未接受過專門訓練的情景。

除此之外,推薦引擎NVIDIA Merlin可以讓虛擬助手提出明智的建議。
計算機視覺框架NVIDIA Metropolis能夠賦予虛擬形象感知能力。
生動自然的動畫形象則由NVIDIA Video2Face和Audio2Face™支持。
當然,要把這些都結合在一起,最離不開的就是Omniverse。
它能跨平臺支持所有使用者的物理渲染、模擬和仿真,還能讓創作者、審核者在任何地方,只通過軟體應用就在一個共享的虛擬世界中進行合作。
在Omniverse裡,可以做火山模擬、可以構建虛擬工廠、也能還原一個老黃的廚房。


國內央視的《飛向月球》太空紀錄片,也同樣有用到Omniverse,尤其是裡面的數字人:

數字人產業發展如何了?
在GTC 2021大會上,老黃對數字人的未來可以說是非常看好,他表示:
智慧虛擬助手的前景一片光明。
針對數字人產業,量子位智庫在充分調研海內外狀況,深度採訪國內十餘家頭部企業的基礎上,撰寫了數字虛擬人產業報告。從關鍵分類、技術細節、發展階段、細分場景、中外對比等角度全面分析這一產業,提供專業參考。



我們同時成立了虛擬數字人的專業讀者社群,歡迎添加智庫小助手掃碼進入。

下載原版報告PDF
點選如下連結打開百度網盤,即可下載量子位智庫出品《虛擬數字人深度產業報告(完整版)》。
連結: https://pan.baidu.com/s/11F7dOpe6BUI0uBBz0eJ0jw 提取碼: 7cae
或在量子位公眾號後臺回覆「虛擬數字人」亦可完成下載。
參考連結:
https://nvidianews.nvidia.com/news/nvidia-announces-platform-for-creating-ai-avatars

量子位 QbitAI · 頭條號簽約作者
վ’ᴗ’ ի 追蹤AI技術和產品新動態
一鍵三連「分享」、「點贊」和「在看」
科技前沿進展日日相見~