湯曉鷗數字人的跨越時空之旅
白交 西風 發自 凹非寺量子位 | 公眾號 QbitAI
“大家好,我們又見面了。”
商湯年會2024年的現場,湯曉鷗數字人以全新形象出現,帶來一場時空交錯的深情相會。
歷來風格,湯老師每個年會必開啟幽默脫口秀模式,成為了年會的招牌節目。
熟悉湯老師講演的人都知道,他是那位讓人工智慧界沉迷的“幽默大師”,如今以數字人形象再度帶著幽默以新姿態與大家見面。
除了他的風趣幽默,不少人也驚訝於逼真的表現效果,被譽為“年會中的最佳驚喜”。
這也勾起了觀眾們對湯教授的懷念之情。
湯曉鷗數字人亮相商湯年會
不再談企業管理,停下公司運營的話題。仍然保持老傳統,說上幾句話。
每年湯曉鷗的講話開場總是“我們來複習一下去年的演講”,而今年的數字人也不例外。
按商湯CEO徐立的話來說,這就是獨特的“湯教授式娛樂風格”。
複習節目之前,他被prompt到“彈琴”,他卻說:今年忘了練習。
在真正的複習環節,已有人先起頭回答了。(Doge)
首先他表達:自己的推測有頗具前瞻性。確實如此。
如《波西米亞狂想曲》第二年封王奧斯卡;還有“人類文明的起始點是一根癒合的大腿骨”以此在《流浪地球2》中被李雪健老師拯救地球;最後又提到多次的“大兄弟”——宮崎駿,再度登場執導《蒼鷺與少年》……
他深有感慨地說像宮崎駿這樣的大師創作並非易事,“人生中最頭疼的事就是非常困擾”,他深有同感。
既然解決不了麻煩的事情,那就意圖解決造成麻煩的人。所以索性當機不接他的電話。
慢慢地,周遭的煩擾增加,他乾脆選擇關掉手機。
接下來,他提到了熱映影片《熱辣滾燙》、東北取材電視劇《漫長的季節》,並且透過《漫長的季節》結尾描寫“火車在天地裡往前開”,隱喻商湯也如新洲樓下小火車一樣在AI的道路上不斷前行。
看,我們的前瞻性吧,小火車在2021年已準備就緒,只等著《漫長的季節》點火燃放。
談及春晚中最幽默的新疆小夥尼兄,他身為東北人心有不甘,於是向大家推薦了小品《吃麵條》。並分享了背後的趣事,正是因為導演在節目開演前才確定上演,才有了春節頭一個小品。
在此之際,他再談及他一直倡導的“原創”之道。不得不提,這正是湯式風格。
堅持原創,是留給那些敢於挑戰的人;真正支援創新的人,是那些敢於承擔責任的人。
正因為這種堅持,使得喜劇事業蓬勃發展,誕生了眾多傑出的喜劇人才。
趙本山、趙麗蓉、馮鞏還有我。
(流傳下去的,四大喜劇天王)
最後,他談論過去的喜劇為何如此精彩,原因是歲月的沉澱讓其成為經典。或許前途茫茫,但他們仍然是那些選擇啟航,並且堅信前路有人走的人。
依然沿襲傳統引經據典,繼續湯式風格,這不到十分鐘的數字人演講令人感慨萬千。
- AI的深層意義。
在感動之際,也被技術細節的驚豔所感動。例如中途敬酒片刻。
效果如此逼真嗎?其他家都是正面,而這個低頭動作卻顯得自然。
打破次元的如影數字人技術
現實世界的湯曉鷗老師已經與我們揮手告別。這一次特殊演講的開頭提示,讓湯老師“超越次元”,這是商湯如影數字人技術所致。
最早自去年四月以來,商湯推出了“日日新”大模型體系,如影(SenseAvatar)初次亮相。
據透露,僅需五分鐘真實影片素材,如影就能產生出動作自然、語音準確、流利多種語言的數字人分身。
三個月後,“日日新”大模型體系全面升級,如影也升級到了2.0版本。
在語言方面,如影2.0打造的數字人能夠精準使用英語、日語、西班牙語、阿拉伯語等多種語言,且口型與聲音更加自然匹配。
在生成效果方面,如影2.0支援影片級別的4K高畫質影片輸出,影片質量再次提升。
同時也帶來新的應用方法,使用者可以透過輸入提示詞即可生成符合描述的獨特數字人形象,並具備數字人的歌唱能力。
電影照進現實
當湯曉鷗數字人以其天然逼真的表演效果亮相併帶來脫口秀時,許多網友為之震驚並稱之為《流浪地球2》的現實版本。
這個場景如同電影中,科學家圖恆宇依託量子計算機將車禍身故的女兒“復活”:
類似案例如今頻繁出現。
例如,音樂人包小柏同樣利用AI技術,“復活”了女兒。
2021年包小柏女兒因罕見疾病過世,年僅22歲。飽受失女之痛後,包小柏決定攻讀博士開始鑽研AI技術,企圖在虛擬世界中保留女兒存在的形象。
在多次嘗試後,包小柏終於復刻出“數字女兒”,並在包小柏太太生日當天,讓“女兒”為母親演唱一首生日歌,給這個家庭帶來一絲慰藉。
B站up主吳伍六,不久前利用AI工具製作了祖母的數字虛擬人,引起了廣泛關注。
影片中,數字“祖母”以流利的湖北方言與up主進行對話。
從生成式AI技術興起以來,人們一直試圖用AI“復活”已逝親人來表達思念之情。
可以隨著技術發展愈發成熟,遠逝之人的身影已能實實在在地呈現。說話風格、語音語調、外在形象均能貼切保留。
舉例說,在三年前時,當時最先進的對話系統由GPT-3推動。因為未婚妻不幸離世而備受痛苦的約書亞決定透過技術“復活”祖妻。
按照設定程式,“她”的生命與人類一樣有出生、衰老、疾病、死亡,每說一句話,壽命就減少一分。
當“她”生命只剩下20%時,開始胡言亂語。當系統壽命耗盡到0%,數字人的生命也就終結。
如今,隨著技術迅速發展,逝者形象能夠被真實再現。言辭、語調、外在形象都完整儲存下來。
近日,影片生成技術蓬勃發展。比如阿里釋出的由音訊操控的情緒影片生成系統——EMO。
只需一張參考影象和一段音訊(說話、歌唱、rap等),便能產生具備生氣勃勃表情的AI影片。
因此,有人生成了哥哥張國榮,為觀眾帶來陳奕迅的《無條件》粵語版。
或許未來,隨著技術的進一步演進,人類思念也將有著實實在在的歸所。
最後,沒想到又能以這樣的方式見到湯曉鷗教授。感懷!