別小看了音視頻技術

文 | 闌夕

在音視頻這個技術領域,騰訊可能還真是中國互聯網裡歷史最爲悠久的公司,沒有之一。

早在2002年,QQ就上線了視頻聊天的功能,相當超前的爲用戶帶來了實時影像交流的體驗,彈視頻/語音也成爲了QQ社交的一種可選項。可以說QQ視頻是騰訊第一次由虛向實的嘗試,讓用戶可以明確看到聊天窗口的對面,有着一個何等真實的陌生人。

那時中國個人電腦的主流操作系統還是Windows 98,網民數量也只有不足6000萬人,所有的內容平臺都還是以圖文爲主——如果有人發了比較多的圖片帖,默認的禮儀是要在標題上註明「多圖」,否則便很容易收到因爲瀏覽器卡死而回復的怒罵。

在所謂「小水管」的帶寬時代,騰訊投建音視頻技術的原因,莫過於它的社交基因驅使自己必須跑在產業均值的身前,在同步傳輸比特信息的過程裡,覆蓋音容笑貌這個最大的數據流。

20年的時間轉瞬過去,音視頻幾乎成爲了所有社交產品的標配,它也作爲一種基礎能力被放在了騰訊雲的架構裡,不但支持公司內部的各條業務線,也對外輸出給所有的合作方,但與20年前不同的是,音視頻在今天早就脫離了專供互動娛樂的狹義定義,在「通個語音」「打個視頻」的底座之上,音視頻正在互聯網之外的千行百業大放異彩。

這是一項可能還要持續20年以上的宏大工程,貫穿前後兩個時代的,是數字經濟和實體經濟骨肉相連的不可逆趨勢,革故鼎新的故事,始於每一個新技術的應用和落地。

某種意義上,音視頻作爲全真互聯的技術底座,是連接數實融合這個抽象概念的最可見之處,因爲音視頻的一切場景,都體現在前端交互的體驗裡,有沒有做好,以及做的效果怎麼樣,用戶一目瞭然,甚至都不需要數據去做修飾。

在寧波舟山港的梅東碼頭,騰訊雲音視頻聯合合作伙伴飛步科技,建成了全球規模領先的自動駕駛車隊,不需要安全員就能完成精準對位作業,助力港口24小時不間斷高效作業。

通過具有模擬方向盤的遠程駕艙可以在辦公室駕駛位於港口現場的無人卡車,一方面實現了自動駕駛車輛遠程介入接管,解決了安全員無法下車的問題,另一方面實現了1人同時看管多車,把人效提高了數個檔位。

在這個場景裡,音視頻技術解決的問題就是把攝像頭等傳感器的數據低時延發送回來處理,系統需要知道卡車「看到了什麼」才能持續遠程操控,這對精度要求極高,一旦信息傳得遲了或是不準,就會搞砸一切。

依託騰訊雲實時音視頻TRTC技術,從相機採集現場畫面、完成編碼,再傳輸到遠端駕駛艙解碼、渲染,對全流程進行優化,將時延降至100ms以內,並和多網聚合技術進行跨層優化,從根本上解決弱網問題,實現遠程控制畫面「0」卡頓的絲滑體驗。

遠程醫療的發展也爲優質醫療資源的普惠化提供了更好的途徑,西門子醫療就基於微信小程序和騰訊雲實時音視頻TRTC打造了一系列極具中國特色的基於5G的遠程醫療應用,基本覆蓋了從放射掃描助手到遠程放射專家再到遠程介入大師以及遠程放療計劃等資源。有效解決了偏遠地區的醫療資源分配不均、醫療設備檢測或掃描拍片缺乏專業技師人才儲備等問題。

2022年7月西門子醫療也建立了數字指揮中心,支持全國400多家醫療機構實現遠程掃描指導和遠程介入指導服務,充分發揮了公立大型醫院的醫技力量,提升了鄉村縣鎮這些醫療技術水平實現了分級診療制度的有益嘗試。最近一年以來,騰訊雲音視頻聯合西門子支持了2.7萬次的遠程掃描服務,包括全國424家醫療機構的CT、核磁和PET。

事實上,從去年開始,全國就有多家三甲醫院通過騰訊雲視立方TUICallkit組件快速上線了遠程醫患問診服務,接待了更多有需求的患者。不止於此,騰訊雲音視頻還支持多科室線上會診、遠程影像檢驗、規培會議等多個醫療場景。

這些應用落地,看起來都像是「視頻聊天」的升級版,只不過在這種核心能力的方向演變化上,音視頻技術終於等到了基礎設施整體成熟的時機。

比如5G通信的速率提高,比如工業設備的數字化升級,比如雲端計算的算力躍遷,有了來自時代的突破,纔有落到時機的成熟,這正是中國科技產業過去幾十年來突飛猛進的一個縮影。

YC的創始人、硅谷投資教父保羅·格雷厄姆在代表作「黑客與畫家」裡寫過這麼一段話:

「世界上有益的痛苦,也有無益的痛苦。你需要的是咬牙向前衝刺的痛苦,而不是腳被釘子扎破的痛苦。」

對於傳統企業來說,面對數字化轉型的心理掙扎,就像這段話所描述的一樣,又愛又怕。

愛的是轉型確實是剛需,轉了不一定成功,不轉一定不會成功,沒人否認數字化的未來,但怕的卻是信息不對稱,容易投入巨大卻始終找不到那雙合腳的鞋子,明知有金礦在前,賣鏟子的鋪子實在是太多了。

從數字化切換的大浪潮來看,音視頻技術只是其中一朵浪花,只是見微知著,這朵浪花因其顯性而排序靠前,如果它是第一個拍到岸邊的,那麼也會在最大程度上決定在岸者對於這片海水的感知。

是冷的還是暖的,是藍的還是灰的,是有用的還是徒勞的,是增長還是內卷。

騰訊雲給蒙牛做的方案,很有代表性,蒙牛是中國領先的乳製品供應商,因爲消費者都在線上活躍,所以蒙牛對互聯網的熱情極高,希望和年輕用戶建立除了電商賣貨之外的更多關係。

但這不是蒙牛甘於止步的邊界,這家公司還想踏入營養健康領域,爲可能新增的潛在業務打好鋪墊,此時,就輪到騰訊雲音視頻用騰訊在消費互聯網行業負重前行數十載積累下來的方法論,來爲傳統行業和實體商業修橋補路了。

在日前舉辦的蒙牛全球合作伙伴答謝會上,蒙牛健康營養師「濛濛」作爲行業內首個可交互AI「智能營養健康專家」,將基於蒙牛「WOW 健康 +」小程序爲消費者帶來多場景、多功能的健康服務,實現更立體、更有溫度的情感交互體驗。

在蒙牛「WOW 健康 +」小程序上,騰訊雲音視頻基於自身在通信CPaaS領域的多年積澱,通過即時通信IM與雲聯絡中心TCCC聯合打造的 IM 客服插件,採用業界領先的即時通信IM+在線客服+用戶自建AI模型模式,充分整合營養健康領域模型MENGNIU.GPT與騰訊雲音視頻優質的IM+在線客服的組合能力,助力蒙牛打造智能營養健康服務體系,以場景式健康顧問更好地連接消費者。也讓人工智能技術與行業場景實現深度融合,推動乳製品行業數字化轉型升級。

這就是音視頻技術帶給企業數字化的絕佳示範,不是爲了數字化而數字化,所有瞄準的地方,都是企業以往所想卻不能及的事情,在人力有時而窮的時候,機械降神。

傳播學家麥克盧漢說人類總是通過後視鏡來觀察前方,「我們實際上是倒着走向未來。」

考慮到麥克盧漢的玄學風格,對他這句話的理解版本很多,但尼葛洛龐帝的解釋是最讓人感到信服的,他說那些早期歌頌互聯網的人,就像是對爬山感到興奮的新手,但他們都沒有遇到缺氧,着只能說明,所有人其實都還在山腳,距離想象中的山頂尚且非常遙遠。

就像一百年前,人類就在設想會飛的汽車了,很多科幻小說和時尚雜誌都樂觀預測二十世紀末就能在紐約上空看到遮天蔽日的汽車隊列,隨着時間的推移,這幅暢想中的圖景也就成了後視鏡中的畫面,科學家和工程師們還在爲之努力奮鬥。

關於音視頻技術的預期,我在之前的文章《音視頻的火,燒到了傳統行業的腹地》裡也提到過,早在幾十年前的文學或影視作品裡,我們就接受了一個音畫實時同步的未來,在「安德的遊戲」裡,坐在電腦前就能開飛船打外星人,在「攻殼機動隊」裡,人們聚在一起開會的方式就是全息投影了,而在真實世界,像是騰訊雲音視頻這樣的平臺還在日以繼夜的把這些提前構想出來的效果逐一實現。

當然了,和文藝創作相比,未來總是會以最接地氣的方式出現。

騰訊雲音視頻在中國視頻雲解決方案市場已經連續霸榜五年第一,它的客戶羣體肉眼可見的在向外破圈,從泛互聯網公司轉向多元化的傳統公司,尤其是在金融、醫療、工業、廣電、文旅這些積重產業。

這類公司的數字化轉型特點,都對「所見即所得」有着極高需要,比如銀行的網點成本消耗巨大,用戶也不喜歡動輒就要取號排隊,在搭建了虛擬營業廳後,用戶的大部分需求都可以在手機上完成,甚至連面籤都有數字員工來一對一的提供對話服務。

這些都在客觀上爲音視頻行業樹立了一道標準,那就是隻有爲客戶創造了增量機會,才能在企業級市場擁有長效的訂單,支撐起那棵繁茂的場景之樹。

從週期的角度來看,中國互聯網的繁榮興盛,離不開實體經濟的哺養之恩,電信基站的高密度建設,成就了移動流量的迅速爆發,製造業的靈活產能,供應了電商渠道的巨量貨源,城市化的集中規模,更是編織出了即時配送所需要的人力網絡,爲線上消費創造出了全球領先的條件和環境。

也是時候讓互聯網行業在突飛猛進的過程裡攢下的高新技術資源,來回報實體產業的多年支持了,數實融合不是一句空話,而是一種價值,動能切換的價值。

可以預見,這是下一個20年的故事開頭。

而AI的迎面大浪,也只會進一步加速數實融合的過程,以大模型爲基底,任何企業都能用相對可控的成本跑出一個屬於自己的精調模型,這種能力最終會體現在可視、可聽的互動關係裡,這正是騰訊雲音視頻早早擺放棋盤的位置。