AI應用“大亂鬥” 浙大團隊殺入多模態

《科創板日報》7月29日訊(記者 陳美) 多模態AI崛起之下,創業公司加速涌入。近日,《科創板日報》記者獲悉,開發和應用大語言模型的杭州波形智能科技有限公司(下稱“波形智能”),正式殺入多模態領域。

波形智能創始人兼CEO姜昱辰告訴《科創板日報》記者,之前公司擁有的自研Agents框架和專門的寫作大模型Weaver,主要聚焦於長篇小說、劇本、深度文章的長內容生成領域。

“但今年基於市場需求,公司已開始聚焦多模態,從‘無限長文本生成’拓展到‘無限長內容生成’,覆蓋文本、音頻、影像的全鏈路內容創作。”姜昱辰對《科創板日報》記者表示,較於其他殺入多模態領域的公司,波形智能無限長內容生成的關鍵詞是“個性化”。

可以看到,生成式AI正在進入商業落地的考驗期,而多模態技術的採用,無疑是各項目探索應用的重要嘗試。《科創板日報》記者注意到,估值達200億的智譜AI也進入了文生視頻賽道,成爲國內三家頭部大模型公司中(智譜AI 、百川智能、月之暗面)率先涉足多模態領域的獨角獸。

定製化AI,是C端用戶的最終訴求

波形智能成立於2023年,實際控制人爲杭州無量企業管理合夥企業(有限合夥),創始人姜昱辰通過該持股平臺和自身持股,控制波形智能,合計持股比列近40%。

在年初的一筆融資中,藍馳創投、西湖科創投、藕舫天使爲投資方。融資完成半年後,波形智能創始人兼CEO姜昱辰近日對《科創板日報》記者表示,波形智能在技術和用戶留存上做了很多努力,並取得了一定成績。

首先在技術上,波形智能具備從訓練模型,到Agent搭建的全流程大模型能力。“波形智能的思路非常明確,通過提供低門檻的AI工具、數據準備、模型訓練部署的AI Infra等,跨越大模型和個性化需求鴻溝。”

“爲此,波形智能重點攻克個性化、可進化特性,疊加多模態、多語言能力。”姜昱辰稱,在原有版本上,“蛙蛙寫作2.0”通過多模態直接生成視頻故事,實現了從“小說”到“劇本”再到“視頻”的全鏈路內容創作。

在用戶留存方面,姜昱辰告訴《科創板日報》記者,從1月上線到現在,大模型Weaver已經爲用戶累計生成了超過200億字的內容,C端應用寫作用戶達到將近30萬,人均使用時長爲4.7小時。

而對於用戶價值方面,姜昱辰表示,在與用戶的溝通中發現,有一個更貼近自己風格的大模型,是內容創作者們的需求。“內容創作者們不需要通用性AI,而是千人千面、量身定製的AI,這實際上是用戶最底層的訴求。在1月發佈的蛙蛙寫作1.0版本上,大模型‘Weaver’已經添加搜索增強,通過個性化知識庫和RAG方案,在一定程度上實現‘越寫越懂你’的仿寫效果,但這種方式有天花板,且隱私性相對欠缺,對於個人和企業用戶來說均是痛點。”

多模態之下,浙大團隊殺入

爲此,在過去半年,波形智能技術團隊圍繞該痛點進行研發,最終研發出“Life-long Personalized AI”(LPA)技術路線,實現個性化、保護隱私的大模型。

具體而言,要做到個性化,首先需要打造一套好的記憶體系。“在這方面,波形智能比較幸運,在長記憶上有較深的技術積累,是全球第一個提出無限時長文本生成的團隊,再通過ChatGPT技術和動態傳感器機制,實現無限式長文本生成。”姜昱辰談到。

長記憶之外,可控性也非常重要。波形智能創始人兼CEO姜昱辰告訴《科創板日報》記者,在模型微調層面,波形智能分別對SFT階段、Agents層級、推理方面進行了技術創新,最終減少大模型生成中的累計誤差。

截至目前,波形智能在底層算力的支持之上,正在努力打造一個個性化的、自驅動進化的底層模型,安全並能保證用戶隱私的使用環境,以及像蛙蛙寫作、AI Learning等多元化領域的產品落地。

好的大模型應用落地,不僅需要核心技術,還要對垂直產品有深度理解,波形智能在覈心團隊上也有着滿足這一條件的配置。公開資料顯示,波形智能的創始團隊來自浙江大學及蘇黎世聯邦理工大學。

其中,創始人兼CEO的姜昱辰本科畢業於浙江大學竺可楨學院,是浙江大學對優秀本科生實施特別培養和精英培養的榮譽學院;之後,姜昱辰在蘇黎世聯邦理工大學人工智能攻讀博士,師從國際著名學者Ryan Cotterell,專攻自然語言生成方向,曾在微軟亞洲研究院從事大語言模型的訓練與推理研究。

首席運營官方面,聯合創始人兼COO的餘騰,曾任美國上市公司掌門教育(ZME)聯合創始人兼營銷高級副總裁,擁有豐富的商業化經驗、大規模團隊管理經驗和C端營銷增長經驗。值得一提的是,餘騰也來自於浙江大學竺可楨學院。

CTO和CPO方面,周王春澍在蘇黎世聯邦理工大學就讀博士,從事人工智能方向研究;CPO萬磊則出自騰訊,爲過億月活社交APP高級產品經理,多款AI產品創始人。

一位投資人在接受《科創板日報》記者採訪時表示,近一年來,生成式AI領域發生諸多變化,一是語言類應用佔比顯著下降。“在GPT模型之上套殼做簡單的應用,已經無法滿足用戶需求。越來越多的創業公司意識到,多模態肯定會帶來更好的用戶體驗和功能,所以多模態應用比例上升到了近50%。”

二是,更多公司深入到某一個具體行業和場景中,比如醫生助手、科研助手、寫作助手。同時,新應用不斷出現,資訊、漫畫、短劇等都是Agent賦能的領域。

三是,底層基礎設施創業公司增多,比如RAG檢索增強、Workflow、推理優化等公司。**“在AI賦能千行百業之下,未來更多2C和2B的Agent產品會出現在用戶視線中。”*