階躍星辰發佈“萬億”和“多模態”大模型 與上海電影“大鬧天宮”|2024WAIC
《科創板日報》7月6日訊(記者 黃心怡)在2024 世界人工智能大會暨人工智能全球治理高級別會議(簡稱“WAIC 2024”)上,階躍星辰發佈了三款Step系列通用大模型新品:Step-2 萬億參數語言大模型正式版、Step-1.5V 多模態大模型、Step-1X 圖像生成大模型。
自今年三月公佈以來,Step系列通用大模型實現了從千億參數到萬億參數,從語言模型到多模態模型,從理解到生成的全面進步。
同時,階躍星辰還重點展示了面向C端用戶的自研大模型應用產品,並披露了在大模型生態合作領域的最新進展與計劃。
階躍星辰副總裁李璟在大會期間做客財聯社直播間接受了《科創板日報》記者的專訪。
他介紹,最新發布的Step-2萬億參數語言大模型正式版,採用了創新的MoE混合專家模型架構。新升級的Step-1.5V千億參數多模態大模型具備出色的視頻理解能力。它能準確地識別視頻中的物體、人物和環境,並理解視頻的整體氛圍與人物情緒,甚至進行描述和互動問答。
此外,階躍星辰還新發布了Step-1X圖像生成大模型,並與上海電影開展合作,針對中國動畫IP進行了視頻生成能力的技術展示。
階躍星辰也積極在C端發力大模型應用,智能助手——“躍問”和AI開放世界平臺——“冒泡鴨”,是階躍星辰面向C端用戶推出的兩款自研產品。李璟介紹,“躍問”定位爲效率工具的角色,充分發揮了階躍星辰大模型多模態的特點,準確地描述和理解圖像中的文字、數據、圖表等信息,完成內容創作、邏輯推理、數據分析等任務。“比如在景點拍的照片,可以向躍問提問獲取這個景點的信息。”
“冒泡鴨”則打造了一個AI開放世界。在這裡,用戶可以探索故事、創作角色,沉浸屬於自己的開放世界。“我們希望通過AI的無限擴展和個性化生成能力,幫助創作者創造出與用戶互動的內容消費場景。目前,冒泡鴨正在以沉浸感與用戶互動體驗爲核心在做迭代和優化。”
人工智能大模型經歷了一年半“技術狂飆”。如今,大模型價格戰又帶來了商用競爭的提速。字節、阿里、百度、騰訊等國內多家大模型廠商近兩個月來競相降價。
對此,李璟稱早對市場的激烈競爭有所預判,後續階躍星辰將堅持在C端開展探索,同時也關注B端的高價值垂類領域。
7月5日,財躍星辰、階躍星辰和國泰君安證券舉行戰略合作簽約儀式。三方將從數據、算力、模型、應用等多方面努力,提升證券行業智能應用能力,打造最懂金融的大模型。其中,財躍星辰是由界面財聯社與通用大模型公司階躍星辰聯合創辦,專注於大模型在金融領域的科技研發和場景應用探索。
“這次的合作落地,是基於階躍星辰的通用大模型底座,結合界面財聯社積累的萬億級金融語料,在此基礎之上又與國泰君安深度共創,面向智能投顧場景推動千億參數大模型的更多實際落地。”李璟說,“大模型在金融領域的應用非常廣泛的,這是由於金融是整個數字化和信息化最成熟、滲透率最高的行業,也是大模型需求最旺盛的行業,我們已經看到了大模型在綜合分析、信息檢索、信息呈現、文檔撰寫等一系列領域有非常多的應用。
此外,階躍星辰聯合上海電影在“AI+IP”領域進行創新探索。雙方推出了一款《大鬧天宮》AI互動體驗——“測測你是哪路神仙”,調用了Step系列大模型,融合了圖像理解、風格遷移、圖像生成、劇情創作等多種能力。階躍星辰還與上海電影結合《葫蘆兄弟》的IP進行了視頻生成能力的展示。
“今年是大鬧天宮的60週年,作爲陪伴了幾代人成長的童年經典IP,如何與年輕人有更好地互動?所以我們把AI文生圖、AI劇情生成、AI性格測試等進行融合,每個用戶只要上傳自己的照片就可以進入天宮的場景裡。通過趣味性的AI互動,更大程度地激活經典IP,用科技致敬經典、講好中國故事,是我們的願景。”李璟強調。