智能攝像頭練就上千種“武藝” 可監測森林草原防火、文物保護

一臺智能攝像頭(智能感知設備)如何練就上千種“武藝”?走進大華股份,你會在8000多個應用場景中找到答案。它們有的在街頭巷尾用於提升城市治理水平,有的在工廠產線上用於智能製造管理,也有的用於森林草原防火、珍稀動物監測、水文水質記錄、文物古蹟預防性保護……

南方都市報“向新而行·探尋新質生產力”本期調研走進安防龍頭股之一大華股份。這家創立30餘年,集研發、製造、應用於一身的老牌製造企業將會如何把握人工智能、大模型等技術變革的機遇,進而重塑自身的生產力?

轉型

從安防龍頭邁向“智慧物聯”

“大華1993年起步,自主研發第一臺調度通信機;2001年,大華股份成立;2002年,開發第一臺8路音視頻同步嵌入式DVR;2004年,營業收入超1億;2008年,大華股份上市;2010年,營業收入超15億;2015年,營業收入突破100億……”這是2023年8月,大華股份董事長兼總裁傅利泉寫下的創業30週年回顧。

從自研通訊機起家到成爲安防頭部企業,大華用了30年時間,如今再一次站在轉型的“十字路口”。

最新發布的2023年財報顯示,大華股份2023年全年營收爲322.18億元,同比增長5.41%;歸母淨利潤爲73.62億元,同比增長216.73%;扣非淨利潤29.62億元,同比增長87.39%。

營收中來自智慧物聯產品及方案的收入佔比82.7%,同比增長5.79%;創新業務佔比15.23%,同比增長19.2%。創新業務主要包括機器視覺及移動機器人、智慧生活、熱成像、汽車電子、智慧安檢、智慧消防和存儲介質等相應業務。

可以看出,智慧物聯已成爲大華股份的主航道,“以視頻爲核心的智慧物聯解決方案提供商和運營服務商”是其戰略定位。

在走訪過程中,大華股份相關負責人向南都記者闡述了公司今年在研發和應用層面的規劃。

其中在研發方面,大華股份將持續發力視頻加非視頻技術,成爲一個綜合的智慧物聯解決方案提供方。資料顯示,大華股份持續加大對“全感知、全連接、全計算、全智能、全生態”的“五全”能力基座投入與建設,建立起以視頻爲核心的物聯基礎設施研發與解決方案閉環服務。其中“全感知”包含視頻感知產品、全域6D感知技術、多頻域感知技術,以及音頻感知、智能交互等產品。

在應用層面,大華股份將推動智慧物聯產品應用於各行各業。財報顯示,2023年大華股份國內業務中,城市業務營收爲43.33億元,同比增長0.18%;企業業務營收爲90.87億元,同比增長9.92%。

在城市業務方面,當下城市發展逐漸轉向以民生保障、民生便捷、民生服務爲重心,城市治理的重點也隨之走向提升服務。

行業應用方面,城市治理、交通、能源以及製造企業的數字化轉型將會是大華股份重點落地的場景。如在智慧用電領域,大華股份推出小體積、一體式、AI負荷識別系列智能空開,可以提升電力系統運行效率和安全性。結合智能照明系統、物聯智能抄表系統、智能空調綜控系統,該設備可實現園區能源數據實時檢測、用能策略自動調配。

創新

從視覺出發,推出多模態大模型

深耕安防行業30多年,大華股份積累了豐富的視覺AI技術,並擁有超8000個細分場景,這也爲其大模型相關算法和工程技術打下了基礎。

2023年10月,大華股份面向以視覺爲核心的智慧物聯領域,發佈了多模態融合的行業視覺大模型——大華星漢大模型,通過融合圖像、點雲、文本、語音等多模態數據,用以提升視覺解析能力。可以看出大華股份商業定位是以視頻爲核心,視覺無論是對機器,還是對人,它的感知是最綜合的。未來人工智能大模型最大的落地場景也將在視覺領域。

“多模態”也是國內外大模型企業紛紛“押注”的方向之一。國外廠商中,OpenAI發佈了GPT-4V,通過與GPT-4的配合使用,能夠將圖像輸入並回答有關問題,讓大模型擁有了圖像語義理解能力。谷歌緊隨其後,發佈了業界第一個原生多模態大模型Gemini。據悉,Gemini可以泛化並無縫地理解、操作和組合不同類型的信息,包括文本、代碼、音頻、圖像和視頻。今年年初,OpenAI旗下Sora的橫空出世,讓多模態大模型的潛力與價值更爲清晰地被看到。

與文生視頻模型Sora相比,大華星漢大模型作爲解析式的視頻大模型,與Sora的路徑恰好相反。“大華主要是幫助客戶對其既有的素材和內容做解析,然後客戶可根據這個素材裡解析的信息、發生的事情來做行爲判斷。”大華方面介紹稱。

據悉,大華股份選擇做面向行業的多模態大模型,原因在於行業大模型更貼近產業的落地應用,是爲解決實際問題而生,包括如何能讓人工智能算法訓練效率更高、應用更普遍,以及如何讓原來的算法更好用、更智能,然後再推動產業的數字化和智能化進程等。

南都記者留意到,國內大廠也在加碼多模態大模型。今年年初,阿里升級了通義千問視覺語言大模型,據介紹能夠準確描述和識別圖片信息,並基於圖片進行信息推理和擴展創作,能夠對畫面指定區域進行問答。

相比之下,星漢大模型的核心差異在於從客戶角度出發去看問題,其生成的內容是爲了幫助客戶分析具體問題、提供有價值的數據,這是脫離行業應用場景的深度學習算法無法實現的。

展望

優先落地電力與社會治理

不同的大模型在技術路徑之間或有差異,但最終都要走向商業化落地,如何給不同行業和場景帶來價值纔是大模型發展的“重頭戲”。業內普遍認爲,去年是“通用大模型元年”,今年則是“行業大模型落地元年”。南都記者留意到,在“百模大戰”的“硝煙”下,國內已有不少企業陸續將大模型面向行業落地應用。

2023年6月,騰訊首次公佈騰訊雲行業大模型研發進展。7月,華爲雲發佈了行業大模型——盤古大模型3.0,圍繞行業重塑、技術紮根、開放同飛三大創新方向。隨後的10月,阿里雲也基於通義“打樣”了8個行業大模型,覆蓋製造、公共服務、汽車、健康、金融、零售、科研等場景。

面對市場中的各路選手,大華股份認爲,“智慧物聯賽道是一個萬億賽道,市場足夠寬,同時每個企業有自身不同的優勢,相信能容下多家大型企業。”

據大華股份2023年財報介紹,當前業內發佈的大模型以生成式大模型爲主,常規實現方式是基於一個通用的大模型來擴展不同行業大模型實現處理不同的下游任務。星漢大模型則主要面向視覺解析任務,同時通過打造幾個典型的行業視覺大模型來沉澱出一套計算框架,依託這個計算框架,再打造更多的行業視覺大模型。

談及星漢大模型的行業落地規劃,據悉,電力和社會治理是今年內會落地的場景,主要面向G端和B端客戶,在實現技術的普惠化後會繼續推廣到更多場景。

對於大模型落地的難點,行業內普遍認爲算力成本是主要制約因素,大幅降低視覺解析大模型應用成本也是其規模化落地的前提。對此,大華股份主要採用大模型小型化技術以及大小模型協同技術,來構建用得起的場景化大模型。“大小模型協同部署是構建用得起的大模型系統的關鍵,能夠保證大模型系統算力成本可控,加速商業落地。”大華股份方面表示。

長遠來看,算力成本下降、大模型技術門檻持續降低是必然趨勢,大模型最終會實現先進技術的普惠性,當一項新技術在產業應用成熟之後,成本會被大幅降低,繼而又會刺激市場增長。

從財報中亦可以看出,人工智能、大模型技術已成爲驅動大華股份二次增長的新動力,接下來的重點工作包括“加強人工智能領域的研發和投入,結合多模態和大模型技術能力,推進面向行業應用的行業視覺大模型研發與產業落地,加速AI產業化升級,進一步拓展城市、企業數智化業務規模。”

南都調研

總第254期

統籌:甄芹 馬寧寧

採寫/攝影(除署名外):南都記者 馬寧寧 實習生 朱可軒