AI短劇公司獲百度投資;蘋果AI將登VisionPro,今秋或將接入谷歌Gemini;上海醫院用AI自動生成病歷丨AI情報局

融資快報

CreativeFitting獲百度PreA+輪融資:CreativeFitting(井英科技)推出全球首款AI短劇APP,Reel.AI在海外市場正式發佈,並迅速登上娛樂應用暢銷榜,主創團隊獲百度投資。創始人兼CEO朱江畢業於上海交通大學計算機系,曾任觸寶科技首席增長官,從0構建了千萬級DAU的泛娛樂應用,並負責集團全球用戶增長工作。

Axelera AI 在 B 輪融資中籌集了 6800 萬美元:Axelera AI 是荷蘭一家專門爲 AI 推理構建的AI硬件加速技術提供商。其產品 Metis™ AI 平臺是一種用於邊緣 AI 推理的硬件和軟件解決方案,以替代解決方案的一小部分成本提供性能和效率。支持者包括 Invest-NL Deep Tech Fund、European Innovation Council Fund、Innovation Industries Strategic Partners Fund和 Samsung Catalyst Fund,以及現有投資者 Verve Ventures、Innovation Industries、Fractionelera 和意大利主權基金 CDP Venture Capital SGR。

Illumex獲1300萬美元種子輪融資:Illumex 是以色列一家專注於爲結構化數據添加語義含義的 AI 基礎設施,領投方:Amdocs Ventures、Cardumen Capital、Samsung Ventures。

Clay獲6200萬美元B輪融資:Clay Labs Inc.是一家人工智能驅動的銷售和營銷初創公司。Meritech Capital Partners LP領投了B輪融資,Sequoia Capital Operations LLC、First Round Capital LLC、Box Group LLC和Boldstart Ventires LLC也參與了本輪融資。

Synthflow獲740萬美元種子輪融資:Synthflow 用於開發 AI 生成的電話通話技術,旨在幫助小型企業自動化客戶互動,如安排約會、回答電話和收集信息。融資由 Singular 領投,現有投資者 Atlantic Labs 和包括 Krisp AI 創始人在內的投資者參投。

HydroX AI獲400萬美元融資:HydroX AI是一家位於加利福尼亞州聖何塞的人工智能初創公司,提供全面的大型語言模型安全和安保平臺。支持者包括Vitalbridge Capital,Atom Capital和Microsoft執行副總裁,百度前首席運營官Qi Lu。

Loti 籌集了515萬美元種子資金:Loti 利用 AI 技術保護公衆人物免受深度僞造和未經授權使用人臉的侵害。

Dappier 獲 200 萬美元的種子資金:爲出版商提供通過內容生成模型獲利的平臺,同時保護版權不被侵犯。領投方爲Silverton Partners。

Fluently 籌集 200 萬美元種子資金:Fluently 是人工智能驅動的英語教師平臺,投資參與方包括 Pioneer Fund, SID Venture Partners,和個人天使投資人。

LeyLine獲得數百萬美元種子輪融資:LeyLine是一家AI賦能人機混合智能生態系統開發商,致力於推出全球首個針對遊戲,短劇,動畫,CG等內容製作行業的AI賦能人機混合智能生態系統。融資領投方爲春華創投,跟投方包括總部位於波士頓的深科技基金Taihill Venture和多位著名天使投資人,其中包括SparkCognition創始人Amir Husain,以及前康柏電腦首席技術官Bob Stearns創立的SternHill Partners。

Better Futures 籌集50 萬歐元的資金:Better Futures 是一家總部位於愛爾蘭都柏林的早期工程和製造人工智能初創公司,該公司打算利用這筆資金加速推出EVA(TM),這是其面向工程師和製造商的新型人工智能助手和平臺。

YconityAI完成600萬元Pre-A輪融資:Yconity AI是一家人工智能平臺開發商,其人工智能平臺處理用戶任務,識別重複的工作步驟,並自動生成自動化這些任務的代碼。本輪融資投資方漢十投資,資金將用於技術研發。

(歡迎添加微信AIyanxishe2,瞭解更多AIGC、融資情況,與志同道合的朋友一同暢聊時新AI產品)

國內情報:

商湯如影AI視頻生成平臺推出央視記者王冰冰AI數字人:

商湯科技的AI數字人“AI冰冰”在《2024中國・AI 盛典》中首次亮相,展現了出色的多語言能力和逼真的視覺效果。基於SenseNova大模型技術,如影平臺的AI視頻生成技術實現了高清複製和自然的表情、嘴型、動作效果,展示出卓越的語言能力。

影視行業迎來首個妝造大模型:

阿里大文娛發佈了自研影視妝造大模型神力霓裳,專精於古裝劇的妝造創意設計,包含造型設計、妝發設計和紋樣設計三大功能,造型師在設定朝代、性別、身份等條件後,輸入相關提示詞,2分鐘即可獲得造型圖片。

全國首個司法審判垂直領域大模型啓用:

深圳市中級人民法院上線運行人工智能輔助審判系統,這是全國首個司法審判垂直領域大模型。該系統將審判流程拆解爲 85 個節點,開發出 4 個功能模塊,包括立案智審、智能閱卷、智能庭審和智能文書生成。系統可提供全面支持,大幅縮短庭審準備時間。此外,系統還能深入剖析案件要素。

上海醫院用AI自動生成病歷,效率提升30倍:

上海市第一人民醫院引入螞蟻大模型提高病歷書寫效率的創新應用。通過關鍵信息的給定、語音輸入等多種形式結合自動生成病歷,簡化入院記錄的填寫過程,將原本5到10分鐘的工作縮減到了15至20秒。這是AI 大模型首次在全國醫療領域輔助醫生生成電子病歷。

天津大學科研團隊開發可開源的片上腦-機接口智能交互系統:

天津大學科研團隊與南方科技大學等機構合作,開發了一種可開源的片上腦 - 機接口智能交互系統 MetaBOC,該系統能夠實現無人控制的腦機交互任務。研究通過幹細胞培養技術創造了一個類腦組織 “片上腦”,能夠模擬生物大腦的一些智能功能,並通過電極芯片與外界進行信息交互。片上腦由 “片”(電極芯片)和 “腦”(體外培養大腦)組成,可以實現對機器人進行避障、跟蹤、抓握等任務的自主控制。

中山大學&字節智創數字人團隊提出虛擬試穿新框架:

MMTryon的虛擬試穿框架,能夠通過輸入多個服裝圖像及指定穿法的文本指令,生成高質量的組合試穿結果,適用於真人圖像和漫畫人物。無需依賴傳統的服裝精細分割,在基準測試中超越了現有的 SOTA 方法。

何小鵬稱2025年最top車企將進入AI智駕ChatGPT時代:

何小鵬發佈Waymo和特斯拉FSD對比視頻。他表示,FSD最近半年的進步速度飛快,而且隨着FSD的數據量越來越大,整個Infra越來越好,堅信在2025,FSD一定會超過Waymo。何小鵬表示,整體來看,他認爲2025年最top車企將進入AI智駕ChatGPT時代,並加速完全甩開當前規則模式的自動駕駛能力,而2026年會實現部分場景無人駕駛。

國際情報:

OpenAI向少部分用戶推出GPT-4o(S2S)模型:

有少數用戶發現 ChatGPT Alpha Models 中出現了一個名爲 GPT-4o (S2S) 的新模型,目前該模型的用途尚未得到官方的解釋。目前有兩種猜測:一種是 S2S 可能是 GPT-4o 的滾動發佈模型,另一種是 S2S 可能是 GPT-4o 高級實時語音模式的免費版。後者概率更大,類似於 GPT-4o,所有用戶都可以使用,但免費用戶的使用配額有限,使用後需要等待一段時間才能再次獲得配額。

消息稱蘋果AI將登Vision Pro,今秋或將接入谷歌 Gemini:

古爾曼稱蘋果 AI 將在 Vision Pro 上運行,但運行該 AI 需要“足夠的 RAM”,頭顯的 16GB RAM 能夠運行摘要、書寫工具和新版 Siri 功能,但 HomePod / mini 音箱只有 1GB RAM,無法運行相關 AI 模型。

此外古爾曼透露蘋果或於秋季宣佈與谷歌達成新協議,讓 Apple Intelligence 接入Gemini。Meta 公司的 Llama 聊天機器人因爲性能不佳而被蘋果拒絕。此外,蘋果希望通過 AI 直接盈利,可能會推出類似於 iCloud 的 “Apple Intelligence+” 訂閱服務。

微軟開源基於ChatGPT的超級文本代碼智能體:

微軟的研究人員提出了“Code-First”的技術概念,並基於ChatGPT開發了超級代碼智能體——TaskWeaver。TaskWeaver可以將用戶的自然語言文本請求轉化爲Python代碼在後臺運行,並且這些代碼可以任意調用功能插件,完成數據讀取、分析、模型訓練等專業任務。

Runway Gen 3可以生成電影片頭3D巨幅字幕效果:

Runway最新推出的Gen-3Alpha視頻生成模型在保真度、一致性和動作表現方面有重大改進,不僅生成穩定光影,還展現強大想象力。內測博主展示了3D巨幅字幕效果,Gen3即將對所有人開放使用。模型精細控制運動,審美強大,想象力豐富,符合物理規律,生成速度快。

馬斯克稱xAI 將於 8 月推出 Grok-2 大語言模型:

馬斯克在自己的 X平臺宣佈,其人工智能初創公司 xAI 的大語言模型 Grok-2 將於 8 月推出。xAI 今年 3 月、4 月陸續推出了 Grok-1.5 大語言模型和首個多模態模型 Grok-1.5 Vision。xAI 曾表示,Grok-1.5V 在多學科推理、文檔理解、科學圖表、表格處理、屏幕截圖和照片等多個領域“都能媲美現有的前沿多模態模型”。

扎克伯格最新深度訪談討論智能眼鏡、神經腕帶與個性化AI的未來:

Meta CEO Mark Zuckerberg討論了未來十年的技術發展,尤其是智能眼鏡、神經腕帶和 AI 技術在創作者和小企業中的應用。Zuckerberg認爲智能眼鏡將逐步取代手機成爲主要的個人硬件設備。他提到,未來的智能眼鏡將分爲三種類型:無顯示屏的基礎型、帶有擡頭顯示的中級型和全息顯示的高級型。他還強調,未來的 AI 技術將不會是單一的,而是多樣化的,允許創作者和小企業創建定製化的 AI。這種多樣化的 AI 體驗將提升用戶互動的豐富性和個性化。

微軟 AI CEO稱今年年底,將擁有實時的語音界面,允許完全動態的交互:

微軟 AI 負責人Mustafa Suleyman強調,AI 的發展並不會像加密貨幣那樣成爲一時的熱潮,而是會持續對社會產生深遠影響。他指出當前的 AI 技術已經在多個領域展現了其價值,這與加密貨幣在短時間內的表現形成鮮明對比。在談及中美技術競爭時,Suleyman 呼籲在保持競爭的同時,也應尋求合作的機會。他指出,儘管中美之間存在技術上的分裂,但全球化背景下的合作仍然是不可忽視的趨勢。通過共同努力,雙方可以在各自的技術生態系統中找到共存的方式。

更多國際情報:

OpenAI聘請Zapier COO擔任銷售戰略負責人,銷售團隊已達200人:據Lionetti在LinkedIn顯示,他曾在Atlassian和Confluent擔任營銷職務,並曾是Dropbox的增長領導者。

谷歌 AI 視頻編輯應用 Google Vids 上線測試:Google Vids集成了Gemini,可以創建幻燈片、編寫視頻腳本,並從 Shutterstock 尋找素材,爲整個視頻製作分鏡頭腳本,還可以通過幾句話來描述視頻的主題或自己想要的效果。

Character AI推出新語音功能,可以給AI角色「打電話」:支持多種語言包括英語、西班牙語、和中文等,確保通話體驗的自然流暢性,與真人聊天無明顯差異,用戶可以選擇或創建超過100萬種獨特的聲音。

SK 海力士計劃 2028 年前投資 103 萬億韓元押注 AI:其中約 80% 用於 HBM 內存芯片。

高盛對科技公司大舉投資人工智能提出質疑:據高盛報告,儘管預計企業將在人工智能上投資超過 1 萬億美元,但 AI 技術相關的高成本,包括數據中心、電網和 AI 芯片,並質疑這些成本是否能夠通過回報來證明。

反壟斷機構將發威,微軟與 OpenAI/谷歌與三星之間的交易受歐盟關注:歐盟反壟斷監管機構正在審查微軟、OpenAI、谷歌和三星之間的 AI 合作關係,重點關注其排他性條款是否會對競爭對手產生負面影響。此前,監管機構已向大型科技公司發出調查問卷,關注其 AI 合作關係。並對“收購-僱傭”行爲展開調查。

Product Hunt 熱榜,Intercom推出"Early Stage"

Intercom爲初創企業提供了一個全面的客戶服務平臺,"Early Stage"計劃包含如AI驅動的客戶服務機器人Fin、多渠道溝通工具、自動化工作流程等。這些工具旨在幫助初創團隊高效管理客戶支持,同時節省成本。同時針對資金不超過100萬美元、成立不超過2年、員工不超過5人的初創企業,他們還提供爲期三年的折扣優惠。

?https://www.intercom.com/

Hugging Face 熱榜,突破性AI語音合成技術MARS5

CAMB.AI推出了先進的英文語音合成模型MARS5,採用創新的兩階段自迴歸-非自迴歸流程。該模型僅需5秒音頻和文本片段即可生成適用於多種場景的高質量語音,支持140多種語言,並可通過標點和大小寫控制語調。

MARS5提供了快速的"淺層克隆"和高質量的"深度克隆"兩種推理方式,用戶可根據需求選擇。該模型在GNU AGPL 3.0許可下開源,同時也提供API調用。CAMB.AI團隊計劃持續優化模型性能,並鼓勵社區貢獻。

?https://huggingface.co/CAMB-AI/MARS5-TTS

開發者推薦

1.Arc.dev:全球遠程人才招聘平臺

Arc.dev 是一個幫助公司快速招聘全球頂尖遠程開發者、設計師和市場營銷人才的平臺,提供兼職或全職的遠程工作機會,並且直到僱傭爲止無需任何費用。該平臺擁有來自190個國家的35萬多名候選人,通過HireAI技術實現快速匹配。

?https://arc.dev/?ref=producthunt

2. Plus AI爲企業推出智能演示文稿製作工具

Plus AI推出了一款面向企業的AI驅動PowerPoint製作工具,旨在提高演示文稿製作效率。該工具提供定製模板服務,集成AI自動化功能,支持Google Slides和PowerPoint平臺,並允許多種格式導出。Plus AI強調品牌一致性和團隊協作,爲企業用戶提供了便捷的幻燈片創建和編輯解決方案。

這款工具不僅支持從零設計或轉換現有模板,還注重用戶安全和隱私保護。Plus AI採用企業級安全措施,達到SOC 2 Type II合規性標準。與其他AI輔助工具相比,Plus AI更專注於幻燈片製作領域,爲企業提供專業和定製化的服務。

?https://www.plusdocs.com/plus-ai-for-powerpoint?ref=producthunt

3.gptpdf: AI驅動的PDF轉Markdown新工具

開源項目gptpdf爲PDF文件解析和轉換帶來了新突破。該工具利用GPT-4o等大型視覺語言模型,能夠高效地將PDF文件轉換爲Markdown格式,包括複雜的排版、數學公式、表格和圖表等內容。

gptpdf由CosmosShadow在GitHub上維護,以其簡潔的代碼(僅293行)和多模型支持贏得了開發者的青睞。該工具通過PyMuPDF分析PDF結構,再由AI模型生成Markdown,每頁平均成本僅$0.013。gptpdf的出現爲文檔處理和知識管理提供了新的可能性,有望在學術研究和商業應用中發揮重要作用。

?https://github.com/CosmosShadow/gptpdf/

前沿技術

1.ClotheDreamer: AI驅動的3D服裝設計新突破

上海大學等機構的研究團隊開發了ClotheDreamer,這是一種基於文本生成3D服裝的創新技術。該系統利用3D高斯模型和先進的AI算法,能夠將文字描述轉化爲高質量、可穿戴的3D服裝模型。

ClotheDreamer的核心在於其Disentangled Clothe Gaussian Splatting技術,可以分別優化服裝和人體模型。該方法不僅提高了生成服裝的質量和完整性,還支持自定義模板輸入,爲虛擬角色創作和數字時尚設計開闢了新的可能性。這項技術有望在遊戲開發、虛擬試衣等領域產生重大影響。

?https://ggxxii.github.io/clothedreamer/

2.DiffIR2VR-Zero: 擴散模型助力零樣本視頻修復

來自國立陽明交通大學、東京大學和聯發科技的研究團隊提出了DiffIR2VR-Zero,這是一種基於擴散模型的零樣本視頻修復方法。該技術巧妙利用預訓練的圖像修復擴散模型,無需額外訓練即可處理視頻去噪和高達8倍的超分辨率任務。

DiffIR2VR-Zero通過創新的分層令牌合併策略和混合對應機制,實現了高效的視頻修復。研究表明,該方法在多個具有挑戰性的數據集上展現出優越的泛化能力,爲視頻增強領域提供了一個靈活且強大的解決方案。這一跨國合作研究成果有望在計算機視覺和視頻處理領域產生重要影響,推動相關技術的進步。

?https://jimmycv07.github.io/DiffIR2VR_web/

3.Paint by Inpaint: AI驅動的圖像編輯新突破

Weizmann科學研究所和以色列理工學院聯合研究提出了一種創新的圖像編輯技術——Paint by Inpaint,通過巧妙的"移除再添加"策略實現高質量圖像編輯。核心是利用預訓練擦除模型和擴散模型,結合文本指令,無需用戶提供輸入掩碼即可精確添加物體。

研究者構建了大規模數據集PIPE,採用多階段過濾確保數據質量。基於PIPE訓練的模型在人類評估中獲得72.5%的偏好率,遠超其他方法。這一突破性技術爲AI輔助圖像創作開闢了新途徑,有望在設計、廣告等領域產生重大影響。

?https://rotsteinnoam.github.io/Paint-by-Inpaint/

熱議話題

澳大利亞語音演員面臨AI挑戰:工作岌岌可危

澳大利亞語音演員聯合會(AAVA)近日發出警告,人工智能(AI)聲音克隆技術可能嚴重威脅5000名本土語音演員的職業生涯。這一技術在廣播、商業廣告和電子遊戲等領域的應用,正逐步改變傳統配音行業的格局。

AAVA會長西蒙·肯尼迪表示,他們並不反對AI技術本身,而是呼籲制定公平規則來規範其使用。有聲書市場可能是首當其衝的領域,出版商已開始考慮用AI替代人工配音以節省成本。然而,缺乏人性化表達可能導致聽衆興趣降低。

一些配音演員對AI技術持謹慎態度。他們擔心新人入行機會減少,創意空間受限,甚至面臨聲音被無授權克隆使用的風險。AAVA正積極呼籲立法,確保AI聲音使用時需經本人同意、可控且有償。

儘管挑戰重重,AI技術也爲小型內容創作者帶來機遇,使他們能以較低成本提升作品質量。未來,如何在保護演員權益與推動技術創新間取得平衡,將是業界面臨的重要課題。

? https://www.theguardian.com/technology/article/2024/jun/30/ai-clones-voice-acting-industry-impact-australia

敬請期待明日的最新動態!

雷峰網