鈦媒體獨家對話Amazon Bedrock總經理:大模型太多,也太早,客戶需要有多個選擇

以下是對話實錄,經鈦媒體編輯整理。

鈦媒體:大公司和小而精的團隊,在當下實現AI技術創新、產業賦能方面,會有哪些不同優勢?

Atul:就針對客戶應用部署而言,我不認爲大公司和小企業之間會存在哪些明顯差異,它們之間有很多共通之處。我們都想爲大公司嘗試不同模式。當前Data Hygiene(數據衛生)這項工作非常具有挑戰性。當你爲較小的公司部署應用時,管理並確保模型訓練所需的私域數據實現高質量和一致性相對容易。但對於規模較大的公司,有大量差異化數據,且數據更加分散,管理數據會更具挑戰性。另一方面,初創企業可以通過承擔更多的風險更快地行動,它們沒有像大型客戶這樣的現有客戶羣,可能會出錯,也會在試錯中快速迭代創新。

鈦媒體:AWS想要做GenAI這件事情,最終希望解決什麼問題?

Atul:我們正在積極探索新的可能性。無論客戶希望自主構建模型,還是希望對現有模型進行深度定製,我們希望構建一套生成式AI堆棧,讓客戶使用到豐富且一流的工具,除此之外,還有Amazon SageMaker,基於NVIDIA提供的豐富實例類型,我們還積極研發定製芯片,涵蓋訓練和推理兩大領域,以滿足更精細化的需求。

通過這一系列從底層到中間層的創新,我們的目標是:讓企業內的任何開發人員都能夠自由構建生成式AI應用,而無需關注複雜的機器學習或底層基礎設施。我們堅信,所提供的工具將達到行業最高水準,幫助他們實現應用的創新突破。

目前,我們推出了Amazon Q business和Amazon Q developer兩個版本。Amazon Q business旨在爲企業中的每位員工配備一位專業顧問,確保他們能夠快速獲得解答並高效完成任務;而Amazon Q developer則專注於提升開發人員的工作效率,爲之提供即時的解答,以順利完成手頭的具體工作。這正是Amazon Q的最終目標,也是我們不懈追求的方向。

鈦媒體:對AWS自身的產品和業務結構真正意義上帶來改變,可能需要多久?如何在這個領域建立我們的領導力?

Atul:實際上,一切都取決於客戶以及我們試圖解決的具體問題。我們已經看到數以萬計的客戶正在使用SageMaker來改變其客戶體驗。這些變化有的已經發生,有的則需要一些時間。因此,對於何時能夠期待顯著變化,確實沒有一個固定的答案。

舉例來說,紐約證券交易所正在利用Bedrock來分析處理衆多監管文件,並將複雜的法規內容轉化爲易於理解的語言,這一舉措將對最終用戶產生深遠影響;同時,電子健康記錄技術供應商Netsmart通過應用相關技術,成功將患者健康管理記錄的時間縮短了50%,這無疑爲醫生騰出了更多時間,使他們能夠照顧到更多的病人。

今天我們已經看到了對最終用戶的一些積極影響,但我相信這仍然是一個需要時間來逐步發展和普及的過程。然而,這一進程的進展速度是相對較快的,已經形成了不可小覷的勢頭。因此,我無法確切預測是在今年年底還是明年,生成式人工智能將變得非常普遍。不過,可以肯定的是,它正在逐步改變我們的世界,爲我們帶來更多的便利和可能性。

鈦媒體:像RAG用於解決幻覺問題,但有些論文裡提了幻覺僅靠RAG也無法解決,在企業級應用中,如何測評幻覺存在程度,以及在具體應用時的影響?

Atul:儘管我們無法徹底消除這個問題,但隨着時間的推移,我相信會有越來越多的前沿研究涌現。你將看到客戶在處理幻覺方面取得了更多的進步與改進。我可以明確地告訴你,這個問題雖然無法完全解決,但作爲我們行動的一部分,它確實有助於減少其影響,只是無法徹底消除。隨着時間的推移,無論是模型內部還是外部,都將出現創新,從而幫助客戶更好地應對這種模式。

鈦媒體:模型間的協作問題,客戶在多個模型使用時,AWS目前有哪些比較好的解決思路?

Atul:對於客戶而言,這個問題顯而易見。因此,我們特別推出了一項名爲模型評估的功能,該功能已於去年12月發佈,並計劃於明天全面上線。從本質上來說,這一功能旨在幫助客戶在給定的一組提示上比較不同模型的性能,以便它們能夠選擇更符合自身特定用例的模型。

要實現這一目標,客戶有三種方式可供選擇。首先,他們可以在控制檯中根據給定的提示比較不同模型的性能;其次,客戶可以利用自動化評估功能,在不同數據集上運行不同的模型或使用標準行業數據集,從而查看哪些模型表現優異;最後,客戶還可以藉助公司內部的專業團隊,以不同的方式評估模型,確定哪種模型符合他們的期望。最終,客戶將從Bedrock獲得一份詳盡的報告,根據他們設定的標準,報告將展示模型的表現以及如何決定哪些模型對其有意義。

鈦媒體:AWS在AI倫理方面的舉措有哪些?

Atul:我們正與多個政府組織進行廣泛合作。以我們推出的Titan圖像生成器爲例,該工具具備水印功能,能夠添加不可見的水印,幫助客戶判斷生成的圖像是否由人工智能生成。除此之外,我們還與一些列其他組織合作,確保以負責任的方式使用人工智能。

鈦媒體:AWS在自研芯片方面的經驗是什麼?

Atul:多年來,我們一直在芯片領域進行投資,且早在2015年收購了芯片設計公司Annapurna Labs。儘管我們最初的重點是面向虛擬化和通用計算芯片,但隨後我們專注於開發專門用於機器學習的AI芯片。例如,用於人工智能訓練和推理的兩款專用芯片Amazon Trainium和Amazon Inferentia。

得益於多年來對芯片開發的持續投資,我們有了更多機會對這些芯片進行迭代和改進,以確保其性能和穩定性。這些改進恰逢其時,因爲生成式人工智能對計算能力的需求日益增長。

鈦媒體:Bedrock上有很多模型,你是否觀察到哪個模型最受客戶歡迎,比如Meta和Anthropic?

Atul:目前,我們尚不會透露各模型提供商的具體性能表現。但我想說的是,這些模型受到了廣大用戶的青睞。這主要是因爲模型的選擇取決於具體的應用場景,人們會根據不同的需求來選用不同的模型。因此,過早地指出哪些模型被廣泛應用還爲時尚早。(本文首發於鈦媒體APP, 作者|楊麗,編輯 | 蓋虹達)