解鎖羊駝 3 的潛力,這些事您不得不知!

Llama 3 是 Meta 於 2024 年發佈的最新一代大型語言模型。除了有效之外,其一大賣點在於能夠免費使用

羊駝 3 是由Meta AI開發的最新的大型語言模型,Meta AI 是 Facebook 母公司 Meta 的人工智能分支。它於 2024 年 4 月推出,到 2024 年 7 月已更新至 3.1 版本,增添了新功能。雖然它是多模態的,但它還不能輸出圖像、視頻或音頻,而是嚴格專注於基於文本的輸出,不過它確實提供編碼支持。

您可以訪問羊駝 3 的三個版本。最大且功能最強的是 Llama 3.1 405B 模型,Meta 基於 4050 億個參數(故而稱爲“405B”)對其加以訓練。它在 2024 年 7 月隨着羊駝 3.1 的更新而推出,使羊駝成爲世界上功能最強大的開源大型語言模型。

405B 模型擁有 128,000 個標記的上下文窗口,這使其能夠處理比其他大型語言模型大得多的數據集、文件和更長的提示,並且在擴展輸入時能保持上下文意識。當涉及到生成用於訓練其他大型語言模型的合成數據時,此功能特別有用,因爲上下文非常重要。

除了對數萬億個標記的數據展開廣泛的預訓練外,405B 還從人類交互中獲取了大量的微調以及數百萬個標記的反饋,以提升其準確性並增強其防範惡意使用的保障措施。405B 模型幾乎專門用於高級研究,並在數據中心硬件上運行,因爲其規模使其運行成本更高。

Llama 3.1 70B 是一個更緊湊的模型,基於 700 億這一相對適度的參數數量進行訓練。它比 405B 模型更快、更精簡,運行所需的處理能力大幅減少。較小的數據集讓它成本更低、速度更快,並允許其在一些商業硬件上運行。它保留了 405B 模型的大上下文窗口,但在能力的深度和廣度方面有所欠缺。70B 模型可以承擔中等人工智能任務,例如爲客戶支持運行聊天機器人。

Llama 3.1 8B 是這些模型中最精簡的,僅基於 80 億個參數進行訓練。它仍然保持 128,000 個標記的上下文窗口,但其更有限的訓練數據意味着它不如其他模型準確,也不像其他模型那樣能夠執行復雜的分析。不過,其輕量級設計使其能夠在消費級硬件上本地運行,使其成爲本地文本生成和希望使用人工智能功能構建輕量級商業應用程序的開發人員的絕佳工具。

Llama 3 已被證明是一組非常有能力的大型語言模型,可以與最好的競爭對手相媲美,包括標誌性的GPT-4 和 GPT-4o 模型。

在與其他高端語言模型的基準測試裡,Llama 3.1 表現非常出色。其 405B 模型與大多數其他頂級模型一樣好或更好,其 Llama 70B 和 8B 模型與那些更精簡、更快的模型具備競爭力。

Llama 3 編碼能力出色。它既可以幫助您編寫自己的代碼,也可以爲您定製編寫整個程序,如果您的需求較爲簡單。它支持超過 30 種語言,儘管在處理英語時仍然是最好的。

像大多數大型語言模型人工智能一樣,Llama 3 在爲寫作生成文本方面也表現極佳。這適用於商業場景、小說、散文以及社交媒體帖子。它也可以考慮很多上下文,所以您真的可以微調您的提示。

Llama 3 比這一大型語言模型的前幾代有更先進的保障機制。它包括 Llama Guard 3,這是一個多語言安全模型,與 Prompt Guard 一起工作,有助於防止使用提示進行代碼注入和生成。這些應用程序也是開源的。

對於消費者、開發人員和大型語言模型使用的增長來說,Llama 3 的一個主要優勢是它是開源的。代碼可供開發人員和最終用戶使用,以其爲基礎創建新的和更好的東西。這種訪問加速了 Llama 3 驅動的人工智能和聊天機器人的發展,因爲它在其他商業可用的大型語言模型所不能覆蓋的領域可用。

您甚至能夠親自試用高端的 Llama 3.1 405B 模型,向 Meta.ai 或者 美國的 WhatsApp 上提出具有挑戰性的數學或編碼問題。

儘管 Llama 3 能力很強,但它並非在所有方面都是最佳的 LLM,而且還缺少您在別處可能會發現的衆多功能。

雖說它是一個多模態語言模型,不過在撰寫此文時,Llama 3 並未擁有完全的多模態支持。圖像生成還未得到廣泛應用,並且它不能生成視頻或音頻。

它在除英語之外的語言方面的能力也依舊有限。它會產生幻覺,並且像過去這類其他的 AI 一樣自信地犯錯。

Llama 3.1 的運行成本也很高,尤其是其性能最強的 405B 模型,所以對這個頂級模型的使用權限有限,且這種情況可能會持續一段時間。其他模型令人印象深刻,但它們無法提供相同的能力。

Llama 3 的訓練成本高得令人咋舌。它需要長時間使用數千個 Nvidia H100 GPU。事實上,數量如此之巨,就連像 Meta 這種規模且資源豐富的公司,也不得不決定何時——以及持續多長時間——允許模型使用硬件進行訓練,因爲他們可能在其他地方也需要它。

使用 Llama 3 最簡單的方法是,如果您在美國,可以在 Facebook Messenger 中與Meta.ai 聊天機器人或 WhatsApp 進行交互。該 AI 運用了 Llama 3 ,並且會依據您任務的複雜程度,准許您使用 Llama 3.1 405B ,或者要求相對較低的 70B 和 8B 模型。

您還能夠在諸如 HuggingFace 這類平臺上使用 Llama 3 ,此平臺提供了對開源大型語言模型的訪問渠道。您需要註冊一個帳戶,並從可用模型中選擇 Llama 3,但隨後您可以使用 API 創建自己的應用程序或使用 HuggingFace 的庫直接與模型進行交互。

或者,您能夠 下載並安裝 GPT4All。它能讓您與一系列大型語言模型進行交互,包括在本地的 Llama 3。不過要注意,跟基於雲的大型語言模型相比,使用高端模型時性能會顯著下降。