☰

Mac專屬大模型框架來了！兩行代碼部署，能聊本地數據，支持中文

Mac用戶，終於不用羨慕N卡玩家有專屬大模型Chat with RTX了！

大神推出的新框架，讓蘋果電腦也跑起了本地大模型，而且只要兩行代碼就能完成部署。

仿照Chat with RTX，框架的名字就叫Chat with MLX（MLX是蘋果機器學習框架），由一名OpenAI前員工打造。

黃院士的框架裡有的功能，例如本地文檔總結、YouTube視頻分析，Chat with MLX裡也都有。

而且包括中文在內共有11種可用語言，自帶支持的開源大模型多達七種。

體驗過的用戶表示，雖然計算量負擔對蘋果設備可能大了點，但是新手也很容易上手，Chat with MLX真的是個好東西。

那麼，Chat with MLX的實際效果究竟怎麼樣呢？

Chat with MLX已經集成到了pip命令中，所以在有pip的條件下，只需要一行代碼就能完成安裝：

安裝完成後，在終端中輸入chat-with-mlx並按回車，就會自動完成初始化並彈出網頁（第一次啓動及下載模型時需要連接到Hugging Face服務器）。

△Chat with MLX實測效果

將這個頁面向下翻，選擇想用的模型和語言後點擊Load Model，系統就會自動下載模型信息並加載。

注意如果中途需要更換模型，需要先將前面的模型Unload再選擇新模型。

其他模型只要Hugging Face上有並且兼容MLX框架，也可以手工添加，方法可以到GitHub頁中瞭解。

如果要使用自有數據，需要先選擇類型（文件或YouTube視頻），然後上傳文件或填寫視頻鏈接，並點擊Start Indexing建立索引。

按照開發者的說法，只要不點擊Stop，再次上傳新文件後數據是累加的。

當然，也可以不傳數據，直接當成普通大模型來用。

爲了避免推理時間過長，我們選擇了規模較小的Quyen-SE來進行測試。

（Quyen-SE基於阿里的通義千問改造而成，Chat with MLX的作者也參與了研發工作。）

首先看看模型不加定製數據的速度，在M1芯片的MacBook上，這個0.5B的模型表現是這樣的，可以說比較流暢。

但在宣傳中，Chat with MLX的主要賣點，還是本地RAG檢索。

爲了確保素材文檔在模型的訓練數據中不存在，小編從箱底翻出了自己不公開上網的本科畢業論文。

我們詢問了論文中不同位置的細節，一共根據文章內容給Chat with MLX設計了十個問題。

其中有七個回答是正確（符合文意）的，不過速度和純生成相比要略慢一些。

測試中我們還發現，模型還有一定的機率會把提示詞吐出來，不過觸發條件似乎沒有什麼規律。

但可以看出，爲了提高模型的表現，作者已經把給小費這種新興的提示詞技巧都招呼上了。

整體感受下來，可能是受制於算力原因，在蘋果設備上部署本地大模型，效果無法和英偉達的Chat with RTX相媲美。

同時，在GitHub上，也有許多用戶反饋各種各樣的安裝失敗問題，作者也都進行了回覆或跟進，並把程序重新更新了一遍。

但無論如何，選擇本地化部署，數據的安全性可能是更爲重要的考量因素；而且從中可以看出，本地化、專屬化的大模型，已經開始出現向消費級產品普及的趨勢。

用網友的話說，升級AI PC的時間到了。

GitHub：https://github.com/qnguyen3/chat-with-mlx

相關資訊