不做數值運算、純靠嘴炮也能機器學習?基於自然語言的全新ML範式

本文作者肖鎮中是德國馬克思普朗克-智能系統研究所和圖賓根大學的博士生,Robert Bamler 是圖賓根大學機器學習方向的教授,Bernhard Schölkopf 是馬克思普朗克-智能系統研究所的所長,劉威楊是馬普所劍橋大學聯合項目的研究員。

論文地址:https://arxiv.org/abs/2406.04344

圖 1:VML 的訓練算法。

圖 2:VML 中模型和優化器的自然語言模版樣例。

圖 3: VML 在多項式迴歸任務中的訓練過程記錄。

非線性二維平面分類

仔細觀察第五十步後的模型參數,我們可以看到加了歸納偏置的模型描述中包含了很多與肺炎相關的醫學詞彙,比如「感染」、「發炎」;而沒有加歸納偏置的模型描述中只有對肺部 X 光片的特徵描述,比如「透明度」、「對稱」。

同時,這些模型所學到的描述,都是可以被具備專業知識的醫生驗證的。這種可解釋和人工檢驗的機器學習模型在以安全爲重的醫療場景下十分有價值。

圖 5: VML 在 PneumoniaMNIST 圖片二分類上的訓練記錄。

結語

該文章介紹了一種基於大語言模型的機器學習新範式 Verbalized Machine Learning (VML; 言語化的機器學習),並在迴歸和分類任務上展示了 VML 的有效性和可解釋性的特點。