大數據揭示飲食中的“暗物質”

我在廚房櫥櫃中搜索“暗物質”,並在一包進口麪條中找到了它。包裝袋上註明了它有幾十種成分,其中許多是添加劑,但也有真正的食物——例如大豆、辣椒、芝麻、蘑菇、海藻、蝦等,還有我正在尋找的大蒜。

我並不是說大蒜就是暗物質或者它含有真正的暗物質。暗物質是一種無法直接觀察到的物質,物理學家認爲,它廣泛存在於宇宙中,約佔宇宙所有物質的85%。但大蒜確實包含了所謂的“暗物質”:大蒜中有成千上萬種化合物,它們有可能會影響到我們的健康,但到目前爲止,人們並未完全瞭解它們。

“營養暗物質”一詞是哈佛醫學院的艾伯特-拉斯洛·巴拉巴西提出的。他認爲,人們對飲食如何影響健康的理解僅限於150種主要營養成分,但是這些營養成分只佔我們食物中的一小部分。所以,通過研究這些“暗物質”,可以幫助我們重新認識我們所吃的食物,以及瞭解它們對我們健康的影響。

飲食中大量不爲人知的“暗物質”

我們知道,食物是由各種各樣的化學物質組成的混合物。即使是我們熟知的“大量營養素”——蛋白質、碳水化合物和脂肪也千差萬別,它還含有“微量營養素”——礦物質、維生素和其它生化物質,它們僅以微量存在,但仍會對健康產生深遠的影響。

關於食物的這些成分,美國有個由農業部負責維護的營養數據庫(簡稱USDA),其中包含了成千上萬種食物的組成信息,分爲188種不同的營養成分。當你搜索“大蒜”,該數據庫會提供58055種包含該物質的食物——從生大蒜到加工的食品。生大蒜的條目會列出67種大量或微量的營養素,有的甚至還量化爲每100克含量是多少,等等。這看起來可能很詳細,但似乎還不夠全面。例如,它忽略了大蒜中的某些成分,如蒜氨酸。

這是USDA數據庫中普遍存在的一個問題,即它僅跟蹤記錄許多食物中常見的營養成分,因此忽略了那些罕見的部分。USDA從2003年開始填補這一空白,但到目前爲止,也僅是在原有的150種成分中添加了38種類黃酮(一種與心血管疾病風險相關的植物化合物)。

大約10年前,一個國際研究團隊決定編譯一個更全面的數據庫。一開始,由於他們對普通食物中微量營養素的瞭解很少,所以只能追蹤記錄幾十種化合物。但是,他們通過檢索相關的文獻,進行自己的實驗室化學分析,不斷增加完善食物成分信息。最終,他們建立了一個名爲FooDB的龐大數據庫。

目前,該數據庫已擁有約7萬種營養化合物的信息,幾乎是USDA數據庫的400倍。例如,USDA數據庫在生蒜中列出了67種化合物,但FooDB有2306種。

照此看來,以USDA爲指導,食品中99.5%的成分都是個謎。甚至FooDB也還不完整,例如,在大蒜中列出的2306種化合物中,只有146種被定量,這意味着其它的2000多種化合物,含量還未知。這也是整個FooDB的不足——目前尚有約85%的營養成分尚無法被量化 。換句話說,關於我們所吃食物的組成,我們只窺探了其冰山一角。

也許有人開始產生這樣的想法了:難道目前關於食物的知識幾乎都是錯誤的?這個問題的答案我們暫且不去討論,但必須指出的是,因爲我們專注於大量營養素和卡路里,所以很多食物都被簡化了。

其實食物非常複雜——當它進入我們的腸道時,它會與那裡的微生物發生相互作用,從而變成其它化學物質,而這些物質對我們的身體會產生複雜的影響。因此,掌握食物中所含的所有化合物信息,將能對營養研究人員提供很多意想不到的幫助。

營養成分對人體的影響 複雜得超乎想象

現在很難確切地說所有這些化合物信息有什麼作用,它對健康的影響在很大程度上也是未知的。但是,我們有充分理由相信,食物中某些被忽略的化合物會產生積極的影響。

然而,在營養學界,這種看法並不是很受歡迎。反對者認爲,食物中大多數化合物都以微量存在(換句話說,即使存在所謂的營養暗物質,它的量也極少,起不到什麼作用)。但是,這是一個誤解。目前食物中營養素的濃度大約分爲9個等級,但濃度並不總是影響因素。例如每100克食物中維生素E的濃度僅爲微克,但我們知道,缺乏維生素E會對健康產生不利影響。所以,並不能說低濃度的化合物對健康沒有影響。

爲了證明確實存在“營養暗物質”且其對健康有重要影響,研究人員還求助於另一個數據庫——比較毒物基因組學數據庫,該數據庫存有成千上萬種化學物質與人體相互作用的結果。

他們研究了大蒜的67種“官方”成分(來自USDA數據庫),發現了其中37種與人類健康和疾病有關。又對FooDB中大蒜的2306種成分進行了同樣的處理,並發現了另外574種影響健康的化合物。他們認爲,食物的複雜性可能正是營養科學經常產生不同結論的原因。

想必我們都有過這樣的體驗:上一週聽“專家”說紅酒會對健康有害,這一週又聽“權威人士”說“不會”。類似的還有關於紅肉、雞蛋、飽和脂肪的說法等。沒有對食物營養成分的全面瞭解,我們就無法確定哪種說法是正確的。

關於個別微量營養素的說法也是如此。例如β-胡蘿蔔素,根據流行病學研究,它對心血管疾病能起到抑制作用,但研究也表明在飲食中添加β-胡蘿蔔素並沒有顯示出對健康有好處。

爲什麼呢?一個原因可能是β-胡蘿蔔素在植物中從來都不是單獨存在的,有約400個分子總是與它一起存在,生物學家檢測到的可能是其他分子對健康的影響。另一個原因可能是微生物對“營養暗物質”的影響。大多數“營養暗物質”是通過腸道細菌化學轉化而成的,由於我們無法控制腸道菌羣或先天代謝的變化,這就意味着不同的人會從食物中獲得不同劑量的代謝產物。這就是爲什麼研究不同食物的影響時,結果相對模糊的原因。

所有這些都表明了對食物的研究還很必要,且還有一段長路要走。

依賴計算機來分析營養“暗物質”

爲了更深入地研究飲食對健康的影響,可能需要尋找一些新的途徑。比如求助於正在興起的大數據和複雜網絡科學。必須指出的是,對“營養暗物質”進行研究的團隊都是生物化學家而不是營養學家,他們專門探究人類疾病的遺傳和起源。因爲基因數據只能解釋約5%~20%的疾病原因,而他們認爲可以從食物中找到其餘的原因,這纔對食物營養產生了興趣。

爲了測試這種方法是否可行,研究人員開發了一個文本搜索工具,以搜索科學文獻中有關食物成分的信息。他們先搜索了“大蒜”,找到了一些缺少的濃度數據。例如,它發現了一種二硫化物——另一個可能對健康有益的辛辣味道的分子。另外,它還發現了FooDB中甚至沒有列出的另外96種大蒜成分。緊接着,他們又對“可可”進行了搜索,結果發現了238種新的化合物。這表明了有很多信息已經存在,但尚未被記錄到數據庫中。

大蒜和可可只是人們食用的大約2000種天然成分中的兩種,爲了將研究擴展到包括牛奶、蘋果等在內的更多食品,他們又開發了一個名爲“FoodMine”的文本分析工具,其目標是涵蓋所有常見的主食,以便對飲食中的化學成分有更全面的瞭解。

這似乎還不夠複雜。還有一個複雜的問題,那就是烹飪會將化學成分(包括“營養暗物質”)轉化爲其它成分,這些成分有時會對健康產生影響。例如,糖和氨基酸在高溫下反應時,會產生新的分子,使燒烤食品變得美味,但這些反應還會產生丙烯酰胺,這可能是一種人類致癌物。

我們的新陳代謝也會對營養物質起作用,這增加了更多的複雜性。食物中的化合物通常會被口腔、胃和腸道中的各種酶進行化學轉化。結果是,許多“營養暗物質”被轉化爲各種更小、更奇怪的代謝物,然後再循環回到血液和其他組織中。這些經過轉化的“營養暗物質”對健康有着更大的影響。

此外,在食品加工過程中也會添加大量化學物質。這些物質在我們體內會發生什麼情況尚不得而知。

鑑別食物中的所有化合物已經是一項巨大的挑戰,而弄清楚它們與我們發生的生物反應則更是難上加難。最終,需要將所有的食物分子與它們在人體細胞中的影響聯繫起來。再一次,新的計算機技術扛起了這個重擔。例如,USDA的一個團隊正在開發一種系統,利用人工智能來預測我們吃完食物中的“營養暗物質”會發生什麼。作爲一個試水項目,這個人工智能系統在FooDB中尋找能夠與某種蛋白質發生作用的化合物時,它找到了10種。其中的兩種已知的,但是其他八種不是,包括芝麻中的芝麻素、利馬豆中一種黃酮,以及茶、藥草、香料中的化合物。

研究者們的最終目標是想建立一個營養素與人類健康之間相互作用的“全圖”——這是一項宏偉的工程,需要更多有關個人基因組、微生物組和其他因素的數據,但這也是我們真正瞭解人類營養和健康關係的唯一途徑。