清華AI模型登Nature子刊:玩轉城市空間規劃,快人類3000倍

如今,在城市空間規劃領域,人類設計師也有了 AI 夥伴。

來自清華大學的研究團隊提出了一個深度強化學習算法的模型。基於15分鐘城市概念,該模型可以進行復雜的城市空間規劃。結合人工輸入,機器學習輔助土地和道路空間規劃的表現超越了其他算法和專業人類設計師,在所有考慮的指標方面均提高50% 左右,且速度快了3000倍。

相關研究論文以“Spatial planning of urban communities via deep reinforcement learning”爲題,剛剛發表在最新一期的 Nature 子刊 Nature Computational Science 上。

在一篇同期發的新聞與觀點文章中,MIT 可感知城市實驗室(MIT Senseable City Lab)的研究科學家 Paolo Santi 寫道:“Yu Zheng 等人處理了關鍵的概念性和計算性挑戰,同時還成功展示了將 AI 與人類工作流程融合於空間佈局規劃領域的可行性,爲未來提供了豐富的研究方向。

城市已經成爲創新、創意和機遇的中心,它吸引着來自各行各業的人們,他們在這裡尋求娛樂、教育、醫療和就業的機會。有效空間規劃對於城市的經濟活動和可持續發展至關重要。

現代城市規劃往往以車輛爲導向,偏向於集中式功能和依賴汽車的交通方式,這樣的方式不僅會造成交通擁堵,還會加劇全球氣候變暖。同時,新冠疫情也暴露出城市在封鎖期間的脆弱性。因此,城市規劃亟待轉變,需要加快從以車輛爲導向轉向以人爲導向。

值得注意的是,“15分鐘城市”概念在規劃新的城市社區和翻新現有社區方面越來越受歡迎,居民可以在15分鐘內步行或騎行到基本服務設施,這也體現了人們對於城市社區內高空間效率佈局的期待。

然而,人類已經投入了幾十年的努力來開發計算模型和支持工具,以使城市規劃自動化。現在,儘管人類城市規劃師使用地理信息系統工具的生產力比幾十年前高了幾個數量級,但繁瑣的佈局任務仍然需要手動完成。

爲了應對上述挑戰,清華大學的研究團隊提出了基於深度強化學習的城市規劃模型,該模型能夠生成城市社區的土地利用和道路佈局。

然而,與芯片設計和圍棋等具有規則網格條件的任務相比,城市社區存在不同形式的幾何形狀,更具多樣性和不規則性。

爲解決該問題,研究團隊提出了一個城市連續性圖,用於描述城市幾何的拓撲結構,其中城市地理元素作爲節點,空間連續性作爲邊。圖的構建允許捕捉任何形式社區的基本空間關係。因此,他們將空間規劃制定爲圖上的順序決策問題,並在拓撲層面上進行規劃,而不是在幾何層面上。

另外,空間規劃的另一個主要挑戰是巨大的解決方案空間和更大的伴隨動作空間。一箇中等規模社區的動作空間可能很容易超過4000的一百次方(每個步驟有4000種可能動作,共100個步驟用於社區空間規劃),這使得窮舉搜索不可行。

爲了減小動作空間,研究人員訓練了一個 AI 代理,該代理由一個價值網絡和兩個策略網絡組成,通過在巨大的動作空間中進行高效的探索和利用來尋找良好的規劃策略。具體而言,價值網絡基於“15分鐘城市”概念的實現情況來預測空間規劃的質量,另外兩個策略網絡用於 AI 代理選擇土地利用和道路的位置。通過從策略網絡中採樣動作並使用價值網絡估計獎勵,動作空間得到了大幅縮小。

爲了獲得城市地理元素的有效表示,研究人員又進一步開發了基於圖神經網絡(GNN)的狀態編碼器,它利用城市連續性圖上的消息傳遞和鄰居聚合,捕捉土地、道路段和交匯點之間的空間關係。這個 GNN 狀態編碼器在價值網絡和策略網絡之間共享,從而促進獎勵預測和位置選擇。最終,相比於人類專家,AI 代理能夠生成更高效的規劃方案。

廣泛的實驗結果表明,在相同的初始條件和規劃約束下,該方法明顯優於最先進的算法和人類專家,可以將空間效率的客觀指標提高48.6% 以上。特別是在使用現有的真實社區作爲初始條件時,該模型可以生成土地利用改造計劃,將居民對各種設施的可訪問性顯著提高18.5% 以上。

考慮到城市規劃方法的成熟性和複雜性,基於所呈現的 DRL 模型,研究人員提出了一個 AI 與人類設計師協作的工作流程,其中人類設計師專注於概念原型設計,並利用該模型完成繁重和耗時的規劃工作。

結果證明,人類設計師可以從 AI 與人類協作的工作流程中受益,該工作流程在客觀規劃指標和由100名專業人類設計師組成的主觀盲測試中均優於完全由人類勞動完成的工作流程,並在時間效率上提高3000倍。

此外,該模型還可以從簡單的場景中學習通用的規劃技能,並將其應用於設計不同風格的大規模複雜規劃任務中,例如綠色社區和服務社區。

然而,在本次實驗中,雖然生成的空間規劃數量超過100萬個,但與類似的 DRL 任務(如圍棋和芯片設計)中利用的數據集相比,仍然不夠大。另外,本次研究方法擴展到城市級別需要從分佈式集羣收集大量的訓練樣本,以及在多臺服務器上使用多個 GPU 訓練更大的神經網絡。

值得注意的是,分解的三個子空間(什麼要規劃、在哪裡規劃和如何規劃)可以由代理共同優化,但這需要更多的訓練樣本。此外,什麼要規劃的部分可以擴展到包括與城市可持續性相關的其他重要元素,如公共交通路線和車站。另外,該框架還忽視了空間規劃的一些主觀評估指標,如美學和藝術評分。

當前框架主要受靜態指標的引導,雖然可以生成具有高空間效率的社區規劃,但規劃整個城市是一項更加複雜的任務,需要考慮經濟增長和居民健康在內的多樣化目標。通過一些靜態指標來評估城市級別規劃的影響幾乎是不可能的。

在大多數實驗中,研究人員忽略了數百條城市規劃的規則,沒有考慮到實際城市規劃中的土地所有權、公共通道、城市隔離和翻新等關鍵問題。但是,通過必要和合理的調整,該方法可以很好地處理這些實際規劃中的規則和政治問題。

儘管研究還存在不足之處,但我們不能否認它的意義。

機器學習作爲支持性工具可以增加人類規劃師的生產力,也有可能創造出更加可持續發展的城市生活。另外,除了幫助規劃者加速空間佈局過程外,還可以爲其他參與者帶來更廣泛的好處。通過引入定製選項到模型中,可以構建公共平臺,促進居民和開發商參與規劃過程。

正如研究論文所提到的那樣,城市規劃絕不是一個簡單的選擇土地利用和道路位置的遊戲,而是多方利益相關者之間複雜的互動。本次研究提出的框架展示了所有參與者更高程度參與的可能性,是邁向更加透明和包容城市的一小步。