2024年AI編程有多強?谷歌工程主管揭秘殘酷真相
文章轉載於新智元
2024年,AI編程已然滲透了各行各業,影響着軟件的整個生命週期。
那麼問題來了,AI coding用過都說好,但我們平時用的軟件咋感覺沒啥進步呢?
近日,Addy Osmani,谷歌的工程主管,同時也是一位亞馬遜暢銷書作家,爲我們揭示了AI輔助編碼在一線開發中的真實情況。
1
碼農怎麼用AI?
一般來說,團隊利用AI進行開發有兩種不同的模式:「引導程序(bootstrappers)」 和 「迭代器(iterators)」。兩者都在幫助工程師(甚至是非技術用戶)縮小從想法到執行的差距。
Bootstrappers
這一類包括Bolt, v0, 和screenshot-to-code等AI工具,其特點爲:
這樣的工作流令人印象深刻。比如一位獨立開發人員可以使用Bolt,在短時間內將Figma設計轉變爲有效的Web應用程序。儘管達不到生產級別的要求,但用來獲得初步的用戶反饋綽綽有餘。
Iterators
這一類主要負責日常開發工作流程,包括Cursor、Cline、Copilot和WindSurf等工具,效果沒有上面那麼浮誇,但更加實在,比如:
雖然這兩種方法都可以大大加快開發速度,但「天下沒有免費的午餐」。
「AI速度」的隱性成本
高級工程師使用Cursor或Copilot等AI工具,可以在幾分鐘內搭建整個功能的基架,並完成測試和文檔,就像變魔術一樣。
但仔細觀察就會發現,在參考AI建議的同時,資深工程師們還會:
換句話說,他們正在用多年積累的工程智慧,塑造和限制AI的輸出。AI負責加速代碼實現,但人類的專業知識確保代碼的可維護性。
而初級工程師就經常錯過這些關鍵步驟。他們更容易接受AI的輸出,從而導致所謂的「紙牌屋代碼(house of cards code)」——看起來很完整,但在現實世界的壓力下會崩潰。
知識悖論
所以實際上,相比於初學者,AI反而更能幫助有經驗的開發人員,——這多少有點反直覺。
高級工程師利用AI快速構建想法的原型(理解)、生成基本實現(可改進)、探索已知問題的替代方法等等;
而初學者卻經常接受不正確或過時的解決方案、忽略關鍵的安全性和性能問題、不知道如何調試AI生成的代碼,最終構建了一個自己不完全理解的脆弱系統。
1
70% problem
使用AI進行編碼的非工程師,經常遇到一個窘境:他們可以出人意料地迅速完成70%的工作,但最後的30%就相當痛苦了。
「70% problem」揭示了AI輔助開發的現狀,剛開始如有神助,後來被現實按在地上摩擦。
實際情況通常是:
這個循環對於非工程師來說尤其痛苦,因爲他們缺乏專業知識來理解真正出了什麼問題。
有經驗的開發人員遇到bug時,可以根據多年的模式識別來推理潛在原因和解決方案。如果沒有這個背景,那基本上就是在用自己不完全理解的代碼「打地鼠」。
學習悖論
還有一個更深層次的問題:讓非工程師使用AI編碼工具,實際上可能會阻礙學習。
代碼生成了、運行了,但「開發者」不瞭解基本原理,此時,他錯過了學習基本模式、沒有培養調試技能、無法對架構決策進行推理,而這份代碼又需要維護和擴展。
於是,「開發者」不斷返回AI來解決問題,而沒有培養自己處理問題的專業能力。
非工程師使用AI編碼工具的最好方式可能是「混合模式」:
但這需要耐心和奉獻精神,與許多人使用AI工具的目標恰恰相反。
「70% problem」表明,當前的AI還不是許多人希望的那個AI。最後30%的工作(使軟件可用於生產、可維護等),仍然需要真正的工程知識。
最佳實踐
Addy Osmani觀察了幾十個團隊,總結了一些最佳實踐方式:
「AI初稿」模式
「持續對話」模式
「信任但驗證」模式
1
AI的真正前景?
儘管存在這些挑戰,但作者對AI在軟件開發中的作用持樂觀態度。關鍵是要充分利用AI的真正優勢:
加速已知AI擅長幫助實現我們已經瞭解的模式,就像有一個無限耐心的結對程序員,他可以非常快速地打字。
探索可能性AI非常適合快速構建想法原型和探索不同的方法,就像一個沙箱,我們可以在其中快速測試概念。
自動化例程AI大大減少了花在樣板和日常編碼任務上的時間,讓我們可以專注於有趣的問題。
如果您剛剛開始AI輔助開發,作者的建議是,先從小處着手。
將AI用於非耦合的、定義明確的任務,查看生成的每一行代碼,逐漸構建更大的功能。
過程中保持模塊化:將所有內容分解爲小的重點文件,在組件之間保持清晰的接口,記錄模塊的邊界。
重要的一點是,相信自己的經驗:AI用來加速而不能取代你的判斷、感覺不對勁時要質疑、時刻維護自己的工程標準。
Agent興起
隨着我們進入2025年,AI輔助開發的格局正在發生巨大變化。雖然當前的工具已經改變了原型設計和迭代方式,但我們正處於更重要轉型的風口浪尖:智能體(Agent)軟件工程的興起。
智能體系統不僅可以響應提示,還將以越來越高的自主性規劃、執行和迭代解決方案。
比如Anthropic的Claude能夠使用計算機,或者Cline自動啓動瀏覽器和運行測試的能力。
在調試過程中,智能體系統不僅給出修復bug的建議,還可以:
主動識別潛在問題、啓動和運行測試套件、檢查UI元素並捕獲屏幕截圖、提出並實施修復、驗證解決方案是否有效。
下一代工具將可以無縫集成視覺理解(UI 屏幕截圖、模型、圖表)、口頭語言對話和環境交互(瀏覽器、終端、API)。
未來的AI不是取代開發人員,而是成爲一個越來越有能力的協作者,既可以採取主動,又能尊重人類的指導和專業知識。
參考資料:
https://addyo.substack.com/p/the-70-problem-hard-truths-about