寫詩看圖就好不用走七步! 臺大學生做出AI「曹植」

記者莊友直臺北報導

大家想必都知道曹植「七步成詩」的典故,如今藉由人工智慧威能,不用走七步,或許「七秒」內就能做一首詩了!微軟在先前的 Academic Day 2017 主題演講中,來自臺灣大學資工研究所學生團隊,就成功作出讓 AI 「看圖作詩」的強大功夫

這項計劃是由在微軟亞洲研究院時期的臺灣大學資工研究所研究生吳肇中網路多媒體研究所畢業生文峰所計劃,並由臺灣大學徐宏民林守德教授和 MSRA 研究員宋睿華所指導。藉由人工智慧深度學習演算法技術,讓電腦能透過偵測不同的圖片,藉此分析內部物件,並做出一首四句的現代新詩

▼這項程式其實應用了 AI 中的深度學習,藉由廣納詩集圖像分析技術,讓程式能自行「看圖作詩」。(圖/記者莊友直攝)

現場展示時可透過電腦與手機 APP 的不同介面,可藉由傳送圖片、或現場拍照(手機)的方式讓 AI 辨識並開始做詩;但畢竟是沒有規律關係,同一張圖片在不同的辨識之下,也會有不一樣的詩句內容,可玩性其實還蠻大的。

▼不僅一般電腦可行,就連手機也有專屬 APP 可用。(圖/記者莊友直攝)

▼由於辨認技術的關係,同一張圖片在多次偵測後,寫出來的詩也不一樣,這點跟人類倒是蠻像的。(圖/記者莊友直攝)

被問到爲何不做古詩時,團隊指出其實這樣的技術早期就有了,而且現代新詩不像古詩有着平仄等規律變化,在實作上反而難度更高。這項程式也收集了高達 519 位詩人作品,將比較常出現的詞語歸納化。除了在中國大陸出了詩集外,近期更獲微軟旗下的人工智慧機器人小冰」團隊關注,先前還曾開放限時體驗;但目前已經停止了。

▼先前這項服務也登上了微軟智慧機器人「小冰」,但目前已經下架。(圖/記者莊友直攝)

另外,同場也有另一項利用影像辨識即時分析物體的 AI 應用「Seeing Bot」,藉由像是 Webcam 等影像辨識裝置,程式在感知接收到的畫面後,就會精準描述場景內容;但實際測試之下誤差度還是算大,可能會把黑桌當成鋼琴,或是同樣場景出現不同辨識語句狀況,恐怕還有一段長路要走。

▲▼另外,同場也有偵測圖像並即時描述物件的 Seeing Bot 應用,可惜在複雜的場景中,準確度還有待加強。(圖/記者莊友直攝)