【理響中國】AI如何解密甲骨文

(原標題:【理響中國】AI如何解密甲骨文)

甲骨文作爲中華民族寶貴的精神財富,不僅承載着深厚的文化底蘊,還蘊含着豐富的學術和史料價值。這一古老的文字,猶如穿越時空的信使,傳遞着先人的智慧與文明的信息。

作爲我國已知最早的成熟文字系統,甲骨文自1899年首次被發現以來,便引起了學術界的廣泛關注。歷經數代學者的不懈努力,甲骨文研究取得了豐碩的成果,爲我們揭示了古代社會的諸多秘密。然而,甲骨文研究的專業性極強,加之甲骨本身易損且分散保存於各地,使得這一領域的研究仍面臨諸多挑戰。

近年來,隨着人工智能技術的飛速進步,人們開始探索將AI應用於甲骨文研究的新途徑。這一創新性的嘗試不僅爲甲骨文研究注入了新的活力,也引發了學界的廣泛討論和期待。在數字化和智能化的浪潮中,甲骨文研究究竟取得了哪些實質性的進展?人工智能能否憑藉其強大的計算能力,成功破解甲骨文的千古之謎?其背後的核心優勢又是什麼?爲深入瞭解這些問題,記者採訪了中國社會科學院學部委員、甲骨學家宋鎮豪,請他帶我們走進“數字化時代”的甲骨文。

創新:用高質量數據庫投喂AI

歷經三千餘載歲月洗禮的甲骨文,無時無刻不在與風化、蟲蠹、破壞等自然力量抗爭。在以往的甲骨文研究中,學者們主要依賴於拓片研究與書面著錄。然而,這一傳統方式往往受限於甲骨文字的模糊和信息的碎片化,難以形成統一且全面的認知。如今,隨着數字技術的飛躍式發展,我們擁有了前所未有的工具——上億像素的相機、微距拍攝技術、三維建模、紅外線拍攝以及多光譜拍攝等。這些高科技手段共同織就了一張細密的網,全方位、多角度地捕捉並呈現了甲骨的真實面貌。尤爲值得一提的是,微痕增強技術的引入更爲甲骨文的解析工作開闢了新天地。即便是在肉眼難以辨識的細微之處,這項技術也能讓研究者清晰地看到甲骨上那些淺淺的刻痕,進而更爲精準地分析筆畫走向與字形輪廓。此外,光譜分析技術的運用,使我們得以窺見那些被丹砂“塗朱”或被炭黑“填墨”的甲骨文背後所隱藏的特殊含義,爲解開古老文明的密碼提供了寶貴的線索。

經過長達125年的不懈努力,甲骨文研究已從最初的辨析階段邁上了認知發展的新臺階。宋鎮豪指出,儘管目前甲骨文已知的單字數量已逾4200個,但能夠確切釋讀的卻僅佔總數的1/3左右。這意味着,仍有大量的甲骨文字等待着我們去董理、去解讀。同時,他也強調,甲骨文研究不應侷限於單個文字的識別,而應更加註重其中所蘊含的人文精神與思想內涵。宋鎮豪表示,甲骨文作爲殷商時期的重要文化遺產,不僅記錄了祭祀、戰爭、占卜、記事等日常活動,還生動再現了當時社會的經濟、政治、文化等各個方面。它如同一部生動的歷史畫卷,爲我們揭開了古老殷商王朝的神秘面紗。如今,藉助人工智能與大數據的力量,我們可以對這些珍貴的史料進行深度挖掘與關聯分析,從而更加全面、深入地理解那段遙遠而輝煌的歷史。

對於人工智能在甲骨文研究中的應用前景,宋鎮豪充滿了期待。他認爲,學習型人工智能的關鍵在於爲其提供充足且高質量的“教材”。在這些“教材”的滋養下,人工智能將承擔更多的研究任務,如甲骨文字形識別、拓影甲骨字的提取與檢測、甲骨文的組類區分、甲骨片的查重收斂、甲骨片的智能綴合以及甲骨文例的釋讀解析等。譬如在甲骨綴合領域,人工智能技術展現出了巨大的潛力。面對那些因年代久遠而破碎不堪的甲骨碎片,人工智能能夠憑藉其強大的數據處理能力與算法優勢,實現碎片的自動綴合與拼接。這不僅極大地減輕了研究者的工作負擔,更爲甲骨文的完整復原與深入研究提供了有力支持。此外,人工智能還能夠在研究成果的集成與校驗方面發揮重要作用。通過對已有研究成果的重新審視與校驗,人工智能能夠及時發現並糾正其中的錯誤與遺漏,確保甲骨文研究的準確性與可靠性。

突破:甲骨文大數據平臺不斷完善

2019年,值甲骨文發現120週年之際,中國社會科學院甲骨學殷商史研究中心與安陽師範學院教育部暨河南省甲骨文信息處理重點實驗室攜手共創的甲骨文大數據平臺——“殷契文淵”(http://jgw.aynu.edu.cn/)向全球免費開放。

登錄“殷契文淵”官方網站,一幅幅古樸典雅的甲骨文與深邃的暗黑背景交相輝映,營造出一種穿越時空的神秘氛圍,同時又不失現代科技的未來感。該平臺集成了甲骨著錄庫、甲骨字形庫、甲骨文獻庫以及甲骨文知識服務平臺等多個功能模塊,爲用戶提供了全方位、多層次的甲骨文信息查詢與研究體驗。

截至目前,“殷契文淵”已收錄甲骨著錄多達154種,甲骨圖像更是達到了驚人的239902幅,甲骨論著亦有34418種之豐。記者嘗試在字形庫中輸入“文”字,便迅速檢索到與之相關的甲骨單字詳情,進而通過片號查詢包含該字形的甲骨片及其釋讀信息,真切體會到這一大數據平臺給學者與甲骨愛好者的研究工作帶來的極大便利。

“‘殷契文淵’已步入第五期建設新階段,並建設了‘殷契文淵AI協同研究平臺’。”宋鎮豪表示,未來,該平臺將致力於全球範圍內甲骨文大數據的精細採集,並在AI大模型的輔助下實現智能化深度集散與知識體系的育成,爲甲骨文研究開闢更加廣闊的空間。

回顧歷史,20世紀在郭沫若、胡厚宣等學術巨擘的引領下,《甲骨文合集》歷經二十六載春秋,精選傳世甲骨41956片,編撰成書,成爲甲骨學領域的扛鼎之作。隨後,《甲骨文合集補編》又增補了13450片甲骨,進一步豐富了甲骨文的資料庫。然而,據統計,目前全球範圍內已知的甲骨數量已逾16萬片,仍有大量珍貴甲骨散落各處,甚至沉睡於庫房之中,亟待發掘與整理。宋鎮豪說,依靠我們目前手中有限的甲骨文資料,想要揭開中國古史的奧秘,還遠遠不夠。

除了甲骨全面整理著錄這一制約性問題,甲骨釋讀的難度更大。甲骨文等古文字的考釋工作,恰似一個錯綜複雜的解謎與破案過程,要求研究者們在浩瀚的已知信息中抽絲剝繭,尋找關鍵證據,以推求未知的真相。這一過程不僅考驗着研究者的專業知識與技能,更對其跨學科的綜合素養提出了很高的要求。甲骨文研究領域的知識門檻相對較高,需要研究者精通古文字學,並具備歷史、考古、天文、地理、文獻、語法等多方面的知識儲備。

面對這一挑戰,我國政府相關部門積極作爲,推動全國多所高校研究團隊投身於人工智能輔助甲骨文研究的探索之中。在互聯網科技公司的鼎力支持下,甲骨文數據集得以不斷完善與擴充,爲AI技術的深度應用提供了堅實基礎。“我始終堅信,建立高質量的甲骨文數據庫纔是長遠之計。”宋鎮豪強調,我們亟須通過第一手資料的彙總與整理,構建一個權威、核心且可持續發展的平臺。我們在此基礎上進行科學分析與研究,以期解決一些重大問題,推動對中華文明歷史進程的深入瞭解與闡釋。

心願:讓數字化助力甲骨文“回家”

近日,散落在韓國的7片甲骨實物高保真數據首次以數字化形式“迴歸”安陽。這標誌着甲骨文正式開啓了數字化“歸鄉”之路。

一片甲骨驚天下。甲骨文以其獨特的魅力展現了中華民族的偉大智慧和創造。安陽殷墟是甲骨文的主要出土地,安陽小屯出土的近16萬片甲骨文物分散收藏於全球近200家機構中。宋鎮豪一直有一個心願:讓甲骨文“回家”。然而,甲骨文以“物理形式”迴歸殷墟幾無可能,隨着互聯網平臺的發展,數字化迴歸成爲最佳選擇。

以宋鎮豪爲牽頭人,騰訊公司、中國先秦史學會、安陽師範學院等機構發起的“全球甲骨數字迴歸計劃”,以“殷契文淵”爲基盤,逐步形成了甲骨採集、建模、存儲、展示、共享的標準規範和數字工具箱,初步實現了甲骨文數字化工程的試點建模。據瞭解,這項工程最大程度地保存了甲骨及其承載文字的原始面貌,有助於實現永續保存、傳播與傳承的目標。以三維建模、微痕增強、人工智能等技術爲基礎的“甲骨文全信息模型”突破了傳統研究對拓片、摹本、照片的依賴,不僅能看清甲骨文字,還能看到筆畫疊壓、朱書墨書、塗改刮削等其他原來看不清的相關信息,爲甲骨文研究,特別是查重及綴合研究帶來了革命性變革,有力推動了甲骨文以數字化形式迴歸殷墟。團隊還與加拿大英屬哥倫比亞大學、美國芝加哥大學、英國杜倫大學等知名高校及研究機構初步達成合作意向,共同推動此項工程的順利進行。

宋鎮豪表示,甲骨文數字技術的突破形成了新質生產力,計算機的學習功能遠遠高於人類。下一步,應在整體整理材料的基礎上,通過文獻的碎片化標註,全面增強大模型的甲骨學知識和能力。要不斷創新,加大人工智能與甲骨文複合型人才的培養,使人工智能工具助力甲骨文相關各類工作提質增效。

宋鎮豪談到,人工智能爲甲骨文開發了更廣闊的天地和更多的應用場景,讓甲骨文能夠得到永續保存與傳承。他堅信,未來,隨着大數據、雲平臺、人工智能等新技術在甲骨文研究領域的推廣和應用,有望加快甲骨文探析進程,解決長期困擾學界的疑難問題,甲骨文研究必將取得令人震撼的成果。