靠它讀懂文字前世今生 陸上線「漢字全息字典」涵蓋4種字符集
「漢字全息資源應用系統」日前正式上線,這是大陸國家語言文字工作委員會,基礎資源建設項目「通用漢字全息數據庫建設」的研究成果,由北京師範大學教授王立軍主持。他說,透過該系統,「用戶可搜索漢字字意、字音,甚至歷代辭書對該字的釋義,及其在一些常用古籍文獻中被使用的情況。」
▲漢字全息應用系統日前正式上線 。(圖/翻攝自央視網)
「漢字全息資源應用系統」由北京師範大學中國文字整理與規範研究中心、漢字研究與現代應用實驗室負責實施。王立軍說,這系統用意是在運用現代中文訊息處理技術,建構一個具有多維關聯關係、科學系統、校園實用的「漢字全息數據庫」,「從中小學基礎教育領域到漢字研究的專業人士,系統可以滿足不同人士的需要。」
綜合陸媒報導,本期上線的系統涵蓋4種字符集,其中常用字集3500字;通用規範字8105字;古籍印刷字16490字;全字符集81722字。另外還有辭書20種;古籍文獻60種;歷代字形圖415675個。其中包括大量的圖形信息資源和文本信息資源,分別來自古文字拓片、文字編、規範字表、編碼字符集、歷代辭書、經典文獻、中小學語文教材等,涵蓋了古今各個時期文字的形、音、義、用、碼五大方面的重要信息。
此外,系統還能夠顯示「常用古籍文獻中的句子」,選取歷代具有代表性的辭書,並選擇最優的版本作爲搭建框架的基礎素材,包括《爾雅》、《說文》、《康熙字典》、《新華字典》、《通用規範漢字字典》等,搜索時會顯示歷代辭書的釋義。在每個字的「用例」一欄,系統也會自動選取具有代表性的傳世文獻作爲古籍用例的來源,包括「十三經」、「二十五史」、「二十二子」等三大典籍系統,顯示漢字在這些文獻中的使用例句,供研究者參考使用。