你只需往電腦上傳一張甲骨圖片,AI(人工智能)即可完成文字識(shí)別、釋義查詢(xún)、文獻(xiàn)溯源——最懂甲骨文的AI來(lái)了!近日,廈門(mén)大學(xué)與騰訊公司、安陽(yáng)師范學(xué)院聯(lián)合研發(fā)的全球首個(gè)甲骨文智能體“殷契行止”正式上線(xiàn)。
廈門(mén)大學(xué)人工智能研究院甲骨文研究團(tuán)隊(duì)的負(fù)責(zé)人金泰松說(shuō),這是三方三年潛心研究的一個(gè)“合集”——一直以來(lái),甲骨文研究一直面臨“識(shí)別難、比對(duì)難、共享難”的挑戰(zhàn),“殷契行止”就是破解這些難題的智能體——AI用定制算法練就了讀懂古文的真功夫。
用大白話(huà)說(shuō),“殷契行止”使得AI首次具備了“理解古文字”的能力,最終讓每一片甲骨“讀得懂、找得到、用得上”。
目前,甲骨文智能體已面向?qū)<液凸娒赓M(fèi)開(kāi)放,人人都能上手體驗(yàn)。
不過(guò),金泰松說(shuō):“我們不是替代甲骨文研究專(zhuān)家,而是把專(zhuān)家從重復(fù)勞動(dòng)中解放出來(lái),讓他們把精力留給真正的破譯與思考。”
小程序“了不起的甲骨文”,展示甲骨文“其”的不同字形。(本組圖/小程序截圖)
能做什么
看圖識(shí)字
上傳圖片就能
精準(zhǔn)比對(duì)標(biāo)準(zhǔn)字庫(kù)
只需上傳一張含有甲骨文字的圖片,AI就能精準(zhǔn)比對(duì)甲骨文標(biāo)準(zhǔn)字庫(kù),看圖識(shí)別出它是哪個(gè)甲骨文字,還能進(jìn)一步檢索系統(tǒng)知識(shí)庫(kù)中有關(guān)該甲骨文字的相關(guān)資料,還會(huì)給出權(quán)威釋義和參考文獻(xiàn)。
識(shí)別出某個(gè)單字后,AI會(huì)自動(dòng)查找這個(gè)字在哪些甲骨和拓片中出現(xiàn)過(guò),快速定位相關(guān)資料。
針對(duì)某個(gè)單字,快速匯聚與之相關(guān)的學(xué)術(shù)研究成果、各家釋讀觀點(diǎn)和演變歷史,省下大量翻找資料的時(shí)間。
甲骨文“馬”字
全自動(dòng)甲骨校重
以圖搜圖
10分鐘完成數(shù)年的工作
這個(gè)智能體還有拓片重見(jiàn)檢索功能:相當(dāng)于“甲骨文版以圖搜圖”。上傳一張拓片照片,AI能快速比對(duì)海量數(shù)據(jù)庫(kù),找出同一片甲骨的不同拓片版本或有相似字形的其他甲骨,幫助研究者發(fā)現(xiàn)重復(fù)收錄的文獻(xiàn)或追蹤甲骨流傳軌跡。
甲骨拓本圖像是研究甲骨文的基礎(chǔ)。所謂“拓本”,核心是把龜甲、獸骨上的文字,用宣紙和墨“印”下來(lái)的成品,就是給甲骨上的字拍了張“黑白高清照”。從甲骨文首次發(fā)現(xiàn)至今,因?yàn)槭詹亍⒘鬓D(zhuǎn),大部分甲骨都留下了多個(gè)版本的拓本,這些拓本被稱(chēng)為重片,梳理重片的工作被稱(chēng)為校重。
可想而知,甲骨的拓本數(shù)量遠(yuǎn)遠(yuǎn)大于甲骨的數(shù)量,需要對(duì)這些重片進(jìn)行系統(tǒng)整理,才能理清這筆“糊涂賬”。因此,拓片校重是甲骨學(xué)一項(xiàng)重要的基礎(chǔ)性整理工作,耗費(fèi)了甲骨文研究學(xué)者大量時(shí)間。
團(tuán)隊(duì)開(kāi)發(fā)的拓片校重和重見(jiàn)檢索系統(tǒng)有效解決了一字多版難題,讓AI學(xué)會(huì)“找字”,實(shí)現(xiàn)了全自動(dòng)甲骨校重。原本需要專(zhuān)家耗時(shí)數(shù)年的比對(duì)工作,現(xiàn)在僅需10分鐘即可完成。
拓本轉(zhuǎn)化為摹本
不必借助臨摹
就能看清筆畫(huà)細(xì)節(jié)
此外,運(yùn)用AI還可以將甲骨拓本(類(lèi)似碑文拓印的黑白圖片),轉(zhuǎn)化為甲骨文摹本(白底黑字的臨摹圖),方便研究者看清筆畫(huà)細(xì)節(jié)。
在此之前,甲骨文摹本需要甲骨文研究者用筆一筆筆臨摹,需要研究人員對(duì)甲骨文有較深的理解,并且非常費(fèi)時(shí)費(fèi)力。
甲骨文摹本
甲骨拓本
怎么用
小程序免費(fèi)開(kāi)放
可以跟AI直接對(duì)話(huà)
更酷的是,“殷契行止”使得甲骨文走向大眾——目前,這個(gè)甲骨文智能體已面向?qū)<液凸娒赓M(fèi)開(kāi)放,人人都能上手體驗(yàn)。
簡(jiǎn)單來(lái)講,無(wú)論你是深耕古文字的研究者,還是初識(shí)甲骨文的愛(ài)好者,都能借助它與3000年前的文字對(duì)話(huà)。
如果你是甲骨文研究者,可以在PC端登錄“甲骨文AI協(xié)同平臺(tái)”,使用AI研究工具智能識(shí)別、比對(duì)與檢索甲骨文,顯著提升研究效率。比如,上傳圖片后,你可以直接提問(wèn)單字的釋義,還可以問(wèn)“這個(gè)字在哪里出現(xiàn)過(guò)?”AI會(huì)自動(dòng)比對(duì),快速找出包含該字的全部拓片和摹本。
如果你是古文字愛(ài)好者,只需打開(kāi)微信小程序“了不起的甲骨文”,就能和智能體對(duì)話(huà)。
例如,你可以問(wèn)它:“家”字的甲骨文長(zhǎng)什么樣?它不僅會(huì)展示字形,還會(huì)告訴你,這個(gè)字里藏著殷商時(shí)代的“居住”特點(diǎn)。
甲骨文“門(mén)”字
跟著“甲骨舞者”
學(xué)跳甲骨文體操
在“了不起的甲骨文”,人們還可以體驗(yàn)甲骨識(shí)讀樂(lè)趣,獲取古文字知識(shí)。
這個(gè)小程序還能讓甲骨文翩翩起舞,金泰松介紹,安陽(yáng)師范學(xué)院甲骨文信息處理教育部重點(diǎn)實(shí)驗(yàn)室牽頭,聯(lián)合音樂(lè)學(xué)院、體育學(xué)院等編創(chuàng)了一套“廣播體操”,手機(jī)上輕輕一點(diǎn),“甲骨舞者”就翩翩起舞,時(shí)而展示側(cè)身而立的“人”字,時(shí)而表演張開(kāi)雙臂的“舞”字。
金泰松說(shuō),這位“甲骨舞者”是真人,這套甲骨文“廣播體操”是為了幫助大家更好地理解和傳播甲骨文。
此外,團(tuán)隊(duì)還打造了一系列甲骨文主題游戲,讓普通人也能在有趣互動(dòng)中,感受古文字的千年底蘊(yùn)。
如何研發(fā)
三方合作
引入甲骨文針對(duì)性算法
金泰松說(shuō),隨著DeepSeek(深度求索,一種AI助手)等通用大模型的涌現(xiàn),我們意識(shí)到,AI確實(shí)能為甲骨文研究帶來(lái)實(shí)質(zhì)性的效率變革。基于這一認(rèn)識(shí),團(tuán)隊(duì)開(kāi)始研發(fā)面向甲骨文識(shí)別的專(zhuān)用智能體。
什么叫智能體?金泰松列舉一個(gè)例子,我們問(wèn)DeepSeek:到北京的機(jī)票多少?它會(huì)告訴你價(jià)格,你還得自己去找App(應(yīng)用程序)完成訂票等工作;智能體卻可以幫助你做其他的事情——你告訴特定的智能體:我要去北京,它會(huì)去查詢(xún)相關(guān)的網(wǎng)站,調(diào)出支付的App等。表現(xiàn)在甲骨文智能體上,你上傳一個(gè)甲骨單字,它可以自動(dòng)去找這個(gè)字出現(xiàn)在哪片甲骨上,給出專(zhuān)家研究的文獻(xiàn)等。
金泰松強(qiáng)調(diào)說(shuō),甲骨文智能體不是突然出現(xiàn)的,三年來(lái),團(tuán)隊(duì)以AI+多模態(tài)甲骨文數(shù)據(jù)集融合為基礎(chǔ),研發(fā)出多項(xiàng)關(guān)鍵技術(shù),包括甲骨字形檢測(cè)與分類(lèi)算法、AI摹本生成與字形匹配技術(shù)、甲骨校重與結(jié)構(gòu)化比對(duì)算法,以及融合圖像、文字與語(yǔ)義的多模態(tài)推理能力。
也就是說(shuō),現(xiàn)在相當(dāng)于引入這些針對(duì)性的算法,用智能體技術(shù)把這些成果整合在“殷契行止”。
金泰松特別介紹三方合作的起源——2022年,在廈門(mén)大學(xué)紀(jì)榮嶸教授牽線(xiàn)下,廈門(mén)大學(xué)多媒體可信感知與高效計(jì)算教育部重點(diǎn)實(shí)驗(yàn)室、安陽(yáng)師范學(xué)院甲骨文信息處理教育重點(diǎn)實(shí)驗(yàn)室與騰訊公司聯(lián)合組建了跨機(jī)構(gòu)研究團(tuán)隊(duì)。作為實(shí)驗(yàn)室主任,紀(jì)榮嶸在研究方向、技術(shù)路線(xiàn)優(yōu)化、核心技術(shù)難題的攻堅(jiān)突破中發(fā)揮關(guān)鍵作用。
金泰松是計(jì)算機(jī)專(zhuān)家,甲骨文智能化的研究與他參與研發(fā)的其他類(lèi)型項(xiàng)目的感受是不一樣的,他說(shuō),有時(shí)你會(huì)覺(jué)得,我們是在進(jìn)行3000年文明的一場(chǎng)接力。
教AI認(rèn)字
精準(zhǔn)檢測(cè)143萬(wàn)個(gè)字形
很多人疑惑的是,人工智能是如何認(rèn)識(shí)甲骨文的?難道不是要建立在“投喂”的基礎(chǔ)上?
金泰松解釋?zhuān)拇_,項(xiàng)目的起點(diǎn)是最基礎(chǔ)的字形識(shí)別。面對(duì)模糊不清的拓片,常規(guī)圖像檢測(cè)方法幾乎失效。“拓片噪聲干擾嚴(yán)重,筆畫(huà)斷裂,以‘庚’為例,同一個(gè)‘庚’字在不同時(shí)期形態(tài)各異,有的像鈴鐺,有的像勞動(dòng)工具,有的因?yàn)榭毯厶珳\幾乎難以辨認(rèn)。”金泰松說(shuō),“這給視覺(jué)算法帶來(lái)了巨大挑戰(zhàn)。”
AI首先學(xué)會(huì)了“認(rèn)字”,從模糊的拓片中提取清晰字形。就像教孩子識(shí)字一樣,團(tuán)隊(duì)給AI展示了上千個(gè)“庚”字的拓片,告訴它:這些都是“庚”,雖然長(zhǎng)得不太一樣,但都是同一個(gè)字。經(jīng)過(guò)數(shù)百次迭代,AI便學(xué)會(huì)了從模糊的拓片中精準(zhǔn)識(shí)別出各種形態(tài)的“庚”字。
團(tuán)隊(duì)一步一步從底層圖像處理做起,通過(guò)多尺度圖像增強(qiáng)、去噪、去模糊等技術(shù),處理破損的甲骨片,再不厭其煩地“教”AI“認(rèn)字”,最終實(shí)現(xiàn)對(duì)143萬(wàn)個(gè)字形的精準(zhǔn)檢測(cè),準(zhǔn)確率超過(guò)90%。
讓流失海外的甲骨
在數(shù)字世界回歸
“殷契行止”背后還有“數(shù)字甲骨共創(chuàng)計(jì)劃”,目前,它已完成1525片甲骨的數(shù)字化采集工作,其中以數(shù)字化形式“回歸”的流失海外的甲骨達(dá)950片。
也就是說(shuō),用AI讓幾千歲的甲骨文在數(shù)字世界里“團(tuán)圓”。
這里有個(gè)背景,出土的甲骨不僅在中國(guó),還分布在世界16個(gè)國(guó)家和地區(qū)。過(guò)去幾年,“數(shù)字甲骨共創(chuàng)計(jì)劃”的研究者分赴各地,憑借一盞燈和一臺(tái)相機(jī)工作,現(xiàn)在,這些散落在海外的甲骨片都以數(shù)字形式回歸到祖國(guó)。
據(jù)介紹,通過(guò)“數(shù)字甲骨共創(chuàng)計(jì)劃”,研究團(tuán)隊(duì)已構(gòu)建起全球規(guī)模最大的甲骨文多模態(tài)數(shù)據(jù)集,包含143萬(wàn)個(gè)甲骨文字形數(shù)據(jù)、1.5萬(wàn)片甲骨多模態(tài)數(shù)據(jù)、3000篇研究文獻(xiàn)等。
2024年世界人工智能大會(huì)上,AI+多模態(tài)甲骨文數(shù)據(jù)集首次發(fā)布,供研究人員和公眾免費(fèi)使用。
責(zé)任編輯:陳錦娜
- 甲骨文和Uber宣布展開(kāi)為期七年的戰(zhàn)略性云合作2023-02-14
- 吸引人才有新招 漳州高新區(qū)甲骨文人才驛站揭牌成立2019-05-25
- 甲骨文中國(guó)裁員怎么回事?甲骨文員工為何不滿(mǎn)賠償?2019-05-09
- 甲骨文不滿(mǎn)賠償什么情況?甲骨文回應(yīng)裁員說(shuō)了什么?2019-05-08
- 甲骨文中國(guó)裁員怎么回事?甲骨文為什么要裁員裁多少人2019-05-07
- 甲骨文書(shū)法精品今起“登鷺”展出 展覽將持續(xù)至12月2日2018-11-22
- “甲骨文學(xué)堂”進(jìn)校園 讓孩子感受中華文化魅力2018-05-09
- 90后女孩用表情包圖說(shuō)甲骨文:這種方式大眾能了解考古2018-04-02
- 首師大教授和團(tuán)隊(duì)歷時(shí)7年潛心編纂《甲骨文大系》2018-03-29
- 認(rèn)識(shí)一個(gè)字,獎(jiǎng)勵(lì)10萬(wàn)元!安陽(yáng)甲骨文藏著隱秘歷史2017-07-24
- 最新廈門(mén)新聞 頻道推薦
- 進(jìn)入圖片頻道最新圖文
- 進(jìn)入視頻頻道最新視頻
- 一周熱點(diǎn)新聞


已有0人發(fā)表了評(píng)論