谷歌AI古籍破譯新突破:錯誤率低至0.56%,媲美人類專家
IT之家11月16日消息,科技媒體golem于11月15日發(fā)布博文,報道稱谷歌通過其AI Studio平臺,正在測試一款尚未命名的AI模型,該模型在破譯難以辨認(rèn)的歷史手稿方面已接近人類專家的水平。
IT之家援引博文介紹,歷史學(xué)家Mark Humphries使用一套專門開發(fā)的基準(zhǔn)數(shù)據(jù)集,對該模型的性能進(jìn)行了系統(tǒng)性測試。結(jié)果顯示,在處理五份高難度歷史手稿時,該模型的整體字符錯誤率約為1.7%,且大部分錯誤是標(biāo)點符號和大小寫方面的,而非單詞本身。

Humphries的評估還指出,如果排除模糊的標(biāo)點符號和大小寫錯誤,該AI模型的字符錯誤率會大幅降至約0.56%,即每轉(zhuǎn)寫200個字符才出現(xiàn)一個錯誤。

根據(jù)新發(fā)現(xiàn)的未知Gemini型號轉(zhuǎn)錄的奧爾巴尼賬簿頁面
如此驚人的準(zhǔn)確度,使得該模型的性能足以與從事歷史文獻(xiàn)轉(zhuǎn)寫的專業(yè)人類工作者相媲美。此次測試的文檔包含了18至19世紀(jì)的多種手寫風(fēng)格,其中有不少字跡潦草、拼寫錯誤和語法不一致的復(fù)雜樣本,這進(jìn)一步體現(xiàn)了該模型的強大能力。
該模型最令人驚喜的是,它不只是能進(jìn)行簡單的文字轉(zhuǎn)寫,還展現(xiàn)出了復(fù)雜的推理能力。在處理一份18世紀(jì)商人的日記時,原文中一條關(guān)于購買糖的記錄僅標(biāo)記了數(shù)字“145”,未注明計量單位。
谷歌的AI模型沒有直接轉(zhuǎn)寫為“145”,而是輸出了“14磅5盎司”。研究人員發(fā)現(xiàn),AI是通過反向計算賬本中記錄的總價,并結(jié)合當(dāng)時英國的貨幣(磅、先令、便士)與重量單位關(guān)系,成功推斷出這一結(jié)果的。

盡管初步結(jié)果令人振奮,但Humphries也強調(diào)了當(dāng)前評估存在局限性。由于該模型以A/B測試形式零星出現(xiàn),難以進(jìn)行系統(tǒng)性的大規(guī)模測試,目前僅評估了基準(zhǔn)數(shù)據(jù)集中約10%的樣本。

本文僅代表作者觀點,版權(quán)歸原創(chuàng)者所有,如需轉(zhuǎn)載請在文中注明來源及作者名字。
免責(zé)聲明:本文系轉(zhuǎn)載編輯文章,僅作分享之用。如分享內(nèi)容、圖片侵犯到您的版權(quán)或非授權(quán)發(fā)布,請及時與我們聯(lián)系進(jìn)行審核處理或刪除,您可以發(fā)送材料至郵箱:service@tojoy.com

