近期,合合信息智能文字識別產(chǎn)品通過中國信息通信研究院(以下簡稱“中國信通院”)“可信AI—智能文檔處理系統(tǒng)”評估工作,并獲得“5級”評定。“5級”是該模塊最高評定等級。
中國信通院于2018年起逐步構(gòu)建和完善“可信AI”評測體系,助力人工智能技術(shù)的發(fā)展和產(chǎn)業(yè)的健康成長,“智能文檔處理”是近兩年來新增的評測項目之一。
計算機信息化系統(tǒng)中的數(shù)據(jù)分為結(jié)構(gòu)化數(shù)據(jù)和非結(jié)構(gòu)化數(shù)據(jù),人們?nèi)粘I?、工作中所接觸到的各類辦公文檔、文本、圖片、報表都屬于非結(jié)構(gòu)化數(shù)據(jù)。由于格式復雜、標準多樣,非結(jié)構(gòu)化數(shù)據(jù)處理起來既困難又耗時,智能文檔處理技術(shù)可以把關(guān)鍵信息從半結(jié)構(gòu)化、非結(jié)構(gòu)化數(shù)據(jù)中提取出來,進一步實現(xiàn)業(yè)務(wù)流程的端到端自動化。智能文檔處理技術(shù)是提升部分行業(yè)、業(yè)務(wù)、流程的核心生產(chǎn)要素,隨著與應(yīng)用和流程自動化的深度整合,潛在的應(yīng)用場景廣泛,普及空間較大。
智能文檔處理技術(shù)已被廣泛應(yīng)用于文檔數(shù)字化管理、自動化流程、圖文提取等業(yè)務(wù)場景,并加速滲透金融、政務(wù)、醫(yī)療、海關(guān)等垂直領(lǐng)域。中國信通院持續(xù)關(guān)注智能文檔處理技術(shù)及應(yīng)用的發(fā)展情況,依據(jù)《自然語言處理技術(shù)和產(chǎn)品評估方法第8部分:智能文檔處理系統(tǒng)》,全方位評估企業(yè)智能文檔處理的技術(shù)先進度。而評估結(jié)果顯示,合合信息智能文檔處理產(chǎn)品在通用能力及AI核心能力方面均表現(xiàn)優(yōu)異,在通用能力方面,合合信息產(chǎn)品的信息抽取、表格文字識別、版面分析等方面均獲得5分評分;在AI核心能力方面,合合信息產(chǎn)品的知識圖譜領(lǐng)域的實體識別、關(guān)系抽取等能力也獲得5分評分。
本月,中國信通院攜手合合信息啟動了《文檔圖像篡改檢測標準》制定工作,中國科學技術(shù)大學等知名學術(shù)機構(gòu)參與聯(lián)合編制。該檢測標準將基于產(chǎn)業(yè)現(xiàn)狀,圍繞“細粒度”視覺差異偽造圖像鑒別、生成式圖像判別等行業(yè)焦點議題,凝聚行業(yè)共識,為中國“可信AI”在機器視覺、圖像處理領(lǐng)域的體系建設(shè)提供有力支持。