近期在廈門舉行的2023年中國模式識別與計算機視覺大會(PRCV),是國內(nèi)模式識別和計算機視覺領(lǐng)域的學(xué)術(shù)盛會,參會人員包括清華大學(xué)、廈門大學(xué)、浙江大學(xué)、華中科技大學(xué)等高校的科研工作者,以及騰訊、美團、合合信息等科技企業(yè)的技術(shù)專家。本次大會解讀、分享中國模式識別與計算機視覺領(lǐng)域的最新理論和技術(shù)成果,進(jìn)一步加強產(chǎn)學(xué)研領(lǐng)域的學(xué)術(shù)交流和技術(shù)碰撞,促進(jìn)模式識別與計算機視覺領(lǐng)域的協(xié)同合作與融合創(chuàng)新。
在《視言碰撞:語言模型與視覺生態(tài)協(xié)同論壇》上,合合信息圖像算法研發(fā)總監(jiān)郭豐俊博士表示,多模態(tài)技術(shù)可充分利用文檔圖像的視覺和語言屬性,并借助語言大模型已取得的優(yōu)異性能和技術(shù)積累,正逐漸成為文檔圖像處理領(lǐng)域的熱門研究方向。
郭豐俊提到,合合信息-華南理工大學(xué)文檔圖像分析識別與理解聯(lián)合實驗室,在數(shù)據(jù)高效利用及垂直領(lǐng)域識別項目中取得了階段性成果。
據(jù)介紹,針對圖片生成式造假,合合信息基于空域與頻域關(guān)系建模,利用多維度特征,來分辨真實圖片和生成式圖片的細(xì)微差異,判斷圖片是否由AI生成。
今年8月,合合信息獲得了文檔分析與識別國際會議(ICDAR 2023)“文本篡改檢測”賽道冠軍。合合信息技術(shù)團隊提出的方案,能夠在保持低誤檢率的同時,準(zhǔn)確識別并定位圖片中文本的篡改行為,從而有效保障文本信息的真實性。相關(guān)方案已在銀行、證券、保險多個場景中應(yīng)用。
合合信息已聯(lián)合中國信通院,發(fā)起了《文本圖像篡改檢測系統(tǒng)技術(shù)規(guī)范》標(biāo)準(zhǔn)制定,希望持續(xù)推動AI技術(shù)在圖像安全領(lǐng)域的廣泛應(yīng)用,帶給用戶更加安全、高效的工作和生活體驗。(合合信息供圖)