近期,合合信息旗下掃描全能王“智能高清濾鏡”正式上線。該功能基于AI技術(shù)及智能掃描引擎,可自動(dòng)檢測(cè)圖像中存在的問(wèn)題并判定圖像的優(yōu)化方式,實(shí)現(xiàn)模糊、陰影、手指、屏幕紋等干擾因素的一鍵全處理。使用者無(wú)需思考拍攝角度、光源、背景,只要點(diǎn)擊單拍、多拍、掃描等任意拍攝按鈕,便可得到一張如原稿打印般平整、清晰的圖片。
“一鍵到位”的背后,AI在幫人“思考”圖像問(wèn)題
與傳統(tǒng)的手機(jī)掃描流程相比,掃描全能王“智能高清濾鏡”的亮點(diǎn)之一,便是讓AI代替人去“思考”圖片中需要解決的問(wèn)題,并為用戶自動(dòng)選擇出最優(yōu)處理方案,通過(guò)算法上的智能研判,達(dá)成多個(gè)問(wèn)題一鍵解決的效果。
據(jù)合合信息掃描全能王事業(yè)部負(fù)責(zé)人曹超陽(yáng)介紹,“智能高清濾鏡”的智能研判主要基于精準(zhǔn)的圖像感知,來(lái)達(dá)成場(chǎng)景化的決策效果,例如,去除手指產(chǎn)生的遮擋、感知到圖像是過(guò)暗還是過(guò)亮,然后針對(duì)性地調(diào)整圖像的亮度和對(duì)比度等。
“智能高清濾鏡”能夠迅速判定文檔種類并進(jìn)行處理方法決策,在辦公文檔電子化、教育資料處理、商務(wù)資料留存等涉及文檔處理的場(chǎng)景中具有廣闊的應(yīng)用前景。
智能掃描引擎,讓AI讀懂圖像與文字
現(xiàn)實(shí)生活中,書(shū)本等文檔并不總是平面的,AI在處理相關(guān)圖片時(shí)需要進(jìn)行“矯正”。此外,由于拍攝角度和鏡頭畸變的問(wèn)題,即使是平面的文檔,拍攝后也可能出現(xiàn)透視扭曲。掃描全能王采用了基于深度學(xué)習(xí)的曲面檢測(cè)和矯正技術(shù)來(lái)進(jìn)行處理,能夠應(yīng)對(duì)各種復(fù)雜的曲面文檔。
據(jù)介紹,智能掃描引擎AI-Scan(簡(jiǎn)稱“AI-Scan引擎”),基于合合信息智能文字識(shí)別、智能圖像處理技術(shù),對(duì)圖像處理、文字識(shí)別及版面還原進(jìn)行全面優(yōu)化,綜合提升掃描效果。
多語(yǔ)種識(shí)別是巨大的挑戰(zhàn)。例如,阿拉伯語(yǔ)的書(shū)寫(xiě)方向是從右到左,而且同一字母在單詞的不同位置有著不同的形態(tài)。而掃描全能王采用了一種結(jié)合深度學(xué)習(xí)和自然語(yǔ)言處理的全新方法,能夠有效地處理不同語(yǔ)種的字符關(guān)聯(lián)和順序問(wèn)題。
在服務(wù)全球億級(jí)別用戶的過(guò)程中,掃描全能王對(duì)大量的多語(yǔ)種文本進(jìn)行預(yù)訓(xùn)練,能夠?qū)θ?1個(gè)語(yǔ)種的文檔進(jìn)行識(shí)別,滿足了全球超過(guò)100個(gè)國(guó)家和地區(qū)用戶的辦公、生活需求。