在這個(gè)科技飛速發(fā)展的時(shí)代,數(shù)字化浪潮席卷而來,其中,人工智能應(yīng)用場(chǎng)景的構(gòu)建成為新的科技焦點(diǎn),“AI驅(qū)動(dòng)的虛擬數(shù)字人”應(yīng)用場(chǎng)景正在加速落地,逐步向互聯(lián)網(wǎng)、文旅、金融、快消、汽車等領(lǐng)域加速滲透,為人工智能行業(yè)的發(fā)展帶來更多想象力。
6月6日,在世優(yōu)科技波塔發(fā)布會(huì)現(xiàn)場(chǎng),世優(yōu)科技韓光明作為代表,重磅發(fā)布了世優(yōu)科技AI數(shù)字人多模態(tài)交互系統(tǒng)——波塔?!笆纼?yōu)波塔”以技術(shù)革新突破AI交互桎梏,核心能力持續(xù)提升,升級(jí)大模型應(yīng)用、系統(tǒng)工程和開放接口等功能及能力,打造更有溫度的AI,開啟下一個(gè)數(shù)字時(shí)代新紀(jì)元。
把握市場(chǎng)機(jī)遇
重新定義AI時(shí)代虛擬數(shù)字人
自2023年世優(yōu)BOTA1.0發(fā)布以來,該創(chuàng)新技術(shù)產(chǎn)品獲得了客戶廣泛的青睞。韓光明表示“在過往的一年中,我們成功實(shí)施了眾多融合AI與數(shù)字人技術(shù)的前沿項(xiàng)目,有在政務(wù)展廳中講解的數(shù)字講解員、有在學(xué)校作為助教的AI數(shù)字教師,還有醫(yī)院智能指引、數(shù)字主播自動(dòng)帶貨等案例”,據(jù)統(tǒng)計(jì)世優(yōu)波塔AI數(shù)字人正與數(shù)萬用戶產(chǎn)生聯(lián)系。通過這些實(shí)踐,不斷優(yōu)化算法以實(shí)現(xiàn)更加流暢自然的語言交流、自動(dòng)化識(shí)別與響應(yīng)能力,逐步深化了對(duì)AI驅(qū)動(dòng)的交互式數(shù)字人解決方案的理解與應(yīng)用方式。
在此基礎(chǔ)上,世優(yōu)科技對(duì)自主研發(fā)的AI數(shù)字人系統(tǒng)提出了新的要求,不僅要能檢索思考、回答問題,還要像真人一樣做到主動(dòng)交互問詢,實(shí)現(xiàn)從多輪對(duì)話、主動(dòng)對(duì)話再到啟發(fā)式對(duì)話的跨越,并保證互動(dòng)對(duì)話的高效、精準(zhǔn)程度。
本次推出的世優(yōu)波塔,以世優(yōu)科技多年積累的全棧數(shù)字人技術(shù)為基礎(chǔ),致力于打造人工智能時(shí)代有溫度的多模態(tài)人機(jī)交互界面。世優(yōu)波塔同時(shí)支持3D數(shù)字人和2.5D數(shù)字人,搭配個(gè)性化的聲音服務(wù),為不同客戶不同場(chǎng)景應(yīng)用提供滿意的交互形象支持,不僅有大量的公共形象和聲音供用戶選擇,同時(shí)也提供個(gè)性化定制能力。
世優(yōu)波塔AI數(shù)字人能夠更好地與用戶進(jìn)行溝通與連接,滿足用戶信息獲取與情感交流的需求,幫助企業(yè)提升工作效率和用戶服務(wù)體驗(yàn)。世優(yōu)波塔不僅是技術(shù)積累與項(xiàng)目實(shí)施的重大成果,更是我們?cè)谕苿?dòng)“AI+數(shù)字人”技術(shù)邁向更高層次成熟度與商業(yè)化進(jìn)程中的重要里程碑。
突破技術(shù)瓶頸
開啟人工智能應(yīng)用場(chǎng)景新篇章
為了能夠幫客戶實(shí)現(xiàn)“AI+大模型”的端到端應(yīng)用場(chǎng)景融合,世優(yōu)科技持續(xù)進(jìn)行技術(shù)迭代與優(yōu)化,不僅在算法層面不斷突破,同時(shí)在模型部署、性能優(yōu)化及用戶體驗(yàn)上,確保高效、穩(wěn)定地將人工智能成果轉(zhuǎn)化為可落地的解決方案,旨在構(gòu)建一個(gè)高度靈活且可擴(kuò)展的AI應(yīng)用框架,從而助力企業(yè)級(jí)用戶把握“AI+多模型”的先機(jī)。
優(yōu)化3D表情生成算法,讓數(shù)字人擁有更豐富的表現(xiàn)力
世優(yōu)科技對(duì)3D表情生成的算法結(jié)構(gòu)和算法工程,進(jìn)行總體優(yōu)化提升,讓單個(gè)數(shù)字人頭部擁有182個(gè)精細(xì)控制點(diǎn),這一設(shè)置超越了傳統(tǒng)基于20個(gè)音素的系統(tǒng)或52個(gè)基本混合形狀的方法,182個(gè)控制點(diǎn)可以提供更準(zhǔn)確的控制能力和更豐富的面部表情捕捉,促進(jìn)了面部動(dòng)畫的真實(shí)感與表現(xiàn)力,特別是在微妙表情的傳達(dá)上。
同時(shí)進(jìn)一步提升效率與響應(yīng)速度,目前可以達(dá)到在1秒之內(nèi)完成20秒音頻輸入推理工程,這一成果不僅保證了AI數(shù)字人在實(shí)時(shí)交互應(yīng)用中所需的高速反饋,還降低了資源消耗的低成本。
將大模型和小模型能力相結(jié)合,打造功能搭建AGENT平臺(tái)
為了彌補(bǔ)大模型在特定應(yīng)用場(chǎng)景下的能力不足,世優(yōu)波塔運(yùn)用了多模型基座,搭配大量小模型能力,打造了功能強(qiáng)大且簡便易用的功能搭建AGENT平臺(tái),可以發(fā)揮不同模型的優(yōu)勢(shì)特性和不同模型之間交叉驗(yàn)證,以更輕量化和更高效的能力,快速實(shí)現(xiàn)業(yè)務(wù)流程的搭建和實(shí)現(xiàn),使得交互正確率達(dá)到98%。
在增強(qiáng)檢索方面,世優(yōu)波塔利用大語言模型進(jìn)行問題泛化處理和文檔嵌入,并且進(jìn)行元數(shù)據(jù)的補(bǔ)充與分類,在檢索時(shí)自動(dòng)化關(guān)聯(lián)合并數(shù)據(jù),更高效地幫助用戶找到最匹配或最新的結(jié)果數(shù)據(jù)。
開放接口并優(yōu)化工程,和業(yè)務(wù)系統(tǒng)進(jìn)行快速集成
為了降低數(shù)字人交互系統(tǒng)的成本,支持全終端的本地化渲染方案,相比云渲染的方式,渲染成本直線降低60%左右,同時(shí)為了讓整個(gè)交互體驗(yàn)更流暢,世優(yōu)科技進(jìn)行了大量的工程優(yōu)化和策略優(yōu)化,把端到端的響應(yīng)時(shí)間控制在1.5-2s以內(nèi),保證自然交互的流暢程度。
作為一個(gè)智能化交互系統(tǒng),波塔的API平臺(tái),把播報(bào)和對(duì)話控制、指令識(shí)別、業(yè)務(wù)流程定制、內(nèi)容編排、動(dòng)畫編排等能力作為接口開放出來,使得波塔能夠和現(xiàn)有業(yè)務(wù)系統(tǒng)進(jìn)行快速集成。
賦能千行百業(yè)
讓每個(gè)人都擁有獨(dú)屬的AI助手
世優(yōu)波塔支持?jǐn)?shù)字大屏、AI數(shù)字人一體機(jī)、PC端以及H5小程序等多種應(yīng)用終端,同時(shí)支持私有化部署等集成方案,滿足不同客戶的需求,利用數(shù)字化產(chǎn)品,來增強(qiáng)數(shù)字人的智能性、互動(dòng)性和真實(shí)性,從而為客戶打造更加沉浸、個(gè)性化的數(shù)字體驗(yàn)。目前,世優(yōu)波塔正以3D、2.5D數(shù)字人形象,擔(dān)任前臺(tái)接待、數(shù)字客服等身份,為政企客戶提供更新穎、更卓越的用戶服務(wù)體驗(yàn)。
在政務(wù)服務(wù)領(lǐng)域,世優(yōu)波塔AI數(shù)字人為政府機(jī)構(gòu)提供智能化咨詢與講解服務(wù),實(shí)現(xiàn)政務(wù)信息精準(zhǔn)傳達(dá)、公共服務(wù)高效辦理,顯著提升政務(wù)服務(wù)的質(zhì)量與效率,同時(shí)增強(qiáng)民眾的數(shù)字化服務(wù)體驗(yàn);
文旅領(lǐng)域中,世優(yōu)波塔化身成為數(shù)字導(dǎo)游或文化解說員,為游客提供沉浸式文旅體驗(yàn),通過復(fù)現(xiàn)歷史人物、講述地方故事、導(dǎo)覽景區(qū)風(fēng)光,不僅促進(jìn)了文化的數(shù)字化傳播,還提升文旅景區(qū)前沿的數(shù)字化服務(wù);
教育培育方面,世優(yōu)波塔作為智能教學(xué)助手,承擔(dān)學(xué)科知識(shí)展示講解、語言練習(xí)伙伴的角色,在校史館、多功能教室等地,為師生創(chuàng)造更加生動(dòng)、互動(dòng)的學(xué)習(xí)環(huán)境;
而在醫(yī)療衛(wèi)生領(lǐng)域,世優(yōu)波塔提供導(dǎo)醫(yī)導(dǎo)診、智能陪診、用藥提醒、智能指引等“一站式”貼心服務(wù),提高了醫(yī)療服務(wù)的便捷性,同時(shí)保障了醫(yī)療信息的準(zhǔn)確傳遞與隱私安全。
此外,在直播、互聯(lián)網(wǎng)、金融、傳媒等行業(yè),世優(yōu)波塔AI數(shù)字人也都展現(xiàn)了其作為前沿人工智能技術(shù)的優(yōu)勢(shì),在推動(dòng)行業(yè)智能化轉(zhuǎn)型、提升服務(wù)效能與用戶體驗(yàn)方面的巨大潛力與價(jià)值。
世優(yōu)科技的波塔產(chǎn)品,是人工智能時(shí)代的多模態(tài)人機(jī)交互界面,讓技術(shù)的溫暖觸達(dá)每一個(gè)細(xì)微之處,它不僅是一個(gè)技術(shù)革新的標(biāo)志,更是實(shí)現(xiàn)了產(chǎn)業(yè)鏈縱向整合的典范應(yīng)用,通過AI數(shù)字人全棧技術(shù)解決方案,加速傳統(tǒng)行業(yè)的模式創(chuàng)新與服務(wù)升級(jí),為經(jīng)濟(jì)體系的全面數(shù)字化升級(jí)鋪設(shè)堅(jiān)實(shí)基礎(chǔ)。
免責(zé)聲明:中國網(wǎng)商務(wù)頻道僅出于信息傳播轉(zhuǎn)載本文,內(nèi)容如有疑義,請(qǐng)聯(lián)系原發(fā)網(wǎng)站處理。