2026年月4月27日,中國電子節(jié)能技術(shù)協(xié)會聯(lián)合工業(yè)和信息化部國際經(jīng)濟技術(shù)合作中心在工信部萬壽路機關(guān)組織召開了由安徽聲云智能科技有限公司研發(fā)的“語音交互系統(tǒng)智能終端軟硬一體化關(guān)鍵技術(shù)及應(yīng)用”科技成果評價會。評價專家委員會由工業(yè)和信息化部節(jié)能與綜合利用司原司長黃利斌、工信部經(jīng)濟運行局原副巡視員許國祿、工信部中小企業(yè)發(fā)展促進中心原副主任羅俊章、工信部一所質(zhì)量所所長劉永東、中科院計算機所高級工程師張玉軍、工信部賽迪研究院正高級工程師崔志廣、北京交通大學(xué)教育部重點實驗室教授趙謖玲組成。評價委員會聽取了科技成果完成單位的技術(shù)總結(jié)報告,審查了相關(guān)資料,經(jīng)質(zhì)詢和討論形成意見如下:
1.提供的資料基本齊全,符合評價要求。
2.該科技成果的關(guān)鍵技術(shù)及主要創(chuàng)新點:
(1)通過窗口識別、界面區(qū)域感知、控件定位、屏幕OCR與鍵鼠事件執(zhí)行模塊,采用語音識別、離線指令識別和多模態(tài)輸入方式聯(lián)動技術(shù),實現(xiàn)GUI感知與多模態(tài)執(zhí)行模塊整合,實現(xiàn)硬件終端與桌面GUI的狀態(tài)感知與操作執(zhí)行。
(2)通過采用I2S/PDM 數(shù)字麥克風(fēng)陣列、語音前端 Codec、BLE 5.x + 2.4G雙模通信、語音交互物理按鍵及AI陀螺儀動作識別技術(shù),實現(xiàn)語音硬件平臺低功耗、高集成化。
(3)通過圍繞DoA聲源定位、多聲源跟蹤、MVDR/GSC波束形成、回聲消除、混響抑制及說話人分離等算法鏈技術(shù),實現(xiàn)會議速記、場景交互和復(fù)雜噪聲環(huán)境的語音前端處理。
(4)通過ONNX int8量化模型與CPU VNNI加速技術(shù),采用綠色版解包即運行、標(biāo)準(zhǔn)接口和集群化部署技術(shù),解決了私有化部署成本和運維的問題,實現(xiàn)CPU側(cè)私有化部署與高并發(fā)運行。該技術(shù)符合智能化、綠色化發(fā)展方向,應(yīng)用前景良好。
3.該項目技術(shù)已獲得國家發(fā)明專利,具有自主知識產(chǎn)權(quán)。
4.評價委員會認(rèn)為該項目技術(shù)達(dá)到國際先進水平,一致同意通過科技成果評價,予以科技成果登記。
微信公眾號
服務(wù)熱線