詳細信息 |
智能語音的應用發展趨勢 |
編輯: 來源:創澤集團 時間:2022/3/26 |
智能語音,主要是人和機器通過語音作為媒介進行自然交互的形式,涉及到的核心技術主要包括四個方面,先通過語音識別(ASR)轉成文字,如果語音信號質量不好的話,前端會有一個語音增強模塊;然后是口語語言理解,接下來是對話管理和口語語言生成,而終通過文語轉換(TTS)生成語音回饋給用戶。 回顧語音識別的發展,在2000年之前,語音識別的錯誤率有明顯的改善,而在2000年到2010年期間,我們做的很多努力很難再去進一步降低識別的錯誤率。在大概2010年后,在深度學習的推動下,利用大數據、機器學習和大算力這“三駕馬車”,語音識別的識別準確度再一次明顯提升,錯誤率再一次下降,并且在一部分數據集上實現了媲美人類語音識別的精度。 語音識別是智能語音范疇內的一個典型任務,除此之外,智能語音的任務還包括語音編碼、語音增強、關鍵詞檢出、聲紋識別等一系列任務,而智能語音技術能夠服務的方向主要包括三方面,一是自然人機交互,二是自然人人交互,還有就是內容分析與挖掘,垂直落地的應用非常多,場景廣泛,價值巨大。 在技術側,智能語音行業發展仍然面臨著聲紋識別的不穩定性、語音識別的魯棒性以及訓練場景的長尾性的落地挑戰; 而在應用側,智能語音技術已逐步從純技術形式應用,轉向“語音+AI技術+行業“的創新式發展。 受供給側的業務增長突破和需求側的客戶訴求推動,智能語音技術調用不僅是單純為轉寫“人說了什么”或者輸出“機器要說什么”,而是正逐步與語義理解、知識圖譜等AI技術融合,讓使用智能語音技術的機器本體更加具備認知性和行業關聯性,結合行業 Know-how和甲方需求輸出整體性、結果導向性的實用解決方案。
智能語音的技術挑戰1 聲紋識別的不穩定性:人的聲音在不同時間、 狀態會呈現不同的特征,因此技術層面如何準確識別變化明顯的聲紋特征仍然面臨挑戰。 2 語音識別的魯棒性:說話目標由遠到近的移動、場景變化、背景噪音、混響嘈雜、干擾聲源等真實場景,會給語音識別準確率帶來較大 折扣。 3 訓練場景的長尾性:面對低資源小語種和語言訓練場景,如何通過較少資源獲得規模有效的訓練成果,是智能語音持續面臨的技術挑戰。
|
【聲明:轉載此文出于傳遞更多信息之目的,并不意味著贊同其觀點或證實其描述,文章內容僅供參考,如有侵權,請聯系刪除。】 |
推薦信息 |
高空擦窗機器人初創企業Skyline完成650萬美元A輪前融資
高層窗戶清潔機器人可清潔摩天大樓外側難以觸及的外墻的清潔機器人,650萬美元的pre-A輪融資用于各種業務運營及持續的產品開發
機器人與假手結合,抓取物品,仿生手假肢和腦機接口
將單個手指控制和自動化結合起來,以提高抓取和操作能力,涉及從截肢者殘肢上的肌肉活動中解讀意圖的手指運動,以實現對假肢手的單個手指控制
中國工業視覺搭上智能制造“快車”,國產化替代率已達50%
政策+需求+場景+信創驅動工業視覺行業發展進入新階段,助力中國制造的眼睛自主可控,其技術逐步由基礎模式匹配向深度學習方向縱向超越式 發展
甲骨文斷供俄羅斯!數據庫深度復盤與展望
從數據模型邏輯、技術架構、需求功能、部署方式、存儲介質、商業模式、數據庫治理模式等七大維度對數據庫發展脈絡進行詳細闡述
如何選擇迎賓服務機器人生產廠家
個性化配置;主動喚醒;主動引導;主動服務;主動迎賓;智能引領;售后服務體系是否完善;廠家的數量及規模有很多的客戶案例
動力外骨骼機器人研發及制造商英漢思動力完成5000萬元pre-A輪融資
由普曼資本及濰坊中谷健康產業基金領投,小米集團聯合創始人黃江吉,科大訊飛聯合創始人胡郁及晨暉創投,浩方創投等知名投資人及機構方參與跟投,老股東高秉強教授本輪繼續跟投
加大腦科學研究應用,改善老年腦健康管理
識別腦健康風險的數據積累較少,數據庫建設仍較為薄弱;腦科學的研發資源共享有待提高,本土研究優勢仍待發揮
武漢人工智能超算中心
武漢人工智能超算中心位于東湖高新區,合作單位有華為 中科院自動化所 武漢大學 武漢理工大學,算力規模是100p flops |
智能運輸機器人 |
AGV無人運輸機器人-料箱版 |
AGV無人運輸機器人-標準版 |
AGV無人運輸機器人-料箱版(鈑金材質) |
AGV無人運輸機器人-貨架版(鈑金材質) |
AGV無人運輸機器人-貨架版(亮面不銹鋼材質) |
AGV無人運輸機器人-開放版 |
行業動態 |
咨詢熱線:4006-935-088 / 4006-937-088
客服熱線:
4008-128-728
版權所有 @ 創澤智能機器人集團股份有限公司 魯ICP備18039973號-2 運營中心 / 北京·清華科技園九號樓 生產中心 / 山東省日照市開發區太原路71號 |