當前位置: 首頁 » 行業資訊 » 機器人»機器人的面孔天使的聲音；

機器人的面孔天使的聲音；

[點擊復制]

發布日期：2016-09-13 瀏覽次數：360

核心提示：近日，谷歌旗下人工智能公司DeepMind公布了其在計算機語音合成領域的最新研究突破WaveNet。WaveNet是一種利用神經網絡系統對原始

近日，谷歌旗下人工智能公司DeepMind公布了其在計算機語音合成領域的最新研究突破——WaveNet。WaveNet是一種利用神經網絡系統對原始音頻波形（RawSoundWave）建模的技術，生成的音頻質量優于目前所有的文本轉語音（Text-to-Speech,TTS）系統，將計算機輸出音頻與人類自然語音差距縮小50%，號稱世界最佳！

　　DeepMind在twitter發文稱：“讓人類和機器對話是人機交互領域長久以來的夢想!”

　　通常我們聽到的計算機或手機輸出的文本轉語音（TTS）音頻都會覺得別扭、生硬，甚至詭異。此次DeepMind推出的這款新型語音合成系統WaveNet將大大改善這種情況，讓機器輸出音頻更自然、更像人類發聲。

　　當然，讓計算機發出聲音，這并不是什么新鮮事兒。

　　最常用的TTS方法可能是拼接式語音合成（ConcatenativeSynthesis）：先錄制單一說話者的大量語音片段，建立一個大型語料庫，然后簡單地從中進行選擇并合成完整的大段音頻、詞語和句子。這種“機械式”方法使得計算機輸出音頻經常產生語音毛刺、語調的詭異變化、甚至結巴，并且無法調整語音的強調性音節或情緒。

　　另外一種方法是所謂的參數化方法，利用數學模型對已知的聲音進行排列、組裝成詞語或句子來重新創造音頻。這種技術倒是不易產生聲音毛刺，所以確實讓機器輸出的音頻聽起來不那么機器化。

　　然而，這兩種技術的共同點是：簡單、機械地將語音片段拼接起來，而不是從零開始創造出整個音頻波形。
WaveNet正是一種從零開始創造整個音頻波形輸出的技術。
WaveNet利用真實的人類聲音剪輯和相應的語言、語音特征來訓練其卷積神經網絡（convolutionalneuralnetworks），讓其能夠辨別這兩方面（語言和語音）的音頻模式。使用中，對WaveNet系統輸入新的文本信息，也即相對應的新的語音特征，WaveNet系統會重新生成整個原始音頻波形來描述這個新的文本信息。

　　WaveNet組織結構

　　WaveNet是逐步進行操作的：首先，生成一個音頻波形樣本；接著再處理、生成一個音頻波形樣本，逐步進行。其中非常重要的是，新的樣本生成都會受到此前樣本結果的影響，也即每一步的樣本結果都將影響下一步的樣本預測，并幫助生成下一步的樣本。

　　最終的音頻結果確實表現驚人（試聽參照DeepMind網站：https://deepmind.com/blog/wavenet-generative-model-raw-audio/）。相比于連續合成和參數化合成技術，WaveNet輸出音頻明顯更接近自然人聲。

　　DeepMind的WaveNet技術無疑是計算機語音合成領域的一大突破。然而，由于WaveNet是計算整個原始音頻波形，每輸出一秒音頻神經網絡必須處理16000個樣本，所以WaveNet技術需要強大的運算能力來合成語音。

　　據DeepMind透露給《金融時報》（FinancialTimes）的內部消息稱，這意味著目前還不能應用于谷歌或其他的任何一項產品中。

　　然而，這并不是計算機面臨的唯一語言問題。翻譯自然語言和手寫文字也是人工智能系統的一大難題。

　　起碼以現在這速度，在計算機形成真正的智能思考能力之前，它們應該早就能夠用花哨的語言和人類交流了。

下一篇：國內傳感器產有望彎道超車需先克服四個阻礙；
上一篇：【視點】人工智能可以讓你的金錢為你工作；

[ 行業資訊搜索 ] [ 加入收藏 ] [ 告訴好友 ] [ 打印本文 ] [ 關閉窗口 ]

同類行業資訊

共0條 [查看全部] 相關評論

展會更多+

2026第17屆中國國	2025第25屆中國國
2026上海國際清潔	第26屆上海國際清

視頻更多+

中舟智能固守科技	玉灃科技：精研滑
新松機器人自動化	羅克韋爾自動化（

• 四川：加快推進人型機器人、四足機器人、智能無	• 消息稱三星 AI 家庭伴侶機器人 Ballie 推遲上市
• 人形機器人從實驗室“手搓”走向量產，供應鏈廠	• 山東印發機器人產業高質量發展行動計劃
• 廣東打造千億級機器人產業集群	• 斯坦德機器人港股IPO：去年減虧，無錫國資新晉
• 黃仁勛預言：繼AI之后，機器人將成為英偉達最強	• 中金：人形機器人逐步放量以及硬件成本的下降有
• 向“智”！中國機器人“跑”起來	• 哈工程牽頭研制出新型四足機器人助力核能安全

三区在线_一区二区三区在线视频播放_九九九亚洲_黄色网页在线_国产欧美综合视频_99亚洲国产精品

我的供應

我的求購

商鋪管理

工業機器人及行業應用

智能機器人

工業自動化

智能裝備

機器人的面孔天使的聲音；

三区在线_一区二区三区在线视频播放_九九九亚洲_黄色网页在线_国产欧美综合视频_99亚洲国产精品

我的供應

我的求購

商鋪管理

工業機器人及行業應用

智能機器人

工業自動化

智能裝備

機器人的面孔 天使的聲音；

機器人的面孔天使的聲音；