谷歌人工智能部門去年決定與NOAA(美國國家海洋和大氣管理局)合作,利用人工智能更好地了解在夏威夷水域游泳的座頭鯨的歌曲圖案?,F在,Google團隊正在研究一個新項目,以幫助用戶解決語言問題。
結合虛擬助手和語音識別服務的重要性,他們分析了如何使用這些動態特性來改善這些用戶的溝通和交互。
正如Google在其人工智能博客中的解釋中所解釋的那樣,Parrotron是基于序列,基于注意力的模型,該模型使用兩個平行的輸入/輸出對集合在兩個階段進行訓練。
迄今為止,由于沒有對AI進行過針對不同場景的訓練,因此語音障礙人士已被排除在這些技術之外。為了解決這個問題,Google開發了Parrotron:
Parrotron是一種端到端訓練有素的語音到語音轉換模型,可將輸入頻譜圖直接映射到另一個頻譜圖,而無需使用離散的中間表示??梢杂柧氃撃P鸵允谷魏握f話者的語音正?;?,而不管重音,韻律或背景噪音如何?;旧?,這是一個端到端的人工智能網絡,可以將非典型語音模式轉換為語音障礙者的合成語音。
Google團隊針對不同的用戶測試了該技術,Parrotron系統將字錯誤率從89%降低到32%。一個令人鼓舞的結果表明了該工具的潛力。
我們可以在Google的報告中閱讀這些測試的所有步驟以及培訓的技術細節。