<meter id="erttq"><listing id="erttq"><menu id="erttq"></menu></listing></meter>

    <code id="erttq"></code>
    <tr id="erttq"></tr>
    <ins id="erttq"><video id="erttq"></video></ins>
      <tr id="erttq"><small id="erttq"></small></tr><tr id="erttq"></tr>
    1. <small id="erttq"></small>

      <code id="erttq"></code><output id="erttq"><track id="erttq"></track></output><menuitem id="erttq"><video id="erttq"></video></menuitem>

          微軟AI只用200個訓練樣本生成逼真的語音

          導讀現代的文本到語音轉換算法具有令人難以置信的能力,你不需要進一步尋找證據,而不是谷歌最近開源的SpecAugment或Translatotron--后者可以直

          現代的文本到語音轉換算法具有令人難以置信的能力,你不需要進一步尋找證據,而不是谷歌最近開源的SpecAugment或Translatotron--后者可以直接將一個人的聲音翻譯成另一種語言,同時保留語氣和男高音。但總有改進的余地。

          為此,微軟的研究人員最近在一篇論文(“ 幾乎無監督的文本到語音和自動語音識別 ”)中詳細介紹了一種利用無監督學習的人工智能系統 - 一種機器學習的分支,從未標記,未分類和未分類的測試數據中收集知識 - 實現自動語音識別的99.84%單詞可懂度準確率和11.7%PER。更令人印象深刻的是,該模型僅需要200個音頻剪輯和相應的轉錄。

          關鍵是變形金剛,這是一種新型的神經結構,在2017年的一篇論文中引入,由Google的AI研究部門Google Brain的科學家共同撰寫。與所有深度神經網絡一樣,變形金剛包含排列在互連層中的神經元(數學函數松散地模仿生物神經元),這些層從輸入數據傳輸“信號”并緩慢調整每個連接的突觸強度 - 權重。(這就是模型如何提取特征并學習如何進行預測。)但是,獨特的變形金剛注意:每個輸出元素都連接到每個輸入元素,它們之間的權重是動態計算的。

          微軟研究人員將Transformer組件整合到他們的AI系統設計中,可以將語音或文本作為輸入或輸出,他們采購了公開的LJSpeech數據集 - 其中包含13,100個英語音頻片段和成績單 - 用于訓練數據。該團隊隨機選擇上述200個剪輯來創建訓練數據集,并利用去噪自動編碼器組件重建損壞的語音和文本。

          考慮到小型語料庫,結果并非一半糟糕 - 研究人員指出,它在測試中輕松勝過三種基線算法。并且發布的幾個生成的樣本聽起來像人類一樣,保存了輕微的機器人聲音。

          共同作者通過在其他預訓練方法的幫助下純粹利用不成對的語音和文本數據,留給未來的工作“突破無監督學習的極限”。他們寫道:“在這項工作中,我們提出了幾乎無監督的文本到語音和自動語音識別方法,它只利用了少量成對的語音和文本數據以及額外的不成對數據。” “我們在實驗中證明,我們設計的組件是開發語音和文本轉換功能所必需的,只需很少的配對數據。”

          該論文將于今年晚些時候在加利福尼亞州長灘舉行的國際機器學習大會上發布,該團隊計劃在未來幾周內發布該代碼。

          標簽:微軟AI

          免責聲明:本文由用戶上傳,如有侵權請聯系刪除!

          九七色色 亭亭五月 欧美又粗又长又爽做受 中文字幕不卡av无码专线一本 av无码中文字幕不卡一区二区三区

          <meter id="erttq"><listing id="erttq"><menu id="erttq"></menu></listing></meter>

            <code id="erttq"></code>
            <tr id="erttq"></tr>
            <ins id="erttq"><video id="erttq"></video></ins>
              <tr id="erttq"><small id="erttq"></small></tr><tr id="erttq"></tr>
            1. <small id="erttq"></small>

              <code id="erttq"></code><output id="erttq"><track id="erttq"></track></output><menuitem id="erttq"><video id="erttq"></video></menuitem>