2015年09月26日09:06新浪手機(jī)
微博 我有話說(shuō)(41人參與) 收藏本文
本文出自愛范兒
相信有不少文章詳細(xì)介紹過(guò) Siri、Cortana 和 Google Now 之間的區(qū)別,總體說(shuō)來(lái),Google Now 算是目前市場(chǎng)上最為成熟的語(yǔ)音助手,F(xiàn)在,為了精益求精,Google 官方搜索部門又推出了它的更新版本。

現(xiàn)有的聲音模型主要依賴于 LSTM(Long-Short Term Memory),作為一種長(zhǎng)短期記憶人工神經(jīng)網(wǎng)絡(luò),它可以視為 RNN (recurrent neural networks)的一種特殊延伸。和其他的 RNN 相比,LSTM 在記憶單元和門控機(jī)制上有著獨(dú)特的優(yōu)勢(shì),能夠記住更多的信息。

(RNN 結(jié)構(gòu))
在這之前,Google Now 采用的是 DNN 技術(shù),這也是目前市場(chǎng)上最為流行的技術(shù),再之前則是稱霸了整個(gè)行業(yè) 30 年之久的 GMM(the Gaussian Mixture Model)技術(shù)。
前浪死在沙灘上,一代更比一代強(qiáng)。
現(xiàn)在,依靠更加成熟的 LSTM 技術(shù),Google Now 的語(yǔ)音識(shí)別功能更快也更精準(zhǔn),哪怕是在噪音環(huán)境下,也有著不俗的表現(xiàn)。
另外,針對(duì)音素預(yù)測(cè)(phoneme prediction)會(huì)有 30 毫秒延遲這點(diǎn),Google 搜索部門特意對(duì)其進(jìn)行了訓(xùn)練,使其更接近實(shí)際速度;而 feedback loop 功能則可以在瞬間吸納你說(shuō)的所有單詞及聲音,即使有些發(fā)音你并沒有完全發(fā)出來(lái),它都可以將這個(gè)單詞變得“一氣呵成”。

(feedback loop)
——也就是說(shuō),可能你話還沒有說(shuō)完,它就已經(jīng)知道你要說(shuō)什么了。
目前 Google app 上已經(jīng)增添了這一服務(wù),Android 或 iOS 用戶均可使用。
掃碼關(guān)注5G通信官方公眾號(hào),免費(fèi)領(lǐng)取以下5G精品資料
1、回復(fù)“YD5GAI”免費(fèi)領(lǐng)取《中國(guó)移動(dòng):5G網(wǎng)絡(luò)AI應(yīng)用典型場(chǎng)景技術(shù)解決方案白皮書》
2、回復(fù)“5G6G”免費(fèi)領(lǐng)取《5G_6G毫米波測(cè)試技術(shù)白皮書-2022_03-21》
3、回復(fù)“YD6G”免費(fèi)領(lǐng)取《中國(guó)移動(dòng):6G至簡(jiǎn)無(wú)線接入網(wǎng)白皮書》
4、回復(fù)“LTBPS”免費(fèi)領(lǐng)取《《中國(guó)聯(lián)通5G終端白皮書》》
5、回復(fù)“ZGDX”免費(fèi)領(lǐng)取《中國(guó)電信5G NTN技術(shù)白皮書》
6、回復(fù)“TXSB”免費(fèi)領(lǐng)取《通信設(shè)備安裝工程施工工藝圖解》
7、回復(fù)“YDSL”免費(fèi)領(lǐng)取《中國(guó)移動(dòng)算力并網(wǎng)白皮書》
8、回復(fù)“5GX3”免費(fèi)領(lǐng)取《 R16 23501-g60 5G的系統(tǒng)架構(gòu)1》