金峰
在手機(jī)語(yǔ)音搜索這一移動(dòng)互聯(lián)網(wǎng)熱點(diǎn)領(lǐng)域,蘋果公司依舊是先行者。此前,蘋果公司推出了iPhone 4S,并在其中集成了語(yǔ)言控制Siri模塊——這使得用戶可以通過(guò)語(yǔ)音對(duì)手機(jī)進(jìn)行控制,同時(shí)也可以通過(guò)語(yǔ)音進(jìn)行搜索。蘋果公司巨大的行業(yè)示范效應(yīng)使得手機(jī)語(yǔ)音搜索的市場(chǎng)被引爆,各類語(yǔ)音搜索應(yīng)用迅速涌現(xiàn)。
近日,臺(tái)灣宏達(dá)(HTC)旗艦級(jí)新手機(jī)HTC Endeavour被曝出包含一項(xiàng)名為“HTC Speak”的語(yǔ)音助理軟件;國(guó)內(nèi)熱門移動(dòng)互聯(lián)網(wǎng)應(yīng)用訂餐小秘書也推出支持語(yǔ)音搜索餐廳功能的安卓(Android)版及蘋果版客戶端。此前,百度、谷歌、騰訊、UC、科大訊飛等都陸續(xù)推出自有移動(dòng)語(yǔ)音搜索應(yīng)用,一時(shí)間語(yǔ)音搜索似乎成了未來(lái)智能終端的必備選項(xiàng)。
事實(shí)上,與國(guó)外不同,目前國(guó)內(nèi)手機(jī)語(yǔ)音搜索市場(chǎng)雖然已具備一定的用戶需求與初步的技術(shù)積累,但仍處在市場(chǎng)導(dǎo)入期階段。
不過(guò),手機(jī)語(yǔ)音搜索應(yīng)用雖未被廣泛普及,但目前國(guó)內(nèi)手機(jī)語(yǔ)音搜索的市場(chǎng)發(fā)展基礎(chǔ)已經(jīng)形成。
首先,手機(jī)語(yǔ)音搜索迎合了國(guó)內(nèi)手機(jī)用戶的需求。用戶在使用手機(jī)時(shí),有相當(dāng)比例的時(shí)間處在移動(dòng)狀態(tài)下。在這種狀態(tài)下,用戶視覺的使用需要在使用手機(jī)與其他行為間進(jìn)行分配,因而無(wú)法專注地使用手機(jī)。而語(yǔ)音搜索則解決了這一問(wèn)題,用戶可以通過(guò)“說(shuō)”來(lái)提交需求,通過(guò)“聽”來(lái)獲得反饋,而不會(huì)影響用戶正常行為。
其次,Siri成功引發(fā)了用戶對(duì)語(yǔ)音搜索的使用興趣,國(guó)內(nèi)手機(jī)語(yǔ)音搜索市場(chǎng)發(fā)展的引爆點(diǎn)已經(jīng)出現(xiàn)。
第三,中文語(yǔ)音搜索的技術(shù)基礎(chǔ)已初步形成。語(yǔ)音搜索并非蘋果公司獨(dú)創(chuàng),核心技術(shù)也并非完全掌握在蘋果公司,這就使得語(yǔ)音搜索的廣泛應(yīng)用成為可能。目前,科大訊飛、谷歌等企業(yè)歷經(jīng)多年的發(fā)展,通過(guò)語(yǔ)音庫(kù)、語(yǔ)義庫(kù)的構(gòu)建,已經(jīng)能夠較好地識(shí)別用戶的語(yǔ)音;而語(yǔ)義庫(kù)的構(gòu)建,也實(shí)現(xiàn)了機(jī)器對(duì)人自然語(yǔ)言的解讀,為更加精確反饋搜索結(jié)果奠定了基礎(chǔ)。同時(shí),移動(dòng)互聯(lián)網(wǎng)與云計(jì)算的發(fā)展,也使得基于在線龐大語(yǔ)音、語(yǔ)義庫(kù),實(shí)現(xiàn)精準(zhǔn)識(shí)別成為可能。
盡管手機(jī)語(yǔ)音搜索市場(chǎng)基礎(chǔ)已經(jīng)形成,但是短期內(nèi)市場(chǎng)無(wú)法規(guī)模推廣,其根本原因在于目前技術(shù)仍不成熟。
眾所周知,每個(gè)人的口音均有一定的差別,能夠準(zhǔn)確識(shí)別用戶在說(shuō)什么,本身就是一件很困難的事情,而中文的同音不同字情況較多,將用戶的語(yǔ)句識(shí)別為哪些詞組,還需要考慮上下文的具體情況,相比英文、德文等拉丁語(yǔ)系的一個(gè)發(fā)音明確對(duì)應(yīng)一個(gè)單詞而言,中文的識(shí)別難度無(wú)疑會(huì)更高。同時(shí),在中文中,同樣的一句話,在不同的語(yǔ)境中,具備了不同的含義,識(shí)別難度會(huì)更大,很難實(shí)現(xiàn)以自然語(yǔ)言進(jìn)行搜索,并準(zhǔn)確反饋搜索結(jié)果。
此外,為了調(diào)用語(yǔ)音、語(yǔ)義庫(kù),以更加精準(zhǔn)地理解用戶的意思,目前不少語(yǔ)音搜索服務(wù)商的做法是將用戶所說(shuō)的語(yǔ)音上傳到服務(wù)器,由服務(wù)器進(jìn)行識(shí)別,但這對(duì)網(wǎng)絡(luò)的速度、服務(wù)器的處理能力等提出了較高要求。
為了推動(dòng)手機(jī)語(yǔ)音搜索產(chǎn)品加速步入成熟階段。在現(xiàn)階段,將有諸多廠商,按照手機(jī)語(yǔ)音搜索成熟階段的理念提供相應(yīng)產(chǎn)品,并不斷優(yōu)化。這些產(chǎn)品主要包括手機(jī)輸入法、搜索框的輸入、手機(jī)語(yǔ)音應(yīng)用等。它們?cè)诔跗诨蛟S并不成熟,用戶需要努力用標(biāo)準(zhǔn)的普通話發(fā)音,而不能用自己所常使用的說(shuō)話方式,并且未必能夠得到精確的反饋結(jié)果,因此,此類產(chǎn)品往往被用戶嘗鮮式使用,并被當(dāng)作一種娛樂(lè)工具而非應(yīng)用工具,但是,在產(chǎn)品被用戶使用的過(guò)程中,廠商能夠不斷采集用戶的聲音、用戶語(yǔ)言,從而形成較為完善的語(yǔ)音庫(kù)、語(yǔ)義庫(kù),使得產(chǎn)品能夠逐步趨向成熟。同時(shí),手機(jī)語(yǔ)音搜索的另一個(gè)發(fā)展方向是音調(diào)搜索,例如用戶想搜索一首音樂(lè),但他只能記得部分的聲音片段,如果他能夠哼唱出音調(diào),那么搜索工具同樣能夠支持搜索。預(yù)計(jì)在未來(lái),此類產(chǎn)品將不斷涌現(xiàn)。