很多技術(shù)本身并不難,難的是技術(shù)之后的大規(guī)模普遍商業(yè)化。
方世彤 獨(dú)立新媒體觀察、研究者
“我可以送你回家嗎?”
“太好了,不過我是要坐奔馳車的哦!
“我們?nèi)コ燥埌。?/p>
“好的,出門左拐,兩百米外的酸辣粉是我的最愛。如果你用手機(jī)簽到,還能打八折!
iPhone 4S上市,大家聽說過、沒玩過的Siri迅速成為眾人調(diào)戲的對(duì)象。這樣的用戶體驗(yàn)確實(shí)不錯(cuò)。一個(gè)會(huì)聽懂你說話,同時(shí)能和你對(duì)話的應(yīng)用一下子博得大家的好感。輿論評(píng)論說,許多人將會(huì)因?yàn)檫@一項(xiàng)應(yīng)用而用iPhone 4S替代iPhone 4。
這一次又是蘋果點(diǎn)燃了這場(chǎng)語音識(shí)別的大火。
擁有眾多語音識(shí)別方面專利的公司Nuance現(xiàn)在大熱,網(wǎng)上熱傳他們和谷歌,或者蘋果都有緊密的關(guān)系。畢竟人家擁有許多專利,和這些公司在語音方面有交集也非常正!,F(xiàn)在連我們國家的中興通訊也證實(shí)正在與Nuance緊密合作。
QQ2011正式推出,其中的輸入法就提供了聽讀,雖然反應(yīng)速度還嫌慢些,但也算是趕上了這個(gè)潮流。把早已推出該項(xiàng)技術(shù)的“科大訊飛”的市場(chǎng)之路又給擋住。語音識(shí)別算不上什么新鮮的技術(shù),正如觸控當(dāng)初也不算什么新鮮的技術(shù)。李開復(fù)博士曾經(jīng)研發(fā)的Sphinx就是世界上最早的語音識(shí)別系統(tǒng)。
但是如果拿原始的那些技術(shù)給消費(fèi)者,卻是真要折磨死普羅大眾。早先微軟的Windows 7推出,就提出可以使用語音命令。但是由于這項(xiàng)功能挺傻的,誰自言自語工作呢?所以這項(xiàng)功能沒有普及。而在導(dǎo)航儀上能使用語音的功能更是用之者寥寥。只有當(dāng)這些技術(shù)以適應(yīng)普通用戶體驗(yàn)的方式呈現(xiàn)時(shí),這些技術(shù)才能迅速地普及開來,并深刻地改變某些產(chǎn)品領(lǐng)域。
這是一個(gè)古老的命題。改變這一切的還是蘋果,還是喬布斯。借助iPhone 4S“聽說”正在成為一項(xiàng)被市場(chǎng)追捧的,繼觸控之后的又一項(xiàng)超級(jí)用戶體驗(yàn)工具。換句話說,如果不是蘋果和喬布斯將這項(xiàng)十多年前就已經(jīng)出現(xiàn)的技術(shù),運(yùn)用到淋漓盡致。“聽說”遠(yuǎn)不會(huì)有今天受人追捧的成就。
除此之外,在音樂識(shí)別方面,MusicHound是許多音樂愛好者的最愛,這項(xiàng)iPhone和iPad的應(yīng)用能夠識(shí)別任意音樂片段,并提供相關(guān)信息及Youtube等網(wǎng)站上的播放鏈接。更妙的是你哼唱的話,它也可以識(shí)別。而另一項(xiàng)應(yīng)用Shazam也具備同樣的能力,不一樣的是,人們?yōu)樗鼘ふ业搅伺c聽音樂不一樣的應(yīng)用,并且成功地推向市場(chǎng)。這就是“聽廣告簽到”。Shazam可以聽到廣告內(nèi)容,在識(shí)別的過程中,可以為開啟此項(xiàng)應(yīng)用的用戶提供優(yōu)惠券,積分等獎(jiǎng)勵(lì)。使得這項(xiàng)技術(shù)獲得市場(chǎng)的認(rèn)可,并且得到推廣與普及。
早前一家名為IntoNow的公司推出他們聽聲簽到技術(shù)(即聽電視節(jié)目的聲音實(shí)現(xiàn)電視節(jié)目簽到技術(shù))不過三個(gè)月就被雅虎公司以迅雷不及掩耳之勢(shì)收購。這其實(shí)正說明此項(xiàng)技術(shù)正被業(yè)界緊密的關(guān)注,但凡有一點(diǎn)突破和特點(diǎn),就會(huì)被大公司迅速招安。而大公司背后一定是要推出更加符合用戶體驗(yàn)需求的產(chǎn)品。我們有理由想象這項(xiàng)技術(shù)在廣告方面的作用。它能為廣告主提供精準(zhǔn)的客戶,并進(jìn)行精準(zhǔn)的B2C營銷服務(wù)。而這里面的價(jià)值確實(shí)將會(huì)是非常龐大的。
在圖形識(shí)別技術(shù)方面,人類的研究已經(jīng)快到一個(gè)頂點(diǎn),從早期的條形碼識(shí)別,到后來的二維碼識(shí)別,再到彩碼識(shí)別,識(shí)別從有形到無形,幾乎無所不能。而這些的進(jìn)步無一不是在改善著人們的用戶體驗(yàn)。而笑臉識(shí)別,任意圖形識(shí)別,AR技術(shù)都在帶來一些全新的應(yīng)用和人們對(duì)看的體驗(yàn)的革命。聯(lián)想去年和一家國外公司合作推出了肢殘人使用的筆記本電腦,能夠用眼球的運(yùn)動(dòng)來控制鼠標(biāo)。這樣的應(yīng)用立時(shí)得到市場(chǎng)的積極反應(yīng)。而這樣的技術(shù)也給殘疾人帶來了更好使用電腦的福音。而在近日發(fā)布的安卓4.0更創(chuàng)新地可以實(shí)現(xiàn)人臉識(shí)別啟動(dòng)手機(jī)的功能。
我們見證的是用戶體驗(yàn)的不斷被滿足,人機(jī)互動(dòng)越來越流暢。而這些體驗(yàn)的滿足與不被滿足的界限往往只是在一兩秒之間。如果聽你的聲音,再識(shí)別,并能夠回答你的時(shí)間過長,你絕對(duì)不會(huì)喜歡的。但是為了縮短這樣的時(shí)間,研發(fā)人員必須要想出許多辦法。而我們以前總說某某技術(shù)不難,我們誰誰都可以做。但是真到了產(chǎn)品階段,卻難以產(chǎn)生令用戶買單的結(jié)果。這顯然正在改變我們的固有思維,正在告訴我們,不成功的原因。
整個(gè)IT業(yè)的發(fā)展歷程更像是個(gè)人機(jī)對(duì)話的提升過程,從最早的各種語言程序,到后來的可視化的操作系統(tǒng),再到今天的云計(jì)算,圖形及聲音的識(shí)別。我們正在用這些人機(jī)對(duì)話來改善我們?cè)趥鹘y(tǒng)業(yè)務(wù)中的操作。以廣告為例,它將從原來的浪費(fèi)式刊出形式,轉(zhuǎn)變?yōu)楦尤诵曰馁N身服務(wù)。從Siri聰明的回答中,我們可以想象的是眾多廣告主將要奪取Siri話語權(quán)。