圖為谷歌2019年開(kāi)發(fā)者大會(huì),當(dāng)華盛頓開(kāi)始聲討硅谷公司們的隱私問(wèn)題時(shí),科技公司的每一次發(fā)聲都小心翼翼。 攝影/《財(cái)經(jīng)》記者 劉泓君?
文 | 《財(cái)經(jīng)》特派記者 劉泓君?發(fā)自美國(guó)山景城? 編輯 | 宋瑋
今年5月的谷歌開(kāi)發(fā)者大會(huì),谷歌用三天的時(shí)間發(fā)布了100個(gè)創(chuàng)新產(chǎn)品。距離谷歌從“移動(dòng)為先”轉(zhuǎn)型向“AI為先”的口號(hào)提出已經(jīng)三年,可以說(shuō)這場(chǎng)活動(dòng)表現(xiàn)出人工智能的發(fā)展進(jìn)入深水區(qū),創(chuàng)新乏善可陳;也可以說(shuō)它充滿(mǎn)了人文關(guān)懷,細(xì)節(jié)才是打動(dòng)人心的力量。
2019年是多事之年,就在谷歌開(kāi)發(fā)者大會(huì)的前一周,由于其母公司Alphabet收入增長(zhǎng)不及預(yù)期,財(cái)報(bào)之后大跌8%。對(duì)用戶(hù)隱私的保護(hù)正在動(dòng)搖用數(shù)據(jù)賺錢(qián)的廣告模式,此外,谷歌收到歐盟17億美元的天價(jià)罰單。此時(shí),對(duì)硅谷科技巨頭的反壟斷與分拆討伐不斷,F(xiàn)acebook聯(lián)合創(chuàng)始人發(fā)文建議分拆Facebook。今年,最后一批硅谷獨(dú)角獸紛紛提交上市申請(qǐng),互聯(lián)網(wǎng)高速增長(zhǎng)的紅利期結(jié)束。
在整個(gè)大環(huán)境中,這場(chǎng)開(kāi)發(fā)者大會(huì)的情緒與傳遞的信息都甚為微妙:過(guò)去五年,谷歌人工智能方面的重大技術(shù)突破,掀起沉寂許久的人工智能再次迎來(lái)高潮期,且誕生了一批獨(dú)角獸;放眼未來(lái),越來(lái)越多的模型需要大規(guī)模的數(shù)據(jù)來(lái)訓(xùn)練,當(dāng)華盛頓開(kāi)始聲討硅谷公司們的隱私問(wèn)題時(shí),這讓科技公司的每一次發(fā)聲都小心翼翼。
增長(zhǎng)放緩、隱私憂慮,比起中國(guó)互聯(lián)網(wǎng)公司以強(qiáng)運(yùn)營(yíng)作為護(hù)城河,技術(shù)驅(qū)動(dòng)的谷歌將如何走出自己的增長(zhǎng)瓶頸?這次開(kāi)發(fā)者大會(huì)可見(jiàn)一二。
搜索無(wú)處不在
在谷歌母公司Alphabet的收入結(jié)構(gòu)中,有84%以上營(yíng)收來(lái)自于廣告收入。然而,亞馬遜正在廣告市場(chǎng)蠶食谷歌的市場(chǎng)。
美國(guó)媒體CNBC曾經(jīng)報(bào)道,在購(gòu)物領(lǐng)域,廣告主正在把預(yù)算從谷歌轉(zhuǎn)移到亞馬遜,原因是在亞馬遜上投放的廣告的投入產(chǎn)出比更高,越來(lái)越多人在購(gòu)物時(shí)第一時(shí)間想到使用亞馬遜來(lái)搜索。
根據(jù)市場(chǎng)調(diào)研公司eMarketer的預(yù)測(cè),未來(lái)谷歌在廣告市場(chǎng)的市場(chǎng)份額將從38.2%下降到37.2%,這1個(gè)百分點(diǎn)將被亞馬遜取代,亞馬遜在整個(gè)廣告市場(chǎng)的份額將從2018年的6.8%上升到8.8%。預(yù)計(jì)2020年將達(dá)到10%。對(duì)未來(lái)谷歌在廣告市場(chǎng)的擔(dān)憂,以及一季度增長(zhǎng)放緩,正是谷歌財(cái)報(bào)后下跌的主要原因。
長(zhǎng)期來(lái)看,谷歌正在通過(guò)人工智能將搜索嵌入到更多場(chǎng)景中!敦(cái)經(jīng)》記者在現(xiàn)場(chǎng)試用谷歌新發(fā)布的手機(jī)Pixel 3a時(shí),拍攝一張照片,可以自動(dòng)切換Google Lens(一款圖片識(shí)別App),立刻會(huì)出現(xiàn)人物服裝、家具等購(gòu)買(mǎi)鏈接。這意味著,用戶(hù)拍照都可以成為購(gòu)物廣告。記者現(xiàn)場(chǎng)試用結(jié)果顯示,目前谷歌出現(xiàn)的相關(guān)圖片購(gòu)買(mǎi)鏈接,還無(wú)法精準(zhǔn)到原物。
未來(lái),依托谷歌的搜索技術(shù),在加入圖片與語(yǔ)音的交互之后,搜索不再只是輸入文字。谷歌在開(kāi)發(fā)者大會(huì)期間宣布了100項(xiàng)產(chǎn)品和算法上的新功能。這里,選取一些打動(dòng)人的產(chǎn)品創(chuàng)新:
基于圖片的搜索
美國(guó)絕大部分餐廳都沒(méi)有圖片,菜單是一張密密麻麻英文列表。當(dāng)你去到一家餐廳不知道吃什么的時(shí)候,不需要再通過(guò)其他App搜索,打開(kāi)Google Lens的手機(jī)攝像頭對(duì)著菜單,屏幕會(huì)出現(xiàn)哪些菜最好吃,這些會(huì)有重點(diǎn)記號(hào)顯示;當(dāng)你點(diǎn)擊一道菜的名字時(shí),谷歌還會(huì)調(diào)取谷歌地圖上的圖片,直接出現(xiàn)這道菜的圖片。
吃完飯后,只需要圖片拍攝菜單,就可以自動(dòng)計(jì)算AA制每個(gè)人應(yīng)付的錢(qián)數(shù)。
此外,谷歌還與法國(guó)的一本美食雜志合作。當(dāng)雜志上出現(xiàn)一道法式烤豬排時(shí),只要用攝像頭對(duì)著豬排的圖片,就可以在攝像頭中出現(xiàn)動(dòng)態(tài)的豬排的做法演示。
盡管這些簡(jiǎn)單的小應(yīng)用背后都需要強(qiáng)大的算法與技術(shù)支持,但這依然離不開(kāi)谷歌過(guò)往收集的數(shù)據(jù),比如菜單上的圖片就來(lái)自于用戶(hù)主動(dòng)的拍照上傳分享。而動(dòng)態(tài)的豬排做法,則需要專(zhuān)業(yè)的團(tuán)隊(duì)去制作這樣的視頻。
基于圖片識(shí)別的另一個(gè)功能是Google Go,它可以幫助識(shí)別路牌。對(duì)于語(yǔ)言不通的人來(lái)說(shuō),或者殘障人士,只要將手機(jī)攝像頭對(duì)準(zhǔn)路牌,就可以自動(dòng)將信息念出來(lái),或者將英文信息翻譯成中文,不再需要在文字搜索框內(nèi)翻譯,過(guò)去幾年,谷歌在翻譯功能和視覺(jué)識(shí)別的精準(zhǔn)度方面已經(jīng)快速提升。
在搜索具體名詞時(shí),谷歌還加入了3D圖像與AR圖像。在谷歌中搜索一雙新百倫的鞋子,可以看這雙鞋子的各個(gè)側(cè)面,包括鞋底的展示。目前,谷歌正在與NASA、新百倫、三星、沃爾沃汽車(chē)和美國(guó)超市Target、美國(guó)家具平臺(tái)Wayfair合作,在搜索結(jié)果中呈現(xiàn)更多3D圖像。
如果搜索白灰鯊魚(yú),會(huì)在手機(jī)上出現(xiàn)鯊魚(yú)的3D圖像,還可以使用點(diǎn)擊移動(dòng)功能,F(xiàn)場(chǎng)展示者就將大鯊魚(yú)的AR圖像移動(dòng)到了舞臺(tái)上。轉(zhuǎn)動(dòng)攝像頭,甚至可以通過(guò)手機(jī)看到大白鯨的牙齒。
Google Assistant語(yǔ)音助手
去年,谷歌首次推出智能語(yǔ)音助手的一款更加智能的程序Duplex,它可以模仿人的語(yǔ)氣電話訂餐、并且在機(jī)器說(shuō)話的時(shí)候加入停頓詞,可以連續(xù)發(fā)出多個(gè)請(qǐng)求,不需要每次都用“Hey Google”喚醒。谷歌資深科學(xué)家、技術(shù)大神Jeff Dean介紹稱(chēng):“僅這一個(gè)系統(tǒng)就涉及了多項(xiàng)技術(shù),包括自然語(yǔ)言處理和對(duì)話理解、語(yǔ)音識(shí)別、文本到語(yǔ)音轉(zhuǎn)換、用戶(hù)理解和有效的UI設(shè)計(jì)!
今年語(yǔ)音助手連續(xù)發(fā)出了8個(gè)指令,可支持多任務(wù)同時(shí)進(jìn)行,甚至可以讓語(yǔ)音助手挑選出相冊(cè)中在黃石國(guó)家公園有動(dòng)物的照片,甚至是有牦牛的照片。
谷歌還推出了基于網(wǎng)頁(yè)的Duplex版本,只要說(shuō)出為我下一次旅行訂車(chē),Duplex可以通過(guò)Gmail知道你喜歡的車(chē)型、訂車(chē)時(shí)間,自動(dòng)幫你完成所有需要填寫(xiě)的表單,全程不需要手動(dòng)輸入,這項(xiàng)功能將在今年下半年上線。
當(dāng)你告訴語(yǔ)音助手:“導(dǎo)航去媽媽的家”,其中“媽媽的家”可能是一家餐廳的名字,也可能真的是你母親的住所。谷歌可以識(shí)別這些個(gè)性化信息。
考慮到強(qiáng)大的“填表機(jī)器人”可能比用戶(hù)更清楚地記得自己的信用卡賬戶(hù)、媽媽家的地址、航班和出行的詳細(xì)訂單,在隱私問(wèn)題頻繁出現(xiàn)的硅谷,需要用戶(hù)自己在語(yǔ)音助手中設(shè)置個(gè)性化信息。
不過(guò),這些新技術(shù)的展示就好比泡面盒子上的展示圖片與真實(shí)圖片的差距。在去年的現(xiàn)場(chǎng)展示中,Duplex在幫助人類(lèi)訂餐時(shí),甚至可以模仿人的語(yǔ)氣詞,以至于餐廳老板也無(wú)法確認(rèn),背后到底是一個(gè)人還是機(jī)器人。
但在真實(shí)的應(yīng)用中,谷歌承認(rèn)Duplex有25%的電話是人打出去的,而不是真正的語(yǔ)音助手,在機(jī)器打出去的電話中,15%會(huì)受到人的干預(yù),F(xiàn)場(chǎng)多數(shù)人在看完演示以后,會(huì)很簡(jiǎn)單地以為這個(gè)機(jī)器人無(wú)所不能,真相是,它最擅長(zhǎng)的功能就是“預(yù)訂餐廳”,因?yàn)楣雀枰恢痹诜磸?fù)訓(xùn)練它,盡管如此,它有時(shí)候還做不到那么好。
今年,語(yǔ)音助手還將加入到谷歌地圖中。只要說(shuō)出“Let’s Drive”,就可以通過(guò)車(chē)內(nèi)環(huán)境語(yǔ)音打開(kāi)Youtube上的音樂(lè)、決定是否接電話?梢源_定的是,通過(guò)語(yǔ)音直接調(diào)取應(yīng)用程序越來(lái)越主流,語(yǔ)音正在成為下一個(gè)入口。
關(guān)愛(ài)特殊人群
谷歌的價(jià)值觀是:“讓所有人都可以享受技術(shù)的便利,而不是一部分人。”今年,谷歌也推出了很多使用科技幫助殘障人士的新功能。最終,這些幫助殘障人士溝通的新技術(shù)進(jìn)展,也可以給普通人在特定場(chǎng)景下使用。
Steve Saling患漸凍癥已經(jīng)有13年,這種病在發(fā)病后肌肉僵硬、抽搐、說(shuō)話或者吞咽困難,四肢開(kāi)始逐漸無(wú)力,最終喪失自主運(yùn)動(dòng)的能力,著名物理學(xué)家霍金就患有此病。
谷歌通過(guò)識(shí)別Steve的面部表情,來(lái)訓(xùn)練機(jī)器學(xué)習(xí)的模型。最終他只需要稍稍做出不同的面部表情,就可以操作谷歌智能家居設(shè)備Google Home。
這個(gè)項(xiàng)目名為Project Euphonia,由失聰設(shè)計(jì)師Elise Roy與哈佛教授Michael Brenner共同研發(fā),但它需要盡可能多的聲音樣本。
谷歌語(yǔ)音研究員Dimitri Kanevsky就是一名聽(tīng)力障礙者,失聰后才開(kāi)始學(xué)習(xí)英文,因此在谷歌現(xiàn)場(chǎng)播放的大屏幕上,完全無(wú)法聽(tīng)清楚他在說(shuō)什么——這段英語(yǔ)發(fā)音模糊,單詞輸出不清晰,無(wú)法與人溝通。于是,他錄入了1.5萬(wàn)條自己的語(yǔ)音模型訓(xùn)練,最終,機(jī)器可以準(zhǔn)確識(shí)別他的聲音與講話方式。但這種個(gè)例并不具有普適性,谷歌正在尋找更多的樣本為殘障人士提供交流渠道。
谷歌還研發(fā)有一項(xiàng)Live Caption系統(tǒng):你所說(shuō)的話字幕會(huì)實(shí)時(shí)出現(xiàn)在手機(jī)屏幕上,這樣失聰?shù)娜司涂梢酝ㄟ^(guò)文字“聽(tīng)”到語(yǔ)音電話了。除了給殘障人士使用,這項(xiàng)場(chǎng)景應(yīng)用廣泛,比如在嘈雜的酒吧看球賽或者電視(美國(guó)電視都不帶字幕),或者不太方便收聽(tīng)電話時(shí)均可使用,語(yǔ)音可以實(shí)時(shí)轉(zhuǎn)換成文字。
如今,這個(gè)功能已經(jīng)在Youtube視頻網(wǎng)站上應(yīng)用,對(duì)于沒(méi)有字幕的美劇,在屏幕下方點(diǎn)擊字幕,就可以出現(xiàn)谷歌根據(jù)語(yǔ)音出現(xiàn)的字幕。但事實(shí)上,字幕的實(shí)時(shí)識(shí)別并不是什么新功能,美國(guó)的用戶(hù)很早就可以選擇在Youtube上添加字幕了。一位現(xiàn)場(chǎng)的開(kāi)發(fā)者很明顯地感覺(jué)到:“谷歌的識(shí)別準(zhǔn)確率提升很快!
在互聯(lián)網(wǎng)時(shí)代,谷歌的第一次商業(yè)模式是通過(guò)搜索賣(mài)廣告賺錢(qián);在移動(dòng)時(shí)代,谷歌抓住了安卓的機(jī)會(huì)。如今,谷歌正在通過(guò)圖片與語(yǔ)音的識(shí)別技術(shù),改變搜索的方式,并將人工智能悄無(wú)聲息地嵌入更多場(chǎng)景中。
硬件戰(zhàn)爭(zhēng)
語(yǔ)音與圖片技術(shù)的發(fā)展也在帶來(lái)用戶(hù)使用習(xí)慣的改變。拍照是搜索,說(shuō)話是搜索,看菜單、訂車(chē)都可以是搜索。在硅谷,很多人使用智能手機(jī)的習(xí)慣已經(jīng)改變:“Hey Google,明天早上8點(diǎn)開(kāi)會(huì)!薄癝iri,打開(kāi)微信。”他們習(xí)慣對(duì)著安卓或者蘋(píng)果用語(yǔ)音打開(kāi)手機(jī)應(yīng)用程序,而不再是滑動(dòng)屏幕找APP。
過(guò)去,智能語(yǔ)音助手在五大科技巨頭之間角力并不是什么新鮮事:蘋(píng)果的Siri、亞馬遜的Alexa、微軟Cortana,以及Facebook的Massager M和Google的Assistant,這些各大公司研發(fā)的語(yǔ)音助手,都在尋找落地場(chǎng)景。在語(yǔ)音產(chǎn)品上,過(guò)去兩年競(jìng)爭(zhēng)最激烈的新硬件領(lǐng)域就是智能音箱。
Google Assistant是軟件,Google Home是智能音箱硬件,Duplex又是Assistant軟件中的一個(gè)Google開(kāi)發(fā)的語(yǔ)音應(yīng)用程序;同時(shí)語(yǔ)音助手也可以調(diào)動(dòng)很多其他應(yīng)用程序,可以看成是語(yǔ)音小程序Actions。
在智能語(yǔ)音市場(chǎng)上,除了發(fā)布手機(jī)之外,家庭智能硬件的競(jìng)爭(zhēng)越來(lái)越激烈,過(guò)去主要是谷歌與亞馬遜的較量。亞馬遜最先行動(dòng),從2014年開(kāi)始開(kāi)發(fā)智能音箱,盡管技術(shù)上不如谷歌,但一直牢牢占據(jù)著過(guò)半的智能音箱市場(chǎng)。2016年之后,谷歌醒過(guò)來(lái)開(kāi)發(fā)智能語(yǔ)音助手。過(guò)去三年的谷歌開(kāi)發(fā)者大會(huì),谷歌語(yǔ)音助手搶占了主題演講最多的風(fēng)頭。
一位同時(shí)使用過(guò)谷歌與亞馬遜智能音箱的開(kāi)發(fā)者評(píng)價(jià)稱(chēng):“亞馬遜的智能音箱發(fā)行比較早,能夠控制的智能設(shè)備更多;但谷歌智能音箱的技術(shù)更好,在一些開(kāi)放性問(wèn)題的回答上,明顯智能很多。”一位房地產(chǎn)銷(xiāo)售人員稱(chēng):“在谷歌公司旁邊的新樓盤(pán),已經(jīng)在房子里內(nèi)置了亞馬遜Alexa,用來(lái)遙控家里各種設(shè)備!
2018年,是谷歌逆襲的關(guān)鍵一年。它用29.9美元低價(jià)的Google Home Mini智能音箱搶占盡可能多的智能家居市場(chǎng),谷歌很快將市場(chǎng)份額從23.8%提升至29.5%。Voicebot研究機(jī)構(gòu)曾經(jīng)預(yù)言,到2022年,預(yù)計(jì)谷歌智能硬件產(chǎn)品將超過(guò)亞馬遜,形成48%比37%的市場(chǎng)格局。
早期,谷歌語(yǔ)音助手內(nèi)置于谷歌Pixel手機(jī)中,后來(lái)還出了iOS與安卓的App。接下來(lái),谷歌將語(yǔ)音助手應(yīng)用于開(kāi)發(fā)的兩款智能音箱產(chǎn)品中:Google Home與Google Home mini。如今,谷歌的新算法可以幫助新一代的智能助理在設(shè)備上以高達(dá)10倍的速度來(lái)回答問(wèn)題,延遲幾乎為零,新一代的智能語(yǔ)音助手將出現(xiàn)在今年晚些時(shí)候推出的Pixel 3手機(jī)上。
未來(lái),谷歌還將與汽車(chē)廠商合作,在更多汽車(chē)上安裝語(yǔ)音助手。當(dāng)你在駕駛時(shí),谷歌語(yǔ)音助手可以開(kāi)啟智能駕駛模式,新的儀表盤(pán)會(huì)在開(kāi)車(chē)時(shí)自動(dòng)啟動(dòng),通過(guò)語(yǔ)音控制導(dǎo)航、信息和電話、多媒體。除此之外,甚至還可以用它遠(yuǎn)程控制汽車(chē),比如調(diào)節(jié)車(chē)內(nèi)的溫度、檢測(cè)燃油油位,或者在房間里鎖車(chē)。
另一個(gè)趨勢(shì)是,在智能音箱布局完成以后,硅谷巨頭們紛紛醞釀以客廳和廚房為中心的帶顯示屏的智能設(shè)備。一位谷歌工程師告訴《財(cái)經(jīng)》記者:“有很多場(chǎng)景無(wú)法通過(guò)語(yǔ)音來(lái)解決,語(yǔ)音在識(shí)別上還有一些誤區(qū),屏幕的存在可以幫助糾正聲音指令,也會(huì)有更多的應(yīng)用場(chǎng)景。”
今年的幾個(gè)開(kāi)發(fā)者大會(huì)上,谷歌發(fā)布了帶有屏幕的Nest Hub,它可以給家人打電話、看美劇,尤其適合廚房與家庭硬件設(shè)備。Facebook也發(fā)布了適合廚房與客廳的硬件設(shè)備Portal,但在語(yǔ)音助手的合作上,普通的應(yīng)用場(chǎng)景Facebook選擇了自己的語(yǔ)音助手,而購(gòu)物場(chǎng)景則與亞馬遜Alexa合作。
谷歌從2016年開(kāi)始研究語(yǔ)音助手,2017年推出了基于語(yǔ)音助手調(diào)動(dòng)的小程序Actions。2017年4月,谷歌還僅僅只有175個(gè)Actions,到如今已經(jīng)有4253個(gè)Actions。與之對(duì)比,亞馬遜有6萬(wàn)多個(gè)Skills小程序。
在谷歌的園區(qū),語(yǔ)音助手的體驗(yàn)區(qū)會(huì)詳細(xì)教開(kāi)發(fā)者如何來(lái)設(shè)計(jì)基于聲音的交互。經(jīng)過(guò)近四年的發(fā)展,谷歌將語(yǔ)音助手如同第三方設(shè)備一樣,開(kāi)放給很多第三方合作伙伴。目前,已經(jīng)在超過(guò)10億臺(tái)設(shè)備、在80多個(gè)國(guó)家以30多種語(yǔ)言開(kāi)始使用。
谷歌CEO SundarPichai在活動(dòng)一開(kāi)始就展示了現(xiàn)場(chǎng)的AR地圖和導(dǎo)航功能,這讓這次開(kāi)發(fā)者大會(huì)看起來(lái)像一個(gè)充滿(mǎn)未來(lái)感的樂(lè)園。
這樣的AR導(dǎo)航對(duì)找不到方向的人來(lái)說(shuō)提供了很多便利。記者在現(xiàn)場(chǎng)打開(kāi)AR地圖,除了經(jīng)常掉線跳出,在不到兩分鐘的時(shí)間里,手機(jī)電量從31%掉到了15%。盡管谷歌每年的開(kāi)發(fā)者大會(huì)演示的新功能都很炫酷,應(yīng)用到現(xiàn)實(shí)還有很多要解決的問(wèn)題。
新技術(shù)應(yīng)用困境也是谷歌商業(yè)探索的折射,很多新的商業(yè)模式起源于細(xì)分領(lǐng)域的技術(shù)突破,這是長(zhǎng)期探索的過(guò)程,短期內(nèi)還要克服很多難題,無(wú)人駕駛Waymo的誕生就是個(gè)典型的例子。
這正如獨(dú)立股票研究機(jī)構(gòu)Valuentum Securities分析師CallumTurcan所說(shuō):“Alphabet的公允價(jià)值被下調(diào),部分原因是該公司進(jìn)入了收入增長(zhǎng)放緩期;但我們非常樂(lè)觀地認(rèn)為,Alphabet是一個(gè)長(zhǎng)期投資機(jī)會(huì)!
(本文首刊于2019年6月3日出版的《財(cái)經(jīng)》雜志)