歡迎關(guān)注“創(chuàng)事記”的微信訂閱號:sinachuangshiji
文/智東西 竭渴
美國時間5月8日上午,中國時間5月9日凌晨,谷歌一年一度的I/O開發(fā)者大會在舊金山山景城開幕。在兩個小時的KeyNote演講中,谷歌著重介紹了谷歌助手(Google Assitant)、安卓新版本Android P Beta的更新,以及一些谷歌軟件(谷歌地圖、谷歌新聞、谷歌攝像頭)的更新,同時還談到了谷歌在自動駕駛領(lǐng)域和TPU芯片研發(fā)的新進(jìn)展。
谷歌將AI作為公司的重點發(fā)展方向,在這場KeyNote演講中,處處體現(xiàn)著這個特征。
谷歌首席執(zhí)行官Sundar Pichai首先登場,一上場,Sundar Pichai就談了谷歌AI在不同領(lǐng)域的應(yīng)用。
比如在醫(yī)療領(lǐng)域,谷歌AI可以在糖尿病視網(wǎng)膜病變和心血管風(fēng)險方面幫助診斷,還能幫助醫(yī)生預(yù)測患者再次入院的可能性。又例如,通過AI與NLP技術(shù),谷歌現(xiàn)在可以講兩個人同時講話時的聲音分割開來用文字顯示。而且現(xiàn)在語言殘障人士能夠通過谷歌鍵盤(G-borad)用摩斯電碼合成自己的聲音。Sundar Pichai還提到了Gmail運用AI技術(shù)生成自動回復(fù)的功能。
(Sundar Pichai介紹谷歌AI幫助醫(yī)生預(yù)測醫(yī)療事件)
這些都是谷歌在AI領(lǐng)域的一些嘗試,但大會的重點還是放在谷歌助手(Google Assitant)、安卓新版本Android P Beta上,尤其是谷歌助手,一度掀起大會現(xiàn)場的高潮。尤其是Pichai在現(xiàn)場展示的一段谷歌助手給人類打電話的視頻DEMO,無論是答案合理的回復(fù)還是高度像人的語音語調(diào),都足以騙過電話那頭的人類、以假亂真。
下面,讓我們來看看今年的谷歌,又搞了什么事情?
谷歌助手(Google Assitant)七大更新
Google Assitant的更新發(fā)布是本次大會的重點。目前,已有超過5億設(shè)備搭載Google Assitant,其中有超過5000種家居設(shè)備。Google Assitant今天的日常使用量同比翻了兩番。目前,Google Assitant進(jìn)入了80個國家,支持30余種語言。以下是Google Assitant的一些新進(jìn)展。
1、Google Assitant通過WaveNet可以合成更加自然的AI語音。目前,Google Assitant口音庫中加入了6種口音類型,適應(yīng)各地發(fā)音習(xí)慣,而且都非常自然。
(WaveNet)
2、Google Assitant支持更自然的交流。為了與用戶更好的交互,不僅是口音的多樣化,Google Assitant比原來更了解人們的生活與表達(dá)習(xí)慣。例如,用戶與Google Assitant進(jìn)行多輪對話時,不再需要每句話都以“Hey Google”開頭。這破解了之前AI語音助手難以進(jìn)行多輪對話的問題。
(開發(fā)者解釋Google Assitant如何支持更自然的交流)
3、Google Assitant能更好的執(zhí)行多重任務(wù),它能辨別出用戶發(fā)出指令中的多重并列指令,并做出相應(yīng)的反應(yīng)。
4、Google Assitant更加適用于家庭教育場景。Google Assitant可提供超過13萬兒童故事,而且新加入了Pretty please功能,鼓勵小孩對Google Assitant進(jìn)行禮貌提問。
5、Google Assitant成為了可聽化與可視化結(jié)合的助手。Google Assitant加入了Visually assistant功能,使Google Assitant不只對用戶進(jìn)行語音提示,并且在設(shè)備屏幕上顯示相應(yīng)的信息,更方便使用,例如顯示導(dǎo)航路線、顯示菜譜視頻。
(搭載Google Assitant的設(shè)備播放菜譜視頻)
6、三款搭載Google Assitant的帶屏音箱將會于今年7月上市發(fā)售,包括JBL、聯(lián)想、LG,Google旗下的YouTube資源也會向這些音箱開放。這些音箱都在今年CES上展示過。
(三款即將上市的搭載Google Assitant的帶屏音箱)
7.Google Assitant支持用戶通過它進(jìn)行訂餐與預(yù)約,Doordash、711、星巴克等餐飲品牌都與Google Assitant進(jìn)行了合作。
為了展示Google Assitant的智能化程度,谷歌首席執(zhí)行官Sundar Pichai播放了用Google Assistant打電話預(yù)約發(fā)廊服務(wù)和定餐廳的演示視頻。Google Assistant在給發(fā)廊和餐廳的真人服務(wù)員打電話進(jìn)行預(yù)約的過程中,讓人幾乎感覺不到這是AI與人的對話,而是人與人的對話。
這個功能是通過谷歌開發(fā)許久的AI系統(tǒng)Google Duplex實現(xiàn)的,目前尚處于內(nèi)測階段。但這段演示已經(jīng)吊足了人們的胃口,讓人不禁更加期待Google Assitant帶來的更多可能性。
TPU升級至3.0版本
接著我們來說說備受關(guān)注的TPU。Pichai本次宣布,谷歌TPU已經(jīng)進(jìn)化到了3.0,但是并未對此進(jìn)行太多介紹。
除了顯而易見的外形變化之外,Pichai介紹到,TPU 3.0比去年的TPU 2.0強大八倍——強大到Google需要第一次在自己的數(shù)據(jù)中心引入液冷技術(shù)。新版TPU 3.0可以支持更好、更大、更精準(zhǔn)的AI模型。
AI加持Android P Beta系統(tǒng)
Android系統(tǒng)已有10年歷史。谷歌副總裁Dave Burke上臺談到了谷歌發(fā)布的全新系統(tǒng)Android P Beta,他說,這可能是Android近幾年來最大的更新。
Dave Burke說,Android P Beta將成為谷歌把移動應(yīng)用與AI結(jié)合的主要部分。Android P Beta有這些變化:
1、預(yù)測幾個小時內(nèi)用戶要用的應(yīng)用,智能分配手機資源,節(jié)省電量;
2、根據(jù)使用環(huán)境自動調(diào)節(jié)手機屏幕亮度;
3、預(yù)測用戶行為,為用戶推薦應(yīng)用;
4、類似iPhone X的操作手勢;
5、管控用戶花在手機上的時間,比如夜晚把手機屏幕調(diào)成灰色,降低用戶對手機的欲望。
6、谷歌還特別向開發(fā)者提供了一系列和AI相關(guān)的API:ML Kit,常見的AI功能都包含其中,而且更適合不太熟悉AI技術(shù)的開發(fā)者使用。
Android P Beta首批合作伙伴中有谷歌pixel、諾基亞、vivo、OPPO、一加、小米、索尼、Essential。
(Android P Beta首批合作伙伴)
更像今日頭條的谷歌新聞(Google News)
谷歌此次推出了以AI驅(qū)動的新版Google News應(yīng)用,有三項重點關(guān)注領(lǐng)域:讓用戶時刻關(guān)注新動態(tài)、理解新聞事件全貌、享受并支持你喜愛的媒體。跟今日頭條很相似,Google News使用信息流的方式,用算法來推薦最適合你的新聞、短視頻、深度文章、相關(guān)信息等。今天,Google News已在127個國家中上線。
其中,Newscast功能會將新聞進(jìn)行梗概,幫助用戶快速了解信息。Full coverage功能則會打通網(wǎng)絡(luò)上各種散亂信息之間的時間、邏輯聯(lián)系,建立新聞專題,幫助用戶了解新聞的來龍去脈。
谷歌地圖(Google Map):AI融入地圖
目前,Google Map覆蓋220個國家,擁有超過1億用戶。谷歌將AI技術(shù)也運用到了Google Map中,使得Google Map更加智能化。
在此次大會中,谷歌表示,在這個夏天,Google Map將會接入Google Assitant,提供預(yù)計到達(dá)時間播報、聲控音樂播放等服務(wù)。
同時,Google Map推出了“Your Map(你的地圖)”服務(wù),通過機器學(xué)習(xí),結(jié)合Google Map后臺的大量數(shù)據(jù)與你個人喜好(你標(biāo)記的餐廳、地點、口味等),為你推薦最適合你的地點。
(Your Map服務(wù)示例)
此外,Google Map還能發(fā)起群組投票,讓一群人決定去哪吃飯的過程更簡單。
谷歌攝像頭(Google Lens)
此次大會對Google Lens的著墨也不少。
谷歌介紹了Google Lens如何讓攝像頭、Google Map、GPS信息進(jìn)行融合。Google Lens可以在真實街景上疊加左轉(zhuǎn)、右轉(zhuǎn)或者前行標(biāo)志,使用戶更直觀地了解到自己該怎么去往目的地。為了使用戶體驗更有趣,谷歌還開發(fā)了一只虛擬狐貍給用戶指路。
(Google Lens真實街景疊加右轉(zhuǎn)標(biāo)志)
同時Google Lens能進(jìn)行更快更準(zhǔn)確的文本識別。而且,在進(jìn)行劃詞識別后,Google Lens不僅能理解字面意思,更能了解文本的背景和相關(guān)信息等,然后對文本相關(guān)信息進(jìn)行展示。
Google Lens不僅能識別文本,而且運用通過AI加持的VPS(視覺處理系統(tǒng)),還能識別圖像、地標(biāo)、食物等。
Google Lens還推出了類似淘寶的用圖片搜索相關(guān)商品的功能。
(Google Lens圖片搜索相關(guān)商品)
而通過與AR技術(shù)的結(jié)合,Google Lens還擁有掃描海報后自動播放視頻等功能。
Waymo也來湊熱鬧
今年,谷歌的自動駕駛兄弟Waymo也來刷了一下存在感。Waymo CEO John Krafcik上臺為大家介紹了其在無人駕駛一些階段性的成果。
John Krafcik宣布Waymo無人駕駛對于行人的判斷錯誤率下降了100倍。目前Waymo的2.5萬輛車每天都在進(jìn)行測試,已完成600萬英里路測和50億英里虛擬路測,正朝著L5級自動駕駛進(jìn)發(fā)。
L5級自動駕駛是無人駕駛的終極夢想,意味著我們的汽車在任何情況下都能實現(xiàn)全自動操作。
John Krafcik談到Waymo使用的芯片時表示,Waymo目前使用了Google TensorFlow生態(tài)系統(tǒng)和最新TPU,處理速度是原先的15倍。
結(jié)語:Don’t be Evil與Digital Wellbeing
在這場大會中,在介紹種種技術(shù)與功能更新的同時,谷歌反復(fù)提及一個概念——數(shù)字和諧(Digital Wellbeing)。
谷歌的開發(fā)者們不斷強調(diào)他們的技術(shù)要更了解用戶的習(xí)慣,幫助用戶專注關(guān)鍵事務(wù)、過濾冗余信息,使用戶在使用科技設(shè)備與服務(wù)時實現(xiàn)技術(shù)與家庭生活的平衡等等。
本周剛好是Facebook、微軟、谷歌扎堆開年度大會的一周,我們不難發(fā)現(xiàn)現(xiàn)在每家巨頭在開會時都把AI放在了一個重要位置。
今年是谷歌從Mobile First轉(zhuǎn)型至AI First的第三年。在I/O大會上,Pichai已經(jīng)沒有再提這個口號,但縱觀全場,我們已經(jīng)能看到一場涉及到:AI、AR、自動駕駛、終端AI開發(fā)平臺、智能音箱產(chǎn)品、服務(wù)器AI芯片產(chǎn)品、語音助手等產(chǎn)品線的全面更新。