一名“佛系”大模型創(chuàng)業(yè)者:行業(yè)很卷,但我不考慮融資

“員工做錯(cuò)了,我恨不得跟他說(shuō)5遍,就像用GPT一樣一直重復(fù),直到讓他理解記住為止!

文|《中國(guó)企業(yè)家》記者 孔月昕

編輯|馬吉英

頭圖攝影|鄧攀

與王慧文、王小川、李開(kāi)復(fù)等投身大模型的創(chuàng)業(yè)者相比,出門(mén)問(wèn)問(wèn)創(chuàng)始人、CEO李志飛的身上,缺少了點(diǎn)“明星”光環(huán);但靠著一直以來(lái)在AI領(lǐng)域的積累,他在這一波AI創(chuàng)業(yè)中“搶跑”了。

曾有友人評(píng)價(jià)他,“每次都能無(wú)比準(zhǔn)確地踩在一個(gè)點(diǎn)上,并且有備而來(lái)!

2012年10月,李志飛從美國(guó)谷歌總部離職后,回國(guó)創(chuàng)立了出門(mén)問(wèn)問(wèn)。彼時(shí),他既沒(méi)有團(tuán)隊(duì)也沒(méi)有產(chǎn)品,用一個(gè)簡(jiǎn)單的demo打動(dòng)了紅杉資本和真格基金,拿到了1000萬(wàn)元天使輪融資。隨后,李志飛在AI創(chuàng)業(yè)道路上一路狂奔,5年內(nèi)完成了五輪融資,項(xiàng)目估值一度高達(dá)10億美元。

在李志飛看來(lái),創(chuàng)業(yè)最迷人的地方在于,創(chuàng)業(yè)者能夠在別人看不到機(jī)會(huì)和希望的時(shí)刻,自己找到一條破題的路。他自己的親身經(jīng)歷也可以證明這一點(diǎn),“2015年,在我不知道怎么商業(yè)化的時(shí)候,我想到了做智能硬件,雖然這條路不一定準(zhǔn)確,但在當(dāng)時(shí)看確實(shí)是一個(gè)surprise;2019、2020年,當(dāng)別人覺(jué)得我們陷入智能硬件的‘坑’里出不來(lái)時(shí),我又借助SaaS服務(wù)擴(kuò)大了營(yíng)收規(guī)模;2020年,我們有意無(wú)意地投入了生成式AI,并嘗試商業(yè)化,為大模型研發(fā)打下了基礎(chǔ)!

在數(shù)次“化險(xiǎn)為夷”背后,李志飛也幾度遭遇打擊。在公司經(jīng)營(yíng)上,他“栽過(guò)急速擴(kuò)張的跟頭”,不得已只能裁員;他也從技術(shù)角度對(duì)AI的價(jià)值產(chǎn)生過(guò)困惑;在2020年底就開(kāi)始做大模型,但又沒(méi)有選擇大力推進(jìn)……

“AI可以打敗世界上最聰明的一類人如圍棋手,卻學(xué)不會(huì)連五歲小孩都會(huì)的自然語(yǔ)言對(duì)話,為什么呢?” 2017年接受《中國(guó)企業(yè)家》采訪時(shí),他稱給自己提出過(guò)這樣的問(wèn)題。

而ChatGPT的面世,解釋了李志飛多年來(lái)的困惑,讓他無(wú)比興奮,他覺(jué)得自己的時(shí)代到了。今年2月,在ChatGPT引發(fā)科技圈、創(chuàng)投圈討論熱潮的時(shí)候,李志飛也表示自己要進(jìn)行大模型創(chuàng)業(yè),做“中國(guó)的OpenAI”。

“未來(lái)大模型賽道會(huì)非常卷!3月底,在北京辦公室接受《中國(guó)企業(yè)家》采訪時(shí),李志飛預(yù)測(cè)道,“我認(rèn)為一兩年后,中國(guó)至少50家以上公司都會(huì)擁有自己的大模型! 這也帶給李志飛更多信心,“大模型的落地是一件長(zhǎng)期主義的事情!痹谒磥(lái),經(jīng)過(guò)十年發(fā)展的出門(mén)問(wèn)問(wèn)在生成式AI領(lǐng)域,“已經(jīng)有了技術(shù)的積累和應(yīng)用落地的優(yōu)勢(shì)”。

李志飛還透露,4月20日,出門(mén)問(wèn)問(wèn)AIGC戰(zhàn)略發(fā)布會(huì)將在北京舉行,他將攜出門(mén)問(wèn)問(wèn)的自主中文大模型和面向全球創(chuàng)作者的AIGC產(chǎn)品亮相。

以下為李志飛的采訪整理,有刪節(jié)。

世界觀被顛覆了

剛剛得知OpenAI做出ChatGPT的消息時(shí),我特別興奮。

早在10年前,甚至讀博士期間,我就已經(jīng)在思考AI的認(rèn)知問(wèn)題,但一直沒(méi)找到答案。所以當(dāng)OpenAI的ChatGPT可以自然地進(jìn)行上下文對(duì)話,且隨便聊都不會(huì)被問(wèn)倒時(shí),我覺(jué)得自己的世界觀被顛覆了。

因?yàn)樗粏螁问悄茉谝?guī)則和邊界很清晰的環(huán)境里計(jì)算下象棋/圍棋的程序,還解決了在我們看來(lái)最難的問(wèn)題――認(rèn)知,并學(xué)會(huì)了用自然語(yǔ)言跟人交互。在微軟那篇《AGI的火花:GPT-4早期實(shí)驗(yàn)》的最新論文里,GPT-4還幫人寫(xiě)了一道很多大學(xué)生都做不出的動(dòng)態(tài)規(guī)劃程序題,我自己看到那道題都想了一會(huì)兒。

這些讓我成為AGI的無(wú)腦支持者的同時(shí),也對(duì)ChatGPT和OpenAI產(chǎn)生了巨大的好奇心:ChatGPT到底是怎么做出來(lái)的?為什么是OpenAI而不是別人?帶著這兩個(gè)疑問(wèn),我在春節(jié)后第二天飛往美國(guó),和很多人聊,其中就包括OpenAI的工程師。

聊過(guò)之后我發(fā)現(xiàn),ChatGPT不是單純地靠很多聰明人以及前沿的技術(shù)去實(shí)現(xiàn)的。在硅谷,天才到處都是,Google Brain更是有超過(guò)1000個(gè)博士在專門(mén)研究AI,而且ChatGPT的底層技術(shù)中的Transformer、Instruction Tuning等都是谷歌研發(fā)的。

但為什么是OpenAI?我覺(jué)得核心是因?yàn)樗麄儎?chuàng)造了一個(gè)環(huán)境,既有top down的規(guī)劃,高層對(duì)AI有足夠強(qiáng)的信念,堅(jiān)持不動(dòng)搖;又有bottom up的執(zhí)行,員工可以完美執(zhí)行這些規(guī)劃,兩種因素疊加造就了OpenAI能夠在這一路徑上走得長(zhǎng)遠(yuǎn)。并且,從GPT-3開(kāi)始,OpenAI就得到了正向的反饋,這也鼓勵(lì)他們?cè)谶@個(gè)方向上不斷迭代,越來(lái)越強(qiáng)。

這種極度的興奮感持續(xù)了近兩個(gè)月。不僅是我,前兩個(gè)月所有人都很急,大家都怕被大浪卷走。

但我現(xiàn)在的心態(tài)比前兩個(gè)月好很多,也冷靜得多。ChatGPT并不完美,關(guān)于它的落地,有太多問(wèn)題需要解決,實(shí)現(xiàn)AGI是一件長(zhǎng)期主義的事情?赡芪磥(lái)5~10年,我都要all in其中。我能做的,就是在理性狀態(tài)下,把這件事做好,同時(shí)也經(jīng)營(yíng)好公司。因?yàn)橛?xùn)練大模型一直是我們的企業(yè)行為,而非我個(gè)人,所以在投入上得理性。

在大模型創(chuàng)業(yè)上,我們其實(shí)早有準(zhǔn)備。很多近一年成立的生成式AI的公司,整個(gè)團(tuán)隊(duì)可能就幾十個(gè)人,我們公司有幾百人。2020年GPT-3剛出來(lái)時(shí),我們就開(kāi)始嘗試做大模型,2022年9月ChatGPT還沒(méi)有問(wèn)世時(shí),我們已經(jīng)嘗試做大模型的應(yīng)用落地,當(dāng)時(shí)是被Jasper.AI啟發(fā),我覺(jué)得內(nèi)容生成才是最適合GPT-3落地的應(yīng)用。我當(dāng)時(shí)和團(tuán)隊(duì)溝通,不能只做應(yīng)用,我們一定要夯實(shí)自己的大模型能力,于是我們開(kāi)始重新做長(zhǎng)期規(guī)劃。

很多人聽(tīng)了OpenAI的投入后會(huì)產(chǎn)生一種誤解,覺(jué)得大模型研發(fā)訓(xùn)練要10億美元,但我們做的偏落地,因此我們不見(jiàn)得需要10億美元。

盡管很多投資人對(duì)我的項(xiàng)目感興趣,但我依然覺(jué)得,我們公司有足夠的錢(qián)去做自己想要做的事情。除非是我自己?jiǎn)为?dú)出來(lái)做這件事,否則投資人要看的是出門(mén)問(wèn)問(wèn)整體的狀況,包括公司估值、未來(lái)故事、商業(yè)模式等,這些加起來(lái)就會(huì)變得很復(fù)雜,因此我目前沒(méi)有考慮融資的事情。

目前國(guó)內(nèi)還沒(méi)有探索AI能力天花板的充足環(huán)境,因此在公司層面,我更多考慮的是AI應(yīng)用和落地,能夠解決真正的問(wèn)題,AGI變得越平民化越好,這也更適合出門(mén)問(wèn)問(wèn)現(xiàn)在的狀態(tài)。

至于AGI未來(lái)的形態(tài)以及技術(shù)的演化,它只是我個(gè)人的研究興趣。畢竟,OpenAI這種能夠探索AI能力天花板的公司,在全世界都是鳳毛麟角的;復(fù)制或重做一個(gè)中國(guó)的OpenAI,既沒(méi)有那么大的價(jià)值,也沒(méi)有那么大的概率。

我覺(jué)得我們現(xiàn)在的狀態(tài)是最好的。雖然沒(méi)有OpenAI的“特種軍”,但我有一支“常規(guī)軍”,包含訓(xùn)練模型、產(chǎn)品研發(fā)、商業(yè)化等部門(mén),可以跟上技術(shù)潮流不斷去迭代。我們有幾款產(chǎn)品跟生成AI有很大關(guān)聯(lián)。除了語(yǔ)音助手這一拳頭產(chǎn)品外,我們還做過(guò)很多AIGC產(chǎn)品,比如AI聲音平臺(tái)“魔音工坊”、AI寫(xiě)作平臺(tái)“奇妙文”、AI繪畫(huà)平臺(tái)“言之畫(huà)”、數(shù)字人(8.960, 0.04, 0.45%)視頻與直播平臺(tái)“奇妙元”等,能打通從大模型到產(chǎn)品到商業(yè)化的商業(yè)閉環(huán),且擁有很好的營(yíng)收規(guī)模,這可能在全世界都是獨(dú)一無(wú)二的。

其次,我不會(huì)為了融資去給資本講很多故事,某種程度上迎合資本不可避免地會(huì)導(dǎo)致變形,我們有自己的產(chǎn)品和落地場(chǎng)景,這是我們最好的地方。從長(zhǎng)期來(lái)看,我們的優(yōu)勢(shì)在于堅(jiān)信AI,未來(lái)5年時(shí)間我們可以為它不停地迭代,然后比較長(zhǎng)期地做這件事。

還有一點(diǎn)優(yōu)勢(shì)在于,國(guó)內(nèi)AIGC創(chuàng)業(yè)CEO里,我能看懂所有的前沿論文,也清楚整個(gè)語(yǔ)言模型的發(fā)展歷程及其理論進(jìn)化的來(lái)龍去脈,我肯定比絕大部分CEO更懂這些東西。

調(diào)整力度最大的一年

盡管我現(xiàn)在堅(jiān)定不移地相信AI,對(duì)長(zhǎng)期主義保持了樂(lè)觀心態(tài),但其實(shí)幾年前我特別悲觀。

2020年之前,我沒(méi)那么信AI,雖然我們是一家AI公司,但我既不堅(jiān)信這個(gè)東西一定能夠做得好,也不認(rèn)為它會(huì)給社會(huì)帶來(lái)巨大的價(jià)值。有時(shí)我甚至?xí),“有生之年我都看不到AGI(通用人工智能)了”。

2019年之后,我甚至不想對(duì)外發(fā)聲了,覺(jué)得很多時(shí)候說(shuō)話沒(méi)有意義,既改變不了行業(yè),也改變不了大家對(duì)AI的普遍認(rèn)知,除非能證明自己比別人厲害,否則就是浪費(fèi)時(shí)間。

除了對(duì)技術(shù)的失望外,2019年也是我和公司發(fā)展的一個(gè)低谷期。

最初創(chuàng)業(yè)時(shí),尤其是2017年前,我一股腦地投入到技術(shù)、產(chǎn)品的研發(fā)和商業(yè)化上,完全不care其他東西。但到了2018年,尤其是2019年后,我感覺(jué)自己見(jiàn)到了商業(yè)或者說(shuō)創(chuàng)業(yè)的真相,發(fā)現(xiàn)想要變成一家賺錢(qián)的科技公司,沒(méi)那么容易。

過(guò)往因?yàn)锳I商業(yè)模式的問(wèn)題,很多營(yíng)收并不可持續(xù)。如果繼續(xù)投入,只會(huì)飲鴆止渴、越陷越深,從而把自己禁錮住。

看到真相后,經(jīng)慎重考慮,在2019年,我對(duì)出門(mén)問(wèn)問(wèn)進(jìn)行了一輪大的調(diào)整,精簡(jiǎn)了業(yè)務(wù)線,放棄部分虧錢(qián)的to B項(xiàng)目以及智能硬件等業(yè)務(wù)。

2020年,我又進(jìn)行了一輪大的調(diào)整,甚至可以說(shuō)這一年是調(diào)整力度最大的一年。幸運(yùn)的是,由于我們及時(shí)地進(jìn)行業(yè)務(wù)線調(diào)整,有了多出來(lái)的人手,一部分產(chǎn)品經(jīng)理在2020年初開(kāi)始做AIGC領(lǐng)域的嘗試,并積累了AI生成方面的經(jīng)驗(yàn)。

同時(shí),2020年OpenAI的GPT-3橫空出世后帶來(lái)行業(yè)巨變,直接推動(dòng)了我信仰的轉(zhuǎn)變,讓我見(jiàn)到了AGI實(shí)現(xiàn)的可能,我也重新燃起了探索AGI的興趣。

2021年,我在公司內(nèi)組建了一個(gè)十幾人團(tuán)隊(duì),拿出不超過(guò)一百萬(wàn)美元的算力費(fèi)用,訓(xùn)練出了一個(gè)60億參數(shù)的模型。由于當(dāng)時(shí)大家參考的都是GPT-3,對(duì)比之下,我們60億模型的“舉一反三”能力很弱,這讓我們很絕望,覺(jué)得太難了。因此我們直接下了結(jié)論,60億模型根本涌現(xiàn)不出in-context learning(上下文學(xué)習(xí))能力。

還有一點(diǎn),如果要進(jìn)一步增大參數(shù)規(guī)模,訓(xùn)練一個(gè)千億級(jí)別的規(guī)模,就太燒錢(qián)了。因?yàn)镺penAI,大家都知道了,1750億參數(shù)的模型,訓(xùn)練一次就要400多萬(wàn)美元,而且需要多次訓(xùn)練才有可能成功,這個(gè)費(fèi)用幾乎上不封頂。

不僅如此,當(dāng)時(shí)我們也沒(méi)有找到模型落地的應(yīng)用形態(tài)和商業(yè)化方式。我每天帶著團(tuán)隊(duì)像搞科研一樣讀論文,這個(gè)狀態(tài)對(duì)于一家創(chuàng)業(yè)公司來(lái)說(shuō)很奇怪,我們又不是一家科研公司。

現(xiàn)在回想起來(lái),我們當(dāng)時(shí)在應(yīng)用端挑戰(zhàn)“舉一反三”的能力完全沒(méi)必要,甚至可以說(shuō)是鉆牛角尖。如果我們換成后來(lái)谷歌在2022年提出的instruction tuning(指令微調(diào))方向研究,效果可能更好。

不過(guò),這也不代表我們的嘗試是無(wú)用功。至少比起市面上其他大模型創(chuàng)業(yè)團(tuán)隊(duì),我們已經(jīng)部分領(lǐng)先了關(guān)于分布式訓(xùn)練框架的選擇標(biāo)準(zhǔn),以及數(shù)據(jù)標(biāo)記、團(tuán)隊(duì)分工、人才需求等方面的認(rèn)知。

非典型創(chuàng)業(yè)者找到了“第二春”

現(xiàn)在,我們的員工都在為了大模型的發(fā)布而加班加點(diǎn)的工作,但某種程度上,我不希望公司(員工)太努力。

這種“反卷”也體現(xiàn)在我們辦公地點(diǎn)的選擇上。2020年,我們北京的辦公室從中關(guān)村(6.300, 0.07, 1.12%)搬到了西直門(mén)附近,減少團(tuán)隊(duì)長(zhǎng)期在一個(gè)固定地點(diǎn)被“一窩端”挖角的可能性。

在此基礎(chǔ)上,我們現(xiàn)在采取了極度分布式的辦公模式,把員工分散在北京、上海、武漢、深圳、臺(tái)北、蘇州、南京等城市辦公。如果這樣公司能不“掛掉”,而且能正常產(chǎn)出,我認(rèn)為這在未來(lái)可能有很大的競(jìng)爭(zhēng)力。

可以說(shuō),在中國(guó)的創(chuàng)業(yè)圈里,我肯定不是一個(gè)“正!钡膭(chuàng)業(yè)者。我有時(shí)候會(huì)對(duì)靠組織、文化、時(shí)間拼出來(lái)的企業(yè)產(chǎn)生質(zhì)疑。我總覺(jué)得搞這些事情會(huì)讓很多人喪失想象力,或者他們會(huì)因此疲于奔命。

我一直以來(lái)都是把更多時(shí)間花在做事情本身上,這可能是一個(gè)缺陷,但我覺(jué)得任何公司的成功都沒(méi)有套路,不要去嘗試把自己變得跟別人一模一樣。我覺(jué)得必須承認(rèn)人就是人,不是神。每個(gè)人包括我,都有自己的興趣愛(ài)好,我就是對(duì)做事情本身更加感興趣,我愿意花更多時(shí)間在事情上,我對(duì)組織、文化就是沒(méi)那么“感冒”,而且某種程度上我是反對(duì)這些東西的。

我把自己的這種狀態(tài)歸結(jié)于偏向硅谷。因?yàn)槲蚁M軌蛴酶叨确植际降、某種程度上算作躺平式的管理方式來(lái)做出創(chuàng)新,在這種狀態(tài)下,偶爾加班可以做得更好。我覺(jué)得硅谷很多公司,尤其是創(chuàng)業(yè)公司都如此。

如果在硅谷仔細(xì)觀察,大家就會(huì)發(fā)現(xiàn)硅谷絕對(duì)是躺平的:躺得妥妥的,員工都不去上班。Facebook的員工為什么還去上班?是因?yàn)樗麄兇蟛糠质窍肴ス境潆、吃午餐?/P>

盡管他們都不上班,但這一個(gè)多月以來(lái)美國(guó)科技公司產(chǎn)出的東西依然讓人眼花繚亂,每個(gè)公司都是如此。我認(rèn)為這也證明了組織力或者“好拼好努力”的文化,不見(jiàn)得能搞出最頂尖的創(chuàng)新。

我覺(jué)得現(xiàn)在國(guó)內(nèi)太喜歡把事情模式化或者格式化,但公司的成功有不同的原因,如果我們這樣(佛系)的公司也能成功,我覺(jué)得對(duì)于國(guó)內(nèi)來(lái)說(shuō)也是很大的進(jìn)步。

因此,我一直對(duì)公司文化沒(méi)那么敏感,而且過(guò)去我也不喜歡組織,我甚至都不愿意去討論它。

但這次OpenAI的組織,真的太令我好奇了,為什么它能搞出來(lái)(GPT)?這確實(shí)是一個(gè)問(wèn)題,在中國(guó)創(chuàng)業(yè)要做得很成功,可能還是要在組織、文化上花很多精力。

在公司管理上,我認(rèn)為就是找到適合自己的方式,即用事情來(lái)驅(qū)動(dòng)人,比如說(shuō)我會(huì)給員工找一些有意思的事情,然后讓他在事情中去成長(zhǎng),而不是說(shuō)跟員工談心。

我不是那種能夠給員工鼓勵(lì)打雞血式的領(lǐng)導(dǎo)者。在我看來(lái),錯(cuò)的就是錯(cuò)的。員工做錯(cuò)了,我恨不得跟他說(shuō)5遍,就像用GPT一樣一直重復(fù),直到讓他理解記住為止。

對(duì)于出門(mén)問(wèn)問(wèn)的未來(lái),我覺(jué)得信心比兩三年前強(qiáng)很多,很多時(shí)候一個(gè)公司能不能做大或者做成什么樣,除了自己努力外,也取決于時(shí)代趨勢(shì)。我覺(jué)得我們正在一個(gè)很好的趨勢(shì)上。我們現(xiàn)在好像找到了“第二春”,而且都提前布局好了,對(duì)未來(lái)的發(fā)展,我的預(yù)期是:上不設(shè)限。


微信掃描分享本文到朋友圈
掃碼關(guān)注5G通信官方公眾號(hào),免費(fèi)領(lǐng)取以下5G精品資料
  • 1、回復(fù)“YD5GAI”免費(fèi)領(lǐng)取《中國(guó)移動(dòng):5G網(wǎng)絡(luò)AI應(yīng)用典型場(chǎng)景技術(shù)解決方案白皮書(shū)
  • 2、回復(fù)“5G6G”免費(fèi)領(lǐng)取《5G_6G毫米波測(cè)試技術(shù)白皮書(shū)-2022_03-21
  • 3、回復(fù)“YD6G”免費(fèi)領(lǐng)取《中國(guó)移動(dòng):6G至簡(jiǎn)無(wú)線接入網(wǎng)白皮書(shū)
  • 4、回復(fù)“LTBPS”免費(fèi)領(lǐng)取《《中國(guó)聯(lián)通5G終端白皮書(shū)》
  • 5、回復(fù)“ZGDX”免費(fèi)領(lǐng)取《中國(guó)電信5GNTN技術(shù)白皮書(shū)
  • 6、回復(fù)“TXSB”免費(fèi)領(lǐng)取《通信設(shè)備安裝工程施工工藝圖解
  • 7、回復(fù)“YDSL”免費(fèi)領(lǐng)取《中國(guó)移動(dòng)算力并網(wǎng)白皮書(shū)
  • 8、回復(fù)“5GX3”免費(fèi)領(lǐng)取《R1623501-g605G的系統(tǒng)架構(gòu)1
  • 本周熱點(diǎn)本月熱點(diǎn)

     

      最熱通信招聘

    業(yè)界最新資訊


      最新招聘信息

    最新論壇貼子