背景
2023年2月23日 21:05

解讀ChatGPT背后的研究力量


ChatGPT 的火爆,不僅為 OpenAI 帶來資本的關(guān)注、用戶的青睞,在關(guān)于“OpenAI 為何能做出 ChatGPT”的討論中,其人員優(yōu)勢也成為外界矚目的焦點。

近日,智譜研究聯(lián)合 AMiner 發(fā)布了一份 OpenAI 背后研究團隊的統(tǒng)計報告。據(jù)報告顯示,本次在 ChatGPT 項目中做出貢獻的人員共87人,其中包括了“年紀(jì)很輕”、“背景豪華”、“聚焦技術(shù)”、“積累深厚”、“崇尚創(chuàng)業(yè)”和“華人搶眼”等顯著特征。


在這樣一個不足百人團隊中,誕生了現(xiàn)象級的大型語言模型 ChatGPT,這對谷歌、微軟、百度、阿里等大廠而言都是不小的壓力,紛紛緊隨其后,發(fā)布、或預(yù)發(fā)布類 ChatGPT 產(chǎn)品。

作為一家非盈利的人工智能研究機構(gòu),一直以來,OpenAI 都被諸多有志于發(fā)展 AI 事業(yè)的青年人才視為技術(shù)天堂。在這里,他們可以直接參與最前沿、最具創(chuàng)造力的 AI 項目, 調(diào)用最核心的科研資源,心無旁騖地投身到技術(shù)創(chuàng)新中。

而近年來,邊緣化、舉棋不定使國內(nèi)大廠中的 AI 研究院和科研人才面臨著生存難題,但相信在這次 ChatGPT 的沖擊下,AI 人才重新回歸大眾視野,也將迎來新一輪的爭奪和洗牌。


1.技術(shù)人員占比近九成:“90后是主力軍”

從 ChatGPT 團隊職位分工(圖1)來看, 在參與此次項目的87人中,研發(fā)人員的數(shù)量就達(dá)到了77位,占比88%,其中包括了公司聯(lián)合創(chuàng)始人 Wojciech Zaremba,他在此前被評選為 2023 年度 AI 2000 機器人領(lǐng)域最具影響力學(xué)者。

產(chǎn)品人員共4位、占比5%,此外還有6位參與者的職位信息無法獲取。

ChatGPT 團隊職位分工

在成員年齡分布(圖2)方面,90后是團隊的主力軍,其中,年齡區(qū)間在20-29歲的共28位,占比達(dá)到34%;30-39歲的成員數(shù)量最多,共50人,占比高達(dá)61%;此外,有3人年齡段在40-49歲區(qū)間,60歲以上僅1名。

經(jīng)統(tǒng)計,這支研究團隊的平均年齡為32歲。
ChatGPT 團隊年齡分布

“年紀(jì)很強”和“聚焦技術(shù)”是 ChatGPT 團隊成員的兩大顯著特征。

雖然平均年齡僅在32歲,但團隊人員高度聚焦技術(shù)研發(fā),基于他們對 AI 創(chuàng)新和研發(fā)極大的興趣和全身心投入,創(chuàng)造出這個引爆全球新一輪技術(shù)的現(xiàn)象級模型。由此可見,被認(rèn)為研發(fā)經(jīng)驗不足的年輕人,完全有可能在前沿科技領(lǐng)域取得重大突破。

當(dāng)前,國內(nèi)并不缺乏如 OpenAI 一樣的年輕優(yōu)秀人才。

ChatGPT 問世之后,IDEA 研究院講席科學(xué)家張家興在去年底就迅速講團隊的大模型研發(fā)轉(zhuǎn)向了 ChatGPT 的對話任務(wù)路線。

據(jù)其透露,其團隊中的研究主力也皆為90后優(yōu)秀的年輕人才。當(dāng)前,他們研發(fā)的類 ChatGPT 模型效果與 ChatGPT 相當(dāng),且僅有50億參數(shù),文本生成速度也很快,目前已在內(nèi)測中,近期將公測。


2.名校學(xué)歷、華人占9位:"大廠不再是頂尖人才第一選擇"

ChatGPT 團隊成員的學(xué)歷在本、碩、博的人數(shù)相對均衡,其中,27人具有本科學(xué)歷,25人為碩士研究生學(xué)歷,28人擁有博士研究生學(xué)歷,占比分別為33%、30%、37%。

他們當(dāng)中來自斯坦福大學(xué)的校友人數(shù)最多,共有14位,其次是加州大學(xué)伯克利分校10位,麻省理工排名第三,有7人。

ChatGPT 團隊成員畢業(yè)高校人數(shù)Top10

華人學(xué)者是團隊中一支重要的科技創(chuàng)新力量,共9人,占比近10%。

其中,有5人曾畢業(yè)于中國高校,3人本科畢業(yè)于清華大學(xué),分別是翁家翌、趙盛佳、袁啟明,當(dāng)前他們在團隊中擔(dān)任研發(fā)工程師的崗位;各有1人本科畢業(yè)于華中科技大學(xué)、北京大學(xué)/香港大學(xué),分別是江旭和翁麗蓮。

他們都是在國內(nèi)頂尖院校畢業(yè)后赴美深造,獲得碩士或博士學(xué)位。


從人員流動中可看到,大廠也不再是頂尖人才第一選擇,如 OpenAI 這種更純粹的研究機構(gòu)反而更受他們青睞。

團隊成員當(dāng)中,共有5位被評為 2023 年度 AI 2000 全球人工智能學(xué)者。他們分別是:

1.OpenAI 聯(lián)合創(chuàng)始人 Wojciech Zaremba(入選領(lǐng)域及名次:機器人,第10名)

2.ChatGPT 研究員 Lukasz Kaiser(入選領(lǐng)域及名次:機器學(xué)習(xí),第10名)

3.OpenAI 聯(lián)合創(chuàng)始人、ChatGPT 研究科學(xué)家 John Schulman(入選領(lǐng)域及名次:機器學(xué)習(xí),第41名)

4.ChatGPT 研發(fā)工程師 Tomer Kaftan(入選領(lǐng)域及名次:數(shù)據(jù)庫,第52名)

5.ChatGPT 研究科學(xué)家 Barret Zoph(入選領(lǐng)域及名次:機器學(xué)習(xí),第95名)

來自外部公司、高校應(yīng)屆畢業(yè)生、科研機構(gòu)和高校教職人員的占比分別是81%、13%、4%和3%,其中大多來自于谷歌、微軟、Meta、英特爾、英偉達(dá)、蘋果等頂尖或知名的科技公司,共10人就是從谷歌跳槽加入的,1人曾在百度任職過。


ChatGPT 團隊成員流動情況
統(tǒng)計還發(fā)現(xiàn),與 ChatGPT 有關(guān)的前七項技術(shù)項目研發(fā)中,ChatGPT 團隊有較多人都曾參與到其研發(fā)中。
參與人數(shù)最多的是 CodeX 項目,共22人參與,占團隊人數(shù)的25%;其次是 webGPT 和 instructGPT,共有9人參與;GPT3 共有6人參與過,排名第三;排名第四的是 RLHF,有3人參與過。


ChatGPT 團隊參與此前七大技術(shù)研發(fā)人數(shù)

可以說,ChatGPT 是 OpenAI 在大型語言模型領(lǐng)域多年技術(shù)積累、頂尖人才領(lǐng)導(dǎo)和優(yōu)秀 AI 技術(shù)人員聚集的結(jié)果,為 ChatGPT 的成功研發(fā)打下了堅實基礎(chǔ)。


3.AI 人才迎來爭奪戰(zhàn)

事實上,過去幾年里,AI 研究院和 AI 人才在大廠內(nèi)部長期面臨著邊緣化、戰(zhàn)略搖擺的困境,正如上述提到的谷歌,就已有不少人才流向 OpenAI 這樣純粹的科研圣地。

大廠內(nèi)部的 AI 人員在企業(yè)的組織架構(gòu)模式內(nèi),往往難以發(fā)揮其本該有的能力和成果。

但與傳統(tǒng)的科技巨頭不同,如果 OpenAI 等此類以“發(fā)展人工智能”為己任的公司中,AI 的研發(fā)和創(chuàng)新才是它們的使命所在,即近距離地參與到最前沿的 AI 項目中,調(diào)用最核心的資源做研發(fā),背后更要能承受住長久不出成果的責(zé)任。其中 GPT 模型僅首發(fā)到完成訓(xùn)練,就長達(dá)三年時間,需要團隊的一整套資金、技術(shù)和人才等體系化保障。

ChatGPT 的出現(xiàn),將 AI 人才重新拉回了大眾視野,重申純粹科學(xué)研究的重要性,勢必將掀起一輪新的人才爭奪戰(zhàn)。同時,也會提高大廠對大模型、計算資源等基礎(chǔ)設(shè)施的重視,加快底層技術(shù)能力的追趕和補齊。

正如前搜狗 CEO 王小川在微博中所說,“OpenAI的成功,首先是技術(shù)理想主義的勝利!盋hatGPT 的成功,必然離不開產(chǎn)、學(xué)、研合力,其背后是團隊成員對人工智能技術(shù)的興趣和予以堅持的信仰。國內(nèi)并不乏頂尖的科研力量,將目光投注前沿技術(shù)創(chuàng)新,穩(wěn)扎穩(wěn)打,對促進中國 AI 創(chuàng)新發(fā)展具有重要意義。