最近,ChatGPT從AI領(lǐng)域破圈,成了互聯(lián)網(wǎng)領(lǐng)域的新風(fēng)口。這讓投資人和創(chuàng)業(yè)者們興奮不已。
創(chuàng)業(yè)的方向已經(jīng)很明了。做中國版對標(biāo)ChatGPT的大模型,是顯而易見的一條路。目前百度的“文心一言”已經(jīng)呼之欲出,原美團(tuán)聯(lián)合創(chuàng)始人王慧文也宣布攜5000萬美元進(jìn)軍AI,要打造中國的OpenAI(ChatGPT的研發(fā)公司)。
同時,將ChatGPT這樣的大模型平行擴(kuò)展,從文字信息知識模型擴(kuò)展到圖片、視頻等領(lǐng)域,也有同等機(jī)會。另外,順著ChatGPT的方向再往前走一步,又是另一個思路,如今的ChatGPT理解能力強(qiáng),但準(zhǔn)確性和時效性弱,在后者上下功夫,也是不少創(chuàng)業(yè)者在做的事。
大模型之外,ChatGPT在各垂直領(lǐng)域的應(yīng)用可能是適合更多創(chuàng)業(yè)者的路徑。ChatGPT可以應(yīng)用到文案、營銷、設(shè)計(jì)、行業(yè)研究等文化傳媒領(lǐng)域,還有醫(yī)療+AI,教育+AI,企業(yè)服務(wù)中的智能客服、數(shù)字人,以及游戲等各行各業(yè)中。有從業(yè)者提到,每個領(lǐng)域都可以訓(xùn)練適合自己的ChatGPT。
機(jī)會有很多,不過最終作為創(chuàng)業(yè)投資項(xiàng)目,其可行性還待驗(yàn)證?,F(xiàn)在,ChatGPT欠缺嚴(yán)密的邏輯能力,也缺乏一些常識,在很多領(lǐng)域的應(yīng)用壁壘不高但模型訓(xùn)練成本高,短期之內(nèi)商業(yè)化也有難度。
投資人最近既興奮又焦慮,市場很熱,但蹭熱度的占據(jù)大多數(shù),真正靠譜的項(xiàng)目不多,他們目前普遍處于高度關(guān)注但下手謹(jǐn)慎的狀態(tài)。畢竟,ChatGPT會顛覆很多領(lǐng)域,但這個蛋糕最終被大廠還是創(chuàng)業(yè)公司吃到還是個未知數(shù)。
盯緊ChatGPT
要找到ChatGPT領(lǐng)域的創(chuàng)業(yè)投資機(jī)會,有必要先弄清楚ChatGPT的特點(diǎn)。
眾所周知,ChatGPT是生成式AI,與之對應(yīng)的是分析式AI。微軟投資的人工智能企業(yè)OpenAI從2015年開始研發(fā)這個模型,直到2020年,OpenAI發(fā)布了GPT-3語言模型,才引起國內(nèi)外科技從業(yè)者對生成式AI的關(guān)注。
如今的ChatGPT,是OpenAI在ChatGPT-3.5的基礎(chǔ)上,模擬人的自然語言,重點(diǎn)做了聊天對話方面的訓(xùn)練而形成的,同時,這一代的ChatGPT具備了創(chuàng)造、生成內(nèi)容的能力。
英諾天使基金合伙人王晟告訴深燃,他們一年半之前就把AIGC(利用人工智能技術(shù)來生成內(nèi)容)確定為主要投資方向了,也已經(jīng)投了專注大模型的項(xiàng)目深言科技和做全新應(yīng)用場景的公司深空交響。
ChatGPT突然爆了,“好處是我們已經(jīng)投了的項(xiàng)目非常受人關(guān)注,最近每天都有好幾個投資機(jī)構(gòu)去和他們約見面。不好之處是本來我們在這一波AIGC方面的認(rèn)知和布局是領(lǐng)先行業(yè)的,相對有時間逐步完善布局,現(xiàn)在這一波熱度讓市場開始變得混亂。”他說。
在王晟看來,國內(nèi)ChatGPT相關(guān)的創(chuàng)業(yè)投資機(jī)會有兩大方向:第一是研發(fā)大模型,直接對標(biāo)ChatGPT,比如做中國版ChatGPT,同時,在ChatGPT這類語言大模型之外還可以擴(kuò)展到圖片、視頻等領(lǐng)域;第二就是將ChatGPT垂直應(yīng)用到各個細(xì)分領(lǐng)域。
目前,涉足大模型的國內(nèi)大廠已有不少。百度的文心一言、華為的盤古模型,字節(jié)跳動和達(dá)摩院也有自己的模型。這些大部分是語言模型,也有一些多模態(tài)的模型,比如達(dá)摩院的M6模型,它可以生成文本,也可以生成圖像。但國內(nèi)的模型可能限于某些比較小眾的應(yīng)用,還沒有形成非常大規(guī)模的市場影響力。
初創(chuàng)企業(yè)在該領(lǐng)域也有相當(dāng)?shù)陌l(fā)展。其中,比較有代表性的國內(nèi)人工智能企業(yè)“智譜AI”近年來一直在做關(guān)于千億模型和萬億模型的研究。他們主導(dǎo)研發(fā)了多語言千億級預(yù)訓(xùn)練模型(是深度學(xué)習(xí)架構(gòu),經(jīng)過訓(xùn)練以執(zhí)行大量數(shù)據(jù)上的特定任務(wù))GLM-130B,并打造了認(rèn)知大模型平臺(認(rèn)知模型是指描述人類認(rèn)知結(jié)構(gòu)和認(rèn)知過程的模型)Bigmodel.ai,形成了AIGC產(chǎn)品矩陣,提供智能API(應(yīng)用程序接口)服務(wù)。從應(yīng)用落地層面,智譜AI于2022年推出的AI數(shù)字人,在北京冬奧會及卡塔爾世界杯上受到廣泛關(guān)注。
“大模型需要高水平團(tuán)隊(duì),得是資深從業(yè)者,同時有比較強(qiáng)的AI工程化能力,另外我們傾向于看好曾經(jīng)花過大錢做過大模型的團(tuán)隊(duì)?!蓖蹶烧f。不過他也指出,中國能做語言類大模型的團(tuán)隊(duì)非常有限,加上大廠、一些科研機(jī)構(gòu)和創(chuàng)業(yè)公司,總體數(shù)量可能不超過十個團(tuán)隊(duì),加上圖片、音樂、視頻、3D資產(chǎn)等領(lǐng)域的大模型,全國能投的標(biāo)的也就幾十個。所以說大模型是一個重點(diǎn)關(guān)注的范圍,但投資機(jī)構(gòu)和普通創(chuàng)業(yè)者能抓住的機(jī)會不多。
ChatGPT如何適用細(xì)分領(lǐng)域,是更多創(chuàng)業(yè)者關(guān)心的事情。在這里,我們先解釋一下ChatGPT身上的一些特性。躍盟科技創(chuàng)始人兼CEO王冉對深燃分析,評價一個模型好壞要從處理信息的適用性、準(zhǔn)確度、時效性三個維度來看。ChatGPT對標(biāo)的是搜索,可以從這三個維度對比ChatGPT和搜索的差別。
他進(jìn)一步解釋:搜索目前用的主要是關(guān)鍵詞搜索,ChatGPT卻能很好地識別自然語言,所以在適應(yīng)性上,ChatGPT能做到滿分10分;在信息的準(zhǔn)確度上,現(xiàn)在搜索引擎已經(jīng)做到了前十條結(jié)果點(diǎn)擊率95%,前三條的結(jié)果點(diǎn)擊率80%-85%,ChatGPT在準(zhǔn)確度上做了妥協(xié),在知識跟推理里用了更模糊的方式,準(zhǔn)確率遠(yuǎn)遠(yuǎn)不如搜索,能打6分;在時效性上,ChatGPT是0分,它的模型是以年為單位訓(xùn)練的,不適合處理有時效性的信息。
所以ChatGPT是一個強(qiáng)適應(yīng)性、弱準(zhǔn)確度、弱時效性的產(chǎn)品模型,在這樣的特點(diǎn)之下,應(yīng)用場景也就明確了。
“這些特點(diǎn)就決定了ChatGPT不適合從0到1,更適合從1到N,它不能代替用戶尋找正確答案,而適合在搜索之后做二次加工處理,比如總結(jié)、分類、做表、糾錯、寫代碼,另一類應(yīng)用是模糊推理下的創(chuàng)造,比如寫小說、創(chuàng)意設(shè)計(jì)?!蓖跞秸f。
理論上說,基于ChatGPT大模型,能做各個行業(yè)的解決方案,來提升生產(chǎn)力,比如媒體、設(shè)計(jì)、營銷、行業(yè)研究、智能客服、影視特效、教育、醫(yī)療、游戲等領(lǐng)域。王晟也提到,現(xiàn)在很多廣告公司平面設(shè)計(jì)師的工作很大程度上已經(jīng)是AI在做,設(shè)計(jì)師對成果再做優(yōu)化,另外,ChatGPT如果運(yùn)用到游戲中,里面的NPC可以真實(shí)互動,游戲也會變得更酷。
誰能借ChatGPT起飛?
ChatGPT具體怎么應(yīng)用到細(xì)分領(lǐng)域,創(chuàng)業(yè)者的現(xiàn)身說法最有說服力。
王冉的躍盟科技從2016年就專注AI賽道,目前在做服務(wù)直播、新媒體或新的電商形態(tài)的AIGC模型。“我們提供一個模型底層技術(shù),能在搜索之上,把直播間的商品按照用戶的需求呈現(xiàn)出來,比如用戶搜索情人節(jié)買點(diǎn)什么,我就把所有直播間在賣的對應(yīng)商品信息整理出來,用對話或搜索推薦的方式推給用戶?!?/font>
在這一業(yè)務(wù)中,王冉重視的是模型的準(zhǔn)確性和時效性,因?yàn)殡娚痰钠脚_信息、價格信息都要準(zhǔn)確,時效上,要做到小時級乃至分鐘級。
“現(xiàn)在我們要做的就是準(zhǔn)備好迎接大模型的到來?!贬t(yī)療AI領(lǐng)域創(chuàng)業(yè)公司“左手醫(yī)生”創(chuàng)始人張超說。最近每天找他咨詢的同行很多,大家都在討論怎么用、效果怎么樣、怎么投入,他的感受是,ChatGPT讓醫(yī)療AI領(lǐng)域原來很多不好解決的問題忽然能解決了,AI醫(yī)生離商業(yè)化、大規(guī)模使用又近了。
張超整理了ChatGPT對醫(yī)療AI的影響,首先,ChatGPT可以用在文檔的處理類任務(wù)上,比如,抽取類、結(jié)構(gòu)化類任務(wù)、摘要類任務(wù),解決醫(yī)生的文書工作;同時,可以帶動一堆監(jiān)管類任務(wù)應(yīng)用,比如質(zhì)控、DRG(疾病診斷相關(guān)分組);還有一個重要應(yīng)用是人機(jī)溝通類任務(wù),比如智能自診、預(yù)問診、分導(dǎo)診、隨訪等;最后,ChatGPT對全科醫(yī)生的打造也更有利,比如AI能更好地輔助診斷、做指標(biāo)解讀、開方、做基礎(chǔ)患者教育、完成智能問答等。
“AI醫(yī)生目前需要解決的核心就是語義問題,以前我讓AI系統(tǒng)理解10個指令,如果患者的問題不在這10個指令范圍之內(nèi),系統(tǒng)就不會回答了,因?yàn)榛颊咻斎氲膯栴}可能用的不是標(biāo)準(zhǔn)表達(dá)方式,有了ChatGPT,新指令出現(xiàn)的時候它還能很好地處理。”另外,張超還提到,大家一直吐槽AI電話隨訪是人工智障,有了ChatGPT,系統(tǒng)可能對患者的提問對答如流,也可能從患者語無倫次的回復(fù)中整理出有價值的數(shù)據(jù)。
“原來我們做的是一個70分的產(chǎn)品,這一版優(yōu)化完升級之后,應(yīng)該能達(dá)到90分。接下來行業(yè)里面如果有人發(fā)布了大模型,我們會考慮采購,在大模型基礎(chǔ)上用我們的數(shù)據(jù)去升級優(yōu)化模型?!睆埑A(yù)計(jì)再過兩三個月就能用起來,就看OpenAI或國內(nèi)大廠誰先開放出來,“不過投入也不會少,硬件追加大概得1000-2000萬元,預(yù)期在這塊投入的研發(fā)成本一年也得近3000萬元?!?/font>
教育和ChatGPT契合的場景也很多。
在新東方優(yōu)編程董事長朱宇看來,在學(xué)前階段,ChatGPT可以做成一個能夠幫助孩子探索世界,解答小孩各類問題的陪伴機(jī)器人,上升到小學(xué)、中學(xué),經(jīng)過訓(xùn)練的ChatGPT可以像老師一樣答疑,比如學(xué)生的水平比較低,就調(diào)取最低級的概念解釋,一步步告訴答案,如果提問者是個水平很高的學(xué)生,直接說幾個關(guān)鍵步驟就行。再往上一層級,ChatGPT能做到個性化推送學(xué)習(xí)素材,甚至能編寫針對每一個學(xué)生的教材。
“ChatGPT現(xiàn)在已經(jīng)會寫小說、寫報(bào)告了,實(shí)際上學(xué)生用的教材涉及到的知識點(diǎn)是固定的,比小說和報(bào)告的素材更簡單,只需要用不同層次的學(xué)生聽得懂、有興趣聽的方式輸出就可以了,比如可以選擇更活潑幽默的方式?!敝煊钫f,這可能是跨時代的意義,幾乎能顛覆過去三四千年以來的知識傳遞方式。
悉之智能創(chuàng)始人兼CEO孫一喬目前看好ChatGPT做語言學(xué)習(xí)方面的結(jié)合,“我最近正好在學(xué)英語,以前都是跟外教一對一練習(xí),但外教不太懂中文,有一些詞匯我表達(dá)不出來,外教也不知道我想說什么,我的合伙人利用現(xiàn)在的ChatGPT加上語音識別與合成功能,結(jié)合一個虛擬AI形象,做出了可以與我進(jìn)行流暢的英語對話的AI老師,大大的提高了我的英語學(xué)習(xí)效率,降低了學(xué)習(xí)成本。未來一些以真人為主的英語教學(xué),可能會被替代?!?/font>
諸如此類ChatGPT在細(xì)分領(lǐng)域的應(yīng)用機(jī)會有很多,需要的是一線從業(yè)者敏銳的洞察力。
ChatGPT應(yīng)用尚待時機(jī)
雖然國內(nèi)大模型技術(shù)的發(fā)展呈現(xiàn)百花齊放的態(tài)勢,但不得不承認(rèn)我們與國外在基層技術(shù)上的差距。
ChatGPT背后是GPT-3.5模型,有從業(yè)者提到,國內(nèi)目前大約在GPT-3甚至比GPT-3還差一些的水平,在這點(diǎn)上,國內(nèi)處于追趕國外的狀態(tài),而且追趕難度還不小。
“新技術(shù)的研發(fā)道阻且長,其中包含著巨大的挑戰(zhàn),但大模型的中國創(chuàng)新是必經(jīng)之路。接下來從GPT-3到GPT-3.5到ChatGPT這條路徑中的必要工作,我們會持續(xù)去做?!敝亲VAI方面表示。
即便是王慧文這樣的互聯(lián)網(wǎng)大佬要入局,也有很多質(zhì)疑的聲音。有從業(yè)者說,“5000萬美元夠干什么?大模型訓(xùn)練一次就要花500萬美元。”
另外,前文提到的很多創(chuàng)業(yè)投資機(jī)會,還停留在理論層面,要真的實(shí)現(xiàn)起來,創(chuàng)業(yè)者還將面臨不小的阻力。
近年來王晟接觸了很多生成式AI相關(guān)的項(xiàng)目,有設(shè)計(jì)衣服和服裝面料的,有寫文本的,有為電商行業(yè)提供營銷方案的,還有圖片、視頻內(nèi)容生成工具。他不看好其中大部分項(xiàng)目的原因是,沒有縱深壁壘,王晟希望ChatGPT應(yīng)用的領(lǐng)域有一定深度,否則只是做產(chǎn)業(yè)中的一個點(diǎn),很容易被大廠顛覆?!氨热?,有項(xiàng)目要做AI生成式短視頻平臺,就相當(dāng)于有AI輔助功能的抖音,這是抖音、快手之類的大廠升級的機(jī)會?!?/font>
所以在他看來,AI這一波落地的場景非常多,看上去很熱,但投資人非常焦慮,大部分都沒有創(chuàng)業(yè)和投資的機(jī)會,很難出手。
朱宇也提到,ChatGPT在教育領(lǐng)域真正實(shí)現(xiàn)還需要時間。首先需要一個專業(yè)的教育知識語料庫,誰能建立語料庫,能不能和ChatGPT結(jié)合都是需要考慮的問題;其次,還需要提升ChatGPT的準(zhǔn)確度,如果只是作為一個聊天工具,它可以信心滿滿地“胡說八道”,但要是給學(xué)生講解知識,必須要準(zhǔn)確;第三,需要等ChatGPT整體的算力成本降下來,否則它在跟學(xué)生對話的時候,成本比真人老師都高。
另外,每個技術(shù)的誕生都會存在濫用的問題,現(xiàn)在國外有些學(xué)校、科研機(jī)構(gòu)、期刊雜志禁止使用ChatGPT寫論文。這也是ChatGPT發(fā)展應(yīng)用路上的問題。
在王冉看來,創(chuàng)業(yè)要有差異化的角度,ChatGPT直接套用,業(yè)務(wù)很容易被OpenAI覆蓋。他認(rèn)為,不應(yīng)該過度去追ChatGPT適應(yīng)性的維度,而要去思考一下準(zhǔn)確性加時效性角度,每個賽道都應(yīng)該做自己的模型,而不是用模型直接套賽道?!癈hatGPT代表著適應(yīng)性極強(qiáng)的一種方式,比如互聯(lián)網(wǎng)相關(guān)的一些領(lǐng)域,不能以年為訓(xùn)練單位,時效性如果能到天、小時的維度,自然有機(jī)會?!?/font>
孫一喬也持有類似的觀點(diǎn),如果創(chuàng)業(yè)者只是基于ChatGPT3或ChatGPT3.5去做一些應(yīng)用,風(fēng)險(xiǎn)很大。“比如一些估值很高的NLP領(lǐng)域的文本公司,ChatGPT一出,公司市值可能就要作廢了?!?/font>
所以在他看來,ChatGPT會產(chǎn)生一個新生態(tài),創(chuàng)業(yè)機(jī)會會出現(xiàn)在OpenAI的主線不涉及的領(lǐng)域,而且創(chuàng)業(yè)公司要有獨(dú)創(chuàng)的算法和前瞻性,比如以ChatGPT為基礎(chǔ)再往前進(jìn)一步,建立護(hù)城河。
悉之智能一直以來做的是AI解題方向的探索,目前ChatGPT有很強(qiáng)的同理心和理解能力,但相對缺乏邏輯能力,無法完成數(shù)學(xué)題之類更復(fù)雜的問題。“讓AI獲得邏輯能力,穩(wěn)定完成更加復(fù)雜的任務(wù),比如AI解體,或許會成為下一個十年AI領(lǐng)域最重要的課題。這也是我們努力的方向。”孫一喬說。
有人覺得,ChatGPT的能力被夸大了,多位從業(yè)者一致認(rèn)為,ChatGPT不是天才也不是白癡,說ChatGPT是萬能的,肯定夸大了,但如果說中國一兩年就能追上,顯然是低估了難度。
確實(shí),ChatGPT并不是通用人工智能,目前可以理解為是一個讀了幾千萬本書,但沒有太多生活經(jīng)驗(yàn)的人,雖然在文本層級有了能力,但學(xué)習(xí)人類對知識應(yīng)用、邏輯推理、轉(zhuǎn)化為行為的能力,是AI下一個階段的重要命題。
ChatGPT已經(jīng)攪動了整個科技互聯(lián)網(wǎng)行業(yè)這一潭水,全行業(yè)都在關(guān)注、學(xué)習(xí),及時吸收利用其中的精華。至于二者將會有怎樣的故事,還需要交給時間。