背景
2023年2月27日 08:14

讓ChatGPT給你上一課

最近應該沒有什么能比ChatGPT更吸引網(wǎng)友關(guān)注了,無論是出于驚嘆還是吐槽,ChatGPT已經(jīng)成為了萬眾矚目的焦點。

在2016年AlphaGo與李世石的世紀對決之前,大部分普通人對人工智能的印象還停留在這一事件。盡管我們在短視頻推薦、導航路線規(guī)劃等場景中接觸到了人工智能,但實際上仍然缺乏深刻的感受。

然而,ChatGPT的問世不僅讓人們能夠直接接觸到人工智能,而且還能夠利用它來寫論文、編寫代碼、回復郵件,甚至進行面試,F(xiàn)在,從學生到職場人士,大家不僅信任人工智能,而且還在努力讓它為自己服務。

實際上,ChatGPT在通用語義領(lǐng)域表現(xiàn)出非常高的水準。如果將同源技術(shù)用于垂直領(lǐng)域的訓練和積累,其所蘊含的商業(yè)價值和對產(chǎn)業(yè)的影響可能會被視為一個新紀元,改變產(chǎn)業(yè)的形態(tài)。

從作弊到輔導的技術(shù)嬗變

根據(jù)紐約時報報道,一月份北密歇根大學的哲學教授安東尼·奧曼Antony Aumann在為他的世界宗教課程批改論文時,讀到了他所說的“班上最好的論文”:段落干凈、用例恰當、邏輯嚴謹?shù)赜懻摗恫伎ń睢返牡赖滦浴?br>


不出意料,后來在詢問中學生承認,這篇內(nèi)容是由 ChatGPT 完成的。

事實上,ChatGPT給美國教育界帶來的刺激是不小的。全美范圍內(nèi),許多大學教授都在重新設計課程,更多地采用口試、小組合作和手寫文章作為評估方式,而不是讓學生家庭作業(yè)式地提交文章。

但對ChatGPT嚴防死守的同時,這樣的故事隱約透露著一個更重要的真相——由于 ChatGPT 在語義理解、信息整理、模仿能力上都有不俗實力,從某些角度來講,這個人工智能產(chǎn)品無疑稱得上是個優(yōu)等生。換句話說,ChatGPT 除了可以扮演學生槍手,更可以扮演學生的輔導老師,針對問題輔導學生功課,以及幫助學校的教師備課出題。

同樣是在美國,有的老師開始在課程中讓學生和 ChatGPT 辯論,以訓練邏輯能力;有的老師用 ChatGPT 出題,提高備課效率;還有的老師用其快速搜索整理資料,提高課程豐富度。

借著熱度,很多教育企業(yè)也紛紛發(fā)布了自己的產(chǎn)品或計劃。

網(wǎng)易有道AI技術(shù)團隊正投入到ChatGPT同源技術(shù)在教育場景的落地研發(fā)中。此前有道已經(jīng)在AI口語老師、中文作文批改等細分學習場景中嘗試應用;科大訊飛官宣今年5月將發(fā)布AI學習機;而好未來也在推出的學而思學習機上上線AI講題機器人小π。

ChatGPT 的出現(xiàn),可能是教育走向更好狀態(tài)的契機。

中式教育,如何找到自己的答案

根據(jù)2019年統(tǒng)計,中國小學凈入學率99.95%,初中100%,高中88.8%。這樣的教育普及成績在14億的人口基數(shù)下,全球罕見。但另一邊,中國整體教育完成“量變”轉(zhuǎn)向“質(zhì)變”,依然是一條需要探索的道路:

宏觀的層面來說,偏遠地區(qū)的教育資源依然需要外部支援、大城市的家長在爭取優(yōu)質(zhì)的學區(qū)資源。具體到生活中,家長每天還要查看家長群通知、緊盯孩子寫作業(yè);老師們除了上課,每天還要布置作業(yè)和無止盡地發(fā)消息@家長,下課后,老師們還得批改作業(yè)、備課、排課。這種內(nèi)耗式的師、生、家長關(guān)系,幾乎是整個中國教育下的同病相憐,無比熟悉、無處可逃、每天無限循環(huán)。

這些問題的根源,都來自教育資源與精力的分配依然是不平衡的。比如,老師明明應該花更多時間在孩子身上,但布置批改作業(yè)、備課這些機械、重復的事情卻占用了大量時間;為了彌補老師失去的輔導時間,家長好不容易下班了還要撿起快忘干凈的知識點指導孩子功課;不同地區(qū)的發(fā)展差異短時間是很難彌補的,優(yōu)秀的教師數(shù)量往往也就只有那些。如果不能讓優(yōu)秀的教育資源普惠,那么這些問題都很難得到解決。

其實,教育行業(yè)一直都有著很好融入人工智能的基礎(chǔ):

首先是“資源”:教育領(lǐng)域具有大量的可被歸納的數(shù)據(jù)和資源,這些數(shù)據(jù)可以被AI技術(shù)進行深入分析和挖掘,幫助教師和學生更好地理解和應對學習難點。

其次是“場景”,教育領(lǐng)域的應用場景相對集中,比如改作文、打分、講解等,可以針對特定的教育場景進行AI技術(shù)的應用。這樣做可以避免AI技術(shù)的泛化問題,讓AI技術(shù)更加垂直貼近實際需求,提高應用效果和用戶體驗。

最后是“受眾”,教育領(lǐng)域?qū)τ贏I技術(shù)的接受度較高,教育工作者普遍具有較高的文化素養(yǎng)和技術(shù)素養(yǎng),這使得他們更加容易理解和應用AI技術(shù),推動AI技術(shù)在教育領(lǐng)域的落地。

這也是為什么在ChatGPT走紅以后,“教育領(lǐng)域可能是ChatGPT最容易落地的場景”成為國內(nèi)行業(yè)熱議的話題:當ChatGPT這樣的產(chǎn)品,可以低成本地被每個家庭的孩子訪問和使用,那么每個學生都相當于獲得了一位輔導老師,這對于整個行業(yè)生產(chǎn)力的解放將是不可估量的。

但AI+教育,并不是一個簡單的1+1問題。

“雖然我們在討論人工智能技術(shù),但是僅人工智能技術(shù)本身是做不出一個產(chǎn)品的。傳統(tǒng)的機器已經(jīng)無法承載深度學習時代的巨大計算量的需求,知識獲取(訓練)和提供服務本身都依賴巨大的算力!

網(wǎng)易有道總裁金磊曾表示,跟業(yè)務場景結(jié)合的技術(shù)才能真的解決用戶問題。這不僅涉及到對模型的不斷訓練,還需要對模型壓縮、蒸餾、量化等多項相關(guān)技術(shù)的持續(xù)探索,以及針對硬件設備的深度優(yōu)化。只有讓其達到了應用的門檻,并且能夠產(chǎn)生商業(yè)價值以后,一大批垂直領(lǐng)域的優(yōu)化定制需求才會大量涌現(xiàn)。

“如何實現(xiàn)低成本的模型定制,是成為算法和算力側(cè)都需要關(guān)注的重要問題。”他說。

隱形玩家的方法論

如何把人工智能技術(shù)融入教育,需要想很多辦法。我們可以從行業(yè)中不同企業(yè)的業(yè)務模式中,看到一些共性。
針對資源,需要構(gòu)建起知識圖譜,覆蓋學習各場景沉淀數(shù)據(jù)。比如學而思多年來所積累的內(nèi)容資源,為學習機內(nèi)置了超1000萬分鐘的優(yōu)質(zhì)學而思自研課程,課程內(nèi)容100%由原學而思老師講授;有道積累了基于K12的知識圖譜、智能批改系統(tǒng)、學情大數(shù)據(jù)、自適應學習、個性化課程、口語評測、自動答題系統(tǒng)等解決方案。

針對場景,很多垂直領(lǐng)域的探索,比如口語練習、作文批改、英文寫作、在學術(shù)側(cè)也做了很多的縱深。雖然模型沒有ChatGPT那么大,但是在細分場景下有著更好的表現(xiàn)。比如有道推出了有道寫作,根據(jù)不同課程的需要,開發(fā)了批改、優(yōu)化、潤色和打分的能力;阿里和訊飛都曾推出針對閱卷場景的人工智能,減輕閱卷老師壓力。

針對受眾人群,要通過恰當?shù)闹悄苡布O備,通過AI+硬件+內(nèi)容的綜合能力,低門檻使用的同時,建立起符合學生、老師使用場景需求的產(chǎn)品。代表性的就是各家的詞典筆、學習機、還有智能臺燈。

這一系列策略,林林總總,其實就一個思想:將技術(shù)集中投入到教育行業(yè)與人工智能相性比較好的垂直領(lǐng)域,避免技術(shù)停留在實驗室中,讓它更容易落地。

用網(wǎng)易有道CEO周楓的話說:“在多年實踐的過程中,我們深知,單純的AI技術(shù)并不能夠創(chuàng)造足夠的價值,只有與業(yè)務場景結(jié)合的技術(shù)才能真的解決用戶問題,帶來價值!

這樣的結(jié)合并不容易:場景是千奇百怪的,為了技術(shù)更好地融合,企業(yè)對技術(shù)有較深的掌握,并根據(jù)場景通過技術(shù)進行定制。



一個比較有討論價值的例子,是有道的爆款產(chǎn)品詞典筆。

從功能點來看,這支筆可以實現(xiàn)文字掃描、拼圖、識別、機器翻譯、語音合成、語音識別,并做到離線精準翻譯。將這些功能落地到一支小小的筆頭上,這背后需要的是大量的算法模型,考驗的更是技術(shù)在端側(cè)的落地能力。

眾所周知,端側(cè)的技術(shù)難度是如何在資源有限的硬件環(huán)境里滿足業(yè)務對性能的要求。無論是存儲、內(nèi)存,或者計算資源都比較有限,對AI模型必然提出了更高的要求,并且是一個極為難啃的硬骨頭。有道不僅做到了技術(shù)在業(yè)務場景中的落地,還不斷刷新了詞典筆這一細分品類的天花板。實現(xiàn)了在查詞過程中的交互、點查、掃描翻譯、一目十行等功能點上的創(chuàng)新。

事實上,無論是有道深耕多年的智能學習硬件,還是訊飛植入各類產(chǎn)品的語音技術(shù),都是自然語言處理相關(guān)技術(shù)的一個領(lǐng)域。也正是基于此,他們才在做到了業(yè)界相對領(lǐng)先的自然語言處理能力的同時,能夠深入教育行業(yè),并做到持續(xù)引領(lǐng)。

當然,如果只有自然語言處理能力的話,即使訓練出來很好的模型也只能支持文本的能力。所以有道有著圖像識別、人臉識別、語音合成、OCR等基礎(chǔ)技術(shù)。這種多維度的補充,給AI帶來了能“看”能“聽”的體驗,通過更全面地感知世界,誕生出更符合用戶的使用直覺與需求的產(chǎn)品。

這也是為什么在ChatGPT走紅后,有道能夠快速做出應對的深層原因。

而技術(shù)上的堅持,最終將反映在經(jīng)營狀況,最新一季的財報數(shù)據(jù)顯示,網(wǎng)易有道2022年Q4凈收入達14.5億元,同比增長38.6%。其中,學習服務、智能硬件以及在線營銷服務三大業(yè)務板塊第四季度同比分別增長39.2%、28.1%、58.6%。最終2022全年,有道實現(xiàn)凈收入50.1億元,同比增長24.8%!凇叭斯ぶ悄艿木ぜ氉鳌睍r代,持續(xù)多年的投入逐漸有了回報。

收入變化背后,有道在研發(fā)和資本開支上進行了著眼未來的投資。在2020年、2021年和2022年,有道的研發(fā)費用分別為3.7億元、6.1億元和8億元,其中增長主要來自對智能硬件業(yè)務研發(fā)投入的增加。

在第四季度,有道的學習服務凈收入達到了8.1億元。有道特別披露了數(shù)字內(nèi)容服務的銷售額超過6億元,連續(xù)兩個季度實現(xiàn)凈收入可覆蓋成本及運營支出。數(shù)字內(nèi)容的本質(zhì)離不開對AI技術(shù)的依托。作為典型的長尾收入類型,內(nèi)容收入隨著時間的推移將持續(xù)創(chuàng)造價值。

每種新技術(shù)都有自己的成長周期。在近兩年這種高度不確定的環(huán)境中,人們都在追求穩(wěn)健的發(fā)展,而長期主義的投資需要戰(zhàn)略定力。中國的AI和教育是國家長期發(fā)展的兩種戰(zhàn)略支柱,這離不開科技企業(yè)的自立自強,這也是ChatGPT爆紅和熱議的今天,在這兩個行業(yè)中留下不起眼的注腳。