“中國創業者在移動互聯網時代是最會做應用的。”
文|《中國企業家》記者 趙東山
“國內好的大模型應用目前還是太少了,2023年大家都使勁做大模型,反倒在應用方面沒有大的突破。”這是網易有道CEO周楓投身大模型一年后最大的感受。
在他看來,2024年大模型應用即將迎來爆發,“咱們中國創業者在移動互聯網時代可是最會做應用的”。2023年,周楓去美國轉了一圈,他發現那邊的創業活力非常強,大家都在各個層級上創新,他意識到國內需要再次加速,尤其在應用層。
過去一年,不同于百川智能創始人王小川、智譜CEO張鵬等清華大學校友研發超大規模大模型,周楓帶領團隊研發出“子曰”教育大模型之后,就快速投入到大模型原生應用的開發中,業務被逼著進入一種快速迭代的狀態,周楓參與業務會議的頻率從月會變成了周會,他形容當時的團隊狀態是“應用團隊和模型團隊互相逼”。
截至目前,基于“子曰”教育大模型,有道已推出10多款學習類AI原生應用和功能,成為國內開發AI原生應用最多的大模型企業之一。而基于大模型對原有業務的重構,有道的業績變化也真實地體現在公司的經營數據中。
根據有道2023年第三季度的財報,網易有道該季凈收入15.4億元,毛利率上升至55.9%,達到近兩年新高;季度經營虧損同比收窄73.7%,總運營費用也同比下降,經營效率進一步提升。
在具體產品和業務上,受益于大模型的助力,AI Box的升級以及AI寫作功能的推出,帶動有道詞典及有道翻譯第三季度會員費同比增長160%以上,在線營銷服務凈收入較2022年同期增長113.5%。
“搭載了子曰大模型的產品,比同期發布的未搭載大模型應用的產品,在用戶使用頻率上要高出50%以上。”周楓告訴《中國企業家》。
從2006年網易有道成立,周楓相繼做了有道搜索、有道詞典、有道云筆記、有道精品課、有道詞典筆等業務,業務范圍覆蓋K12教育、成人教育、素質教育、智能硬件等領域,這讓大模型的應用落地有了眾多的場景。
雖然有道并非大模型企業中規模最大的一家,但周楓采取的“小快靈”AI應用開發路線,很顯然已率先在商業模式上奏效。當外界在追問大模型到底給企業帶來哪些增量時,有道已經在各業務的用戶反饋中得到了答案。
“做企業最重要的是挑什么仗去打。”周楓說道,“如果你告訴團隊去打根本不可能贏的仗,那不是害大家嗎?”
把重心轉移到應用上
時間回到2022年11月底,ChatGPT發布之后,周楓試用后感到非常震撼。他跟算法團隊來來回回地用,測試它的能力底線,在公司內部評測模型不同能力的細節。為了了解更多技術細節,周楓把從GPT-2開始的所有語言模型相關的論文全部讀了一遍。
2023年1月,有道內部召開年度戰略會,這是公司每年的傳統,周楓把總監以上的團隊集中在一起連續開三天會。不同于往年,2023年周楓讓有道首席科學家段亦濤講了一個多小時GPT相關的技術,讓大家做了充分的討論。
最終的結論是,大模型是一個革命性的技術,如果有道不迅速入局,革新和顛覆自己,就連起家的詞典和翻譯業務就也別干了。當時,周楓和團隊一直在思考,ChatGPT、大模型跟有道到底有沒有關系?有道到底要做什么?有沒有合作方可以調用?
“我們從第一天開始就決定要做一批應用,而不是說我要訓個模型出來,然后看怎么辦?我不是這個想法,只是當時找了一圈都沒有可調用的大模型,只能自己訓練。我覺得你把大模型弄出來,卻搞不明白用來干什么的話,自己做大模型的意義就不大了。”周楓告訴《中國企業家》。
其實,當時美國可汗學院等教育公司已經開始嘗試接入GPT-3.5,做一些教育服務嘗試,但國內還沒有能力綜合又非常成熟的可以接入的模型,周楓必須得自己做。
很快,周楓就和團隊達成兩個共識:第一,有道團隊一定要自己做大模型,如果自己不做是很難完全摸清楚門道的,公司的動作就會變得很慢,做什么都落在別人后面,成為一個跟隨者;第二,做開源大模型肯定打不過專門做超大規模大模型的公司,必須把重心轉移到應用上。
作為資深技術從業者,周楓過去20年見證了好幾輪技術變革浪潮,歷史經驗告訴他,每一次大的浪潮里,機會不僅僅在于基礎技術。就像互聯網發展之初,做服務器和路由器的公司最賺錢,但大家很快就發現互聯網的精髓不在路由器,而是在互聯網應用上。
他認為,如果中國的創業者眼睛全盯著要去做大模型,就會像移動互聯網時代那樣,整天盯著怎么做手機而忽視了微信、淘寶、抖音等應用的機會。
不做1000億參數以上大模型
截至目前,有道大模型團隊超過100人,且大多數都是從原來的團隊轉過來,他們中很多都有人工智能領域的相關研發經驗。
除了人才外,有道在AI方面也有深厚的積累。早在2008年,有道成為國內第一家提供統計機器翻譯模型的公司;2017年,有道從機器翻譯引擎升級成神經網絡翻譯引擎,隨后又升級到現在主流的Transformer技術。因此,在做大模型的時候,有道團隊過往很多積累都可以用上。
但即便有技術積累和人才優勢,周楓給團隊設定的邊界是:堅決不會做1000億參數以上的模型。
在周楓看來,大模型目前可分為三個層級——1000億參數以上的超大模型、100億參數~1000億參數的中間模型和100億參數以下的小模型。每個層級都定位不同的實用場景,其中超大模型提供最佳質量,具備較強數理推理能力;中間的模型具備知識的能力,且因為成本較低,但效果不錯,可以廣泛應用;而小模型則是放到設備里,具備語言能力和情緒能力。
“我們基本上相對早期的時候就琢磨明白這件事兒了,超大規模的模型應該留給專門以大模型為全部工作的公司去做,一方面太貴了,另一方面市場也不需要重復建設。”周楓告訴《中國企業家》。
在他看來,有道作為教育科技企業,核心的差異應該來自于中間和底下兩個模型。而這其中,要求開發者對不同層級的模型能力有深刻的理解,且能將產品需求和能力模型匹配。
在結合過往業務尋找落地場景應用的過程中,周楓確立了兩個原則:第一,解決用戶在教育場景的需要;第二,能快速變現,有足夠的商業空間。而虛擬人口語教練Hi Echo、AI家庭教師小P老師等應用和功能,都是他認為既能滿足用戶學習需求,又能實現商業化變現。
教育缺的是辦法
2019年10月,有道在美股上市時,周楓就曾拿用AI技術批改作文這一場景舉例。“但當時的確效果一般。”周楓告訴《中國企業家》。
2023年,借助AI大模型,有道再次推出AI作文指導,目前已經批改了幾十萬篇作文。周楓發現用戶需求沒變,但當需求能被很好地解決的時候,產品使用量或者活躍度就會快速上升,滿意度也明顯提升。
2023年一年,周楓深刻地意識到,其實教育從來都不缺用戶需求,缺的都是辦法。除了AI作文批改被使用頻次變高之外,他發現有道硬件詞典筆中,以前用戶都是掃一個詞,而現在則是掃一行句子,而有道的業務正是在這些細微的變化中被重構。
在周楓看來,教育科技是個巨大的市場,很多剛性需求下的細分場景都是巨大的業務盤。而大模型提供一個很大的機會,讓用戶以相對廉價的方式能買到不錯的教育服務。
2022年全國教育經費執行情況統計公告顯示:2022年全國教育經費總投入為61329.14億元,首次超過6萬億元,比上年增長5.97%。
除了直接面向C端用戶外,2023年有道與杭州拱墅區智慧教育達成了合作,有道團隊直接把應用內置到智慧教育系統中,這里的學生每天在學校就可以練15分鐘口語。
研發和推廣大模型應用這一年,周楓也總結了一些經驗:
第一,即便大模型已經在媒體上變成一個熱詞,但其實大部分中國人還沒有用過大模型產品,所以當開發者產品做得非常精致,完成度非常高時,用戶的接受度也非常高。
第二,英語口語類產品,虛擬人非常有用。在此之前,有道曾開發出一版無虛擬人的口語教練產品,但發現效果一般,最終有道決定聯合網易游戲團隊在產品中加入虛擬人形象。
第三,交互式的追問,以及基于語音和聊天的學習產品形態,用戶非常需要,他們天然就喜歡這樣的產品形式。
大模型是個10年的事兒
除了是一名教育科技創業者外,周楓還是兩個孩子的父親。在ChatGPT和大模型火了之后,他現在逢家長就問,你孩子學編程沒有,學計算機沒有?
在周楓看來,如果小學二三四年級的學生,逐漸開始能接受計算機時,真的應該去體驗一下編程。“過去50年,社會所有行業中間給人類社會發展帶來最大震撼的,基本就是信息產業,它不斷帶來驚喜,每10年都有一個巨大變化。”周楓表示。
與此同時,他也開始培養孩子的創造力和提問的軟能力,他認為在未來這對每個孩子來說都是越來越重要的。他也正逐漸將這樣的育兒觀念帶入到有道的產品中,比如堅決杜絕孩子們用AI工具作為抄作業的手段,保護孩子自主學習的精神。
在周楓看來,大模型是個長達10年的事兒,就像移動互聯網是10年的事兒一樣。“雖然2007年就已經出現iPhone,但直到2016年才出現抖音。”周楓強調。
他認為,2024年大模型相關領域將會有三大機會點:第一,超大模型肯定會成為一個國內大模型廠商爭奪的焦點;第二,國內將會涌現一大批大模型原生應用;第三,端側將會得到廣泛應用。