精選聯盟

面壁智能如何破解商業大考?

作者:DoNews
面壁智能如何破解商業大考?

文 | 曹雙濤

編輯 | 楊博丞

題圖 | IC Photo

AI大模型的競争,本質是頂尖AI人才的競争。

海外市場上,為搶奪AI頂尖人才,歐美科技巨頭紛紛高薪挖人、留人。Meta、谷歌針對AI相關崗位年薪總包最高均在千萬元以上。Open AI從谷歌挖人時,承諾年薪(主要以股票形式)将在500萬美元-1000萬美元之間。

國内市場上,重點高校+知名教授帶隊的AI項目,成為國内AI創投圈瘋搶的對象,“清華系創投公司”前期更是不缺資金。如由清華大學計算機系技術成果轉化的智譜AI,2023年Q3單季度完成多筆融資,融資速度之快在創投圈中幾乎少見。

面壁智能如何破解商業大考?

圖源:天眼查

“清華系創投公司”的深言科技、面壁智能、月之暗面,三家公司創始人豈凡超師從孫茂松、曾國洋師從劉知遠、楊植麟師從唐傑,這三位清華教授均參與清華大學AI研究院基礎模型研究中心的籌建,孫茂松任首席科學家、劉知遠任副主任、唐傑任研究中心主任。

4月份,月之暗面和面壁智能相繼傳出拿下新一輪融資,其中面壁智能本輪融資春華創投、華為哈勃領投,北京市人工智能産業投資基金等跟投,老股東知乎戰略跟進。

面壁智能如何破解商業大考?

圖源:天眼查

國内頂尖高校技術學派,創始人年輕且奮鬥在技術一線,初創公司沒有如阿裡、位元組“大廠病”。種種優勢加持下,“清華系創投公司”的技術能力正走到國際前沿。

以面壁智能圍繞TOB推出的面壁MiniCPM2開源模型為例,據面壁智能透露,MiniCPM2模型在同等性能參數更小、同等參數性能更強,超越Mistral-7B、谷歌Gemma、Llama2-13B、 ChatGLM3-6B等,且170萬tokens的推理成本僅需1元。

MiniCPM2多次登頂GitHub Trending,跻身HuggingFace 50萬模型TOP3一周,GitHub星标3.4K,全網下載下傳量37萬。

同樣的也有MiniCPM-1.2B模型,它在參數減少50%下,仍保持上一代2.4B模型87%的綜合性能。在多個公開權威測試榜單上,1.2B模型取得了綜合性能超過阿裡通義Qwen1.8B、Llama2-7B,甚至超過Llama2-13B。

但在目前國内AI大模型商業化尚不明朗、行業加速迎來洗牌期,資本市場寒冬帶來的不确定性下,僅有技術和産品恐怕遠遠不夠。且面壁智能團隊過于年輕化,缺乏企業實際管理和商戰經驗,面壁智能未來也需解決重重難題。

一、TOC端産品面壁露卡Luca,頻頻報錯

面壁智能圍繞TOC端的基座模型産品面壁露卡Luca,去年11月獲得審批後對外開放。我們實測面壁露卡Luca時發現,其輸出的結果一言難盡。

在文本輸出能力上,當我們詢問面壁露卡Luca“您如何看待中國市場新能源汽車的價格戰時”,面壁露卡Luca首次結果顯示,政府對新能源汽車産業給予大力支援和補貼是新能源汽車價格戰的成因之一。

面壁智能如何破解商業大考?

圖源:面壁露卡Luca

二次結果顯示,新能源汽車價格戰有利于整個行業健康發展,同時也有益于消費者。三次結果顯示,這既是機遇也是挑戰。

不管首次結果和2022年新能源汽車補貼退坡取消現實情況不符,還是後二次結果的前後沖突,面壁露卡Luca的文本輸出能力仍需大幅度提高。

圖源:面壁露卡Luca

面壁智能如何破解商業大考?

圖源:面壁露卡Luca

我們将難度稍微更新,讓面壁露卡Luca幫我們寫一篇800字的小米SU7文章,本是新能源汽車的小米SU7,兩次輸出結果均顯示小米SU7是一款智能手機。

面壁智能如何破解商業大考?

圖源:面壁露卡Luca

面壁智能如何破解商業大考?

圖源:面壁露卡Luca

不知為提升小米SU7銷量,又是直播又是給車主開車門各種賣力宣傳的雷軍,看到這個結果會作何感想。更甚者說,在小米本就沒有SU7這款機型時,面壁露卡Luca的這些資訊又從何而來?

投資機構Atreides Management高層Gavin Baker曾稱,從人類回饋中進行強化學習的方法來說,若無法取得專有、即時的資料,且沒有足夠的部署管道,基礎模型或将成為曆史上折舊最快的資産。

Gavin Baker的這句話對也不對,對于各種通用大模型、經濟類大模型而言,資訊更新速度既要快也要有深度。如金融TOB類大模型,要求極高精準度,不允許出現任何錯誤,時效性也快。時效問題可能通過算力更新來解決,可精準度又要如何解決呢?

但對于如情感類、國學類小模型,以及包括學而思、網易有道等K12教育類垂直大模型來說,對資訊更新速度并不是要求很高。畢竟從古至今人性具有很大共性,K12學科類不少知識點具有固定化。面壁露卡Luca作為一款通用大模型,若文本輸出資訊屢屢出錯,又何談TOC端使用者增長呢?

在測試解讀圖檔資訊方面,我們選取網絡平台上一張同時包含中國傳統神話故事中四大神獸的圖檔。面壁露卡Luca不僅将玄武識别為獅子,且圖檔中的朱雀也未能識别出,四大神獸變成三大神獸。

面壁智能如何破解商業大考?

圖源:面壁露卡Luca

在測試邏輯推理時,我們選取2023年新課标2卷上的一道聯考數學真題,但面壁露卡Luca在識别這道真題識首問時,無法準确識别原題,更别提後面的證明過程。

面壁智能如何破解商業大考?

圖源:2023年聯考新課标2卷

面壁智能如何破解商業大考?

圖源:面壁露卡Luca

第二問将原題中的“cosax”中的a識别丢失下,面壁露卡Luca居然還能給出完整的推理過程以及a的取值範圍,這實在有些讓我們費解。

面壁智能如何破解商業大考?

圖源:面壁露卡Luca

從2023年至今國内大模型技術快速疊代,尤其是kimi、文心一言都在卷長文本輸出能力下,面壁露卡Luca的這些能力真的是2024年大模型該有的水準嗎?

二、TOB端AI Agent,商業化落地遠比想象的難

TOC端面壁露卡Luca表現欠佳,可能和面壁智能對TOB端更重視有關。圍繞TOB端,面壁智能推出基于AI代碼生成工具的ChatDev,核心能力包括快速生成應用程式、AI Agents群體智能協作等。

除面壁智能外,目前國内多家廠商也紛紛推出TOB端AI Agent。如阿裡雲ModelScopeGPT、聯彙科技OmBot、瀾碼科技AskXBot、昆侖萬維天工SkyAgents、實在智能實在Agent等等。

但AI Agent想要在國内市場探索清晰的商業化之路,仍有很長的路要走。對标SaaS産業來看,隻有給客戶帶來明确價值的SaaS産品,客戶才願意買單。小到餐飲店購買SaaS點餐軟體,大到零售行業需零售類SaaS完成日常商品進銷存、記錄供應商貨款等等。剛需性較強下,零售類SaaS也是2021年國内行業垂直SaaS最大的市場。

面壁智能如何破解商業大考?

圖源:艾瑞咨詢

AI大模型市場上,不管是淘寶上賣GPT4會員賬号付款人數較多,抖音平台各種AI課程的高轉化率。或是備受争議的李一舟AI課程的火爆,越來越多的“大佬”從質疑李一舟到成為李一舟,均符合該邏輯。

面壁智能如何破解商業大考?

圖源:達多多(資料次元:2024年1月30日至2024年2月28日)

但目前很多企業主并沒有真正意識到AI所帶來的價值,尤其是在各類SaaS已滿足企業核心業務需求以及企業紛紛追求降本增效下,企業主很難在AI Agent上投入太多費用。

即使有企業基于AI Agent做小模型,但投産比也是一大問題。有自媒體回報稱,目前包括百家号、頭條号、抖音等自媒體平台,均對AI生成的圖文、視訊嚴重限流。

企業開發小模型,一方面企業要投入大量人員從代碼部署到模型訓練,到後續企業小模型商業化推廣。另一方面,考慮到資訊安全問題,後續也需購買AI伺服器,預估整個成本約在百萬級。高投入下後續又要靠什麼攤薄成本、實作盈利?

更深層來看,給客戶帶來明确價值的背後,最好是要服務企業核心業務流程,才能讓企業主看到價值。但目前AI Agent仍需持續努力,才能滿足這些。

來自國内某網際網路大廠技術總監朱楊告訴DoNews,以阿裡雲Model Scope GPT對外宣傳的多模型協同能力,這種能力相當于“搭積木”。但積木是有限的,且若是我需要圓形積木或異形積木,它隻提供方形積木也很難滿足我的需求。同理當企業端核心業務相對複雜時,不管積木如何搭配,也無法解決業務實際需求。

同樣的情況也适用于面壁智能的ChatDev,以OTA類軟體為例,從航班查詢到機票購買,從機票推薦機制到捆綁保險,從使用者最終下單到後續改簽、退款帶來的售後,從使用者行程完成到機票價格按比例給平台會員返現。整個過程中不僅要加密緩存大量資料,且要打通如航司、支付、保險、售後等多個資料接口。

業務場景高度複雜化下,除要和對應業務産品經理确定需求外。即使AI能幫助開發人員提高編寫代碼效率,但開發人員也隻能全程手動編寫代碼,不可能全部使用AI提供的代碼。

畢竟一旦AI給到的代碼存在文法和邏輯錯誤,很容易對公司核心業務構成影響,直接影響開發人員考核。更重要的是,網際網路的軟體開發并不是簡單地編寫代碼,還有各種資料、緩存、接口、配置等基礎服務需要對接,每家企業情況又不同。

因很多大型網際網路業務成熟,想要實作重大版本更新并非易事。在網際網路流量紅利徹底退潮下,新軟體面臨着推廣成本高、使用者擷取難、盈利難的問題。這讓AI Agent陷入網際網路大企業應用少,小企業沒錢用,技術人員使用低,不懂技術的人不知道如何開發的尴尬局面,這種情況預估3—5年才有所改善。

如朱楊所言,飛書在颠覆時期員工數量超八千多人,産研人員占比2/3的情況下,近半年釋出的版本多以小更新為主,更别提資金實力不占優勢的小型網際網路企業。

面壁智能如何破解商業大考?

圖源:七麥資料

三、如何快速退去青澀,增加現實主義?

除朱楊所提到的技術問題外,AI大模型想要在TOB端占領市場也需做到:

一是AI能力對所服務企業的營運流程有所了解,并可根據這種流程進行AI能力的調整。如文生圖成為AI大模型的标配,但中大型企業對外的營銷圖有着嚴格的VI視覺規範,尤其是牽扯到品牌代言人時要求更高。那麼AI大模型針對不同企業的VI視覺規範又要如何生圖,又要如何進行限制,又要如何儲存呢?

同理,AI大模型也需對客戶業務流程中的傳入參數和傳出參數有所了解,畢竟參數是客戶的“生命線”,甚至能根據這種參數衍生出不同場景。如人臉識别的視訊流,既牽扯到橫向和豎向視訊,又牽扯到1080和1920分辨率,又牽扯到視訊畫面是否穩定、光線是否穩定等等。

二是想要和客戶業務流程耦合,AI應用也要以API Centric方式進行設計規劃。但在客戶調取API資料接口,又要如何做到悄無聲息、無影無形呢?如網際網路APP短信驗證碼登入為有形的,使用者搜尋某關鍵詞時,背景檢索關鍵詞生産内容和商品對使用者是無形的。

但國内目前又有多少AI公司能同時做到上述兩點呢?另對标SaaS産業來看,定制路線意味着回款周期長,且客戶需求差距大帶來企業投入成本高、可複制程度低。市場競争激烈下,SaaS公司議價能力低。

同時考慮到目前企業對大模型定制需求不高,如從2019年至2023年完成七輪融資的竹間智能,2023年初就推出大模型相關的産品和服務,并為大型企業自建大模型提供一站式服務。但今年年初竹間智能公告稱,因客戶需求較少停工半年。

面壁智能如何破解商業大考?

圖源:天眼查

圖源:竹間智能公告

這就意味着未來3—5年國内走TOB端商業化的AI公司很難盈利,面壁智能或将需要資本持續輸血,才能解決研發過程中資金流不足問題,進而保證技術能力始終走到前列。可若是持續引入資本,又是否會像智譜AI創始人張鵬這樣,股權被持續稀釋呢?

面壁智能如何破解商業大考?

圖源:天眼查

另外面壁智能作為初創企業,相較于大廠而言,仍有很多短闆需要補齊。

一方面,對不同行業高品質的資料積累不足,客戶資源積累深度不夠、缺乏更多實戰經驗。

另一方面,面壁智能目前團隊年齡多集中在28歲以研發人員為主,團隊稍顯年輕,缺乏明顯的商戰經驗和企業管理經驗。

如面壁智能CEO李大海曾指出,在服務TOB端時,我們傾向于選擇擅長跟客戶溝通、傳遞能力強的合作夥伴,我們提供平台、工具,合作夥伴去做好傳遞落地工作。在這個合作鍊條中,我們隻要把各自擅長做的事做好,就能一起給客戶産生價值。

短期來看,這種合作模式是能夠幫助面壁智能增加項目經驗。但長期來看,面壁智能在整個項目執行過程中充當丙方的角色,暫且不說來回溝通下,是否能完整了解客戶需求。

客戶不攥在自己手中,不進行長期的客情維護,很容易産生大客戶流失。同時大客戶回款周期相對較長,又牽扯到乙方這很容易出現三角債問題,且若是未來行業爆發和SaaS産業、資料庫産業、雲産業這樣的價格戰,面壁智能還能拿到多少利潤呢?這很容易影響到面壁智能的現金流穩健。

在和TOB端到底合作上,面壁智能高層們或許真的需要找國内老牌SaaS廠商金蝶和用友好好取經了。如何退掉身上的書生氣和理想主義,增加“江湖氣”和現實主義,将是面壁智能高層們需要盡快解決的問題。

結語:

我們始終堅信随着“清華系初創公司”的不斷努力,必然會加速國内AI産業的迅速發展,逐漸縮小和歐美在AI大模型上的差距。但企業畢竟要生存,在資本壓力下要做大規模,面壁智能對資本的依賴、團隊經驗不足等問題,整個“清華系初創公司”都存在類似。

在這些問題的解決過程中,創始人資曆和性格的不同,會讓“清華系初創公司”迎來一輪洗牌。誰能成為最後的王者,可能需要市場來給出答案。

繼續閱讀