精選聯盟

中國AI大模型的差異化發展之路

作者:中國經營報

本版文章均由本報記者曲忠芳采寫

聲音

近兩年來,AI大模型持續占據全球科技界的“頂流”位置,至今熱度居高不下。因具有實質性突破的ChatGPT、Sora均出自美國人工智能公司OpenAI,中國如何發展大模型、實作差異化突圍成為行業内外關注的焦點問題。對此,業界有一個形象的比喻:中國發展大模型不能跟美國“打籃球賽”,一直跟随容易“滿場亂飛”,而應當使用“下圍棋”的方法,在技術相對落後的情況下,通過大模型賦能各個産業領域,以實作人工智能在應用上的突破和提升。

北京瑞泊控股(集團)有限公司(以下簡稱“瑞泊”)是中國最早進入預訓練大模型技術領域的團隊之一,自2018年起與OpenAI這些國際主流AI實驗室同步開始預訓練大模型及相關應用的研發,瑞泊核心團隊在自然語言處理技術上已有超過十年的技術積累。瑞泊先後獲得國家級科研機構2021年科技成果轉移轉化一等獎、被譽為人工智能界“奧林匹克金牌”的2022年“中國AI金雁獎”技術創新大獎、2023年中國十大大模型案例及國家特色産業叢集賦能典型案例大獎。目前,瑞泊VIDYA智慧認知大模型已應用服務于金融、工業、IT運維等衆多行業領域。

為了深入了解中國大模型技術的發展狀況,尤其是在各個行業領域的賦能價值與應用潛力,《中國經營報》記者近日專訪了瑞泊創始人、董事長乙壤月博士。

在行業落地方面中美起步差不多

大模型是“大力出奇迹”的工程成果,以大參數、大算力、強算法為顯著特征,“規模定律”(Scaling Law)也被大模型廠商奉為圭臬。目前大陸已有超過100個大模型,但由于算力被“卡脖子”,大陸大模型的算力參數與美國相比差距在逐漸拉大。基于這種客觀現實,中國大模型的從業者需要運用“下圍棋”的智慧,從虛與實、攻與防、利弊權衡之間找到一條新的突圍路徑。

《中國經營報》:你怎麼看中國和美國在大模型領域的差距?

乙壤月:我們都知道,從ChatGPT到Sora,OpenAI的“暴力美學”屢試不爽。這種方法論,實際就是在目前技術和硬體條件下,通過大規模地投入來推動人工智能發展的可行性和有效性。在通用人工智能大模型的基礎研發方面,中國與美國是存在客觀差距的,且這個差距短期還有可能進一步拉大,我們從人才教育培養,以及算力、晶片、深度學習架構等核心技術攻關層面,都有較大的追趕空間。

在正視差距的同時,我們也要對中國人工智能的發展保持信心。需要強調的是,這裡的信心并不是單純的民族情緒,而是有真正底層支撐的信心,因為中國在發展人工智能方面擁有獨特的優勢——這些優勢可能是包括美國、歐洲等其他國家和地區市場所不具備的,總結起來就是三點:需求規模大、産業配套全、應用場景多。從中央到地方的政策層面也能看到,新質生産力、人工智能+行動、智能制造、面向金融及工業領域等關鍵垂直的大模型等等,都在試圖将優勢擴大深化。

我一直認為,應當把通用大模型與垂類大模型分開來看,在後者大模型的各行業應用,我們和美國的起步是差不多的,我們并不落後,甚至是領先的。

《中國經營報》:垂類大模型與通用大模型相比有什麼差別?

乙壤月:大模型的底層技術原理實際是一樣的,無論是哪一類模型,共同目标都是利用大資料和複雜算法來模拟、了解以及生成人類的語言和知識,進而在各自的應用場景中發揮作用。

通用大模型是以廣泛的、跨領域的資料為基礎建構的,其訓練資料來自網際網路、書籍、報紙等多種多樣的來源,能夠掌握和生成包含廣泛知識的内容。行業大模型相當于專門業務領域的專家,通過深入學習特定行業或領域的資料,在專業領域内提供更加精确、深入的分析和解決方案。

簡而言之,二者的專業深度和應用範圍有較大的差別。可以類比通識教育,到了大學大學的三四年級可能就要往專業方向上走,變成一個專才,才能在人才市場更具優勢。通用大模型擅長處理廣泛的問題,擁有寬廣的知識面,但在特定領域的深度和精準度上遠不及專門訓練的行業大模型,行業大模型則專注于深入挖掘特定領域的知識,提供更專業、更精确的服務和解決方案。

除了專業性,另一個方面是涉及企業的資訊和資料安全,很多企業的資料按照法律法規的要求是“不出門”的,那就必須本地化部署自己的專屬大模型。

企業應避免盲目追求新技術

AI大模型浪潮勢不可擋,在衆多企業投身AI大模型賽道的同時,各行各業也都在争相擁抱AI大模型,希望大模型能夠推動行業的變革與創新發展。作為行業大模型提供商的瑞泊團隊真切地感受到需求側對于運用AI大模型的迫切與熱情,唯恐錯過而被市場所淘汰。

《中國經營報》:從瑞泊的業務感覺來看,需求側現在對于大模型的認知與了解跟去年相比有變化嗎?

乙壤月:變化非常明顯,政、産、研的客戶或合作夥伴,都對大模型表現出很高的熱情。去年,我們在與客戶的溝通中經常需要進行技術科普,解釋大模型的基本概念和原理。而今年,很多客戶更關注的是如何将大模型應用到具體的業務場景中,以實作成本降低和效率提升。這一轉變反映出社會對新技術的快速适應和渴望通過技術創新促進企業成長的共識。

《中國經營報》:在這一波的AI大模型浪潮中,瑞泊的定位是什麼?你們着重解決的問題是什麼?

乙壤月:瑞泊VIDYA大模型專注垂直行業領域,瑞泊的定位是關鍵行業的“超腦建構者”。行業大模型是“超腦”的組成部分之一,超腦還涵蓋行業專業模型、大模型原生技術元件、前端AI應用叢集等。因為單靠大模型是無法完成那麼多智能化的行業應用需求的,瑞泊行業超腦已成功在金融、工業、航運、IT運維等關鍵行業落地生根,我們可能是國内最早商業化的,以大模型為核心的超腦研發企業。瑞泊提供的是嵌入式的服務,通過聯合實驗室,甚至股權合作的方式完全跟客戶綁定,為企業集團、政府機構、城市建設“量身定制”注重降本增效及價值創造的數字化建設及轉型解決方案,跟瑞泊合作的客戶基本是基于長期主義的,奔着未來十年、二十年一直合作下去的。

《中國經營報》:對于企業應用大模型技術的熱情,你覺得有提醒注意的地方嗎?

乙壤月:雖然大模型技術帶來了許多重要價值,但企業在投入使用前應進行充分的成本效益分析。確定技術投資與預期回報相比對,避免因過度投資新技術而影響企業的财務健康。同時,合理設定技術應用的目标和期望,管理内外部的預期,避免過高期望帶來的失望和挫敗感。

首先,企業在選擇時應重視産品的品質、安全性和可控性,避免因技術選型不當而帶來潛在的法律風險和安全隐患。尤其對于涉及國家核心産業和關鍵領域的企業,使用不可控的開源大模型和API接口存在較大風險。在目前的國際環境下,確定技術的安全性和資料的主權尤為重要,故建議優先考慮國産、可信賴的技術解決方案。

其次,避免盲目追求新技術,企業應深入分析自身的業務需求和痛點,以確定技術的應用能夠帶來實際的商業價值和社會價值,避免因追求技術而忽略了技術應用的實際效益和合理性。

再次,在使用大模型技術時,企業必須重視資料隐私保護和安全性問題。不論是在中國,還是在全球範圍内,安全合規的重要性日益凸顯。

最後,技術的适配性與內建問題需關注,技術內建是實作大模型技術落地的關鍵步驟,企業需要考慮大模型技術與現有系統的相容性,確定新技術的引入不會幹擾原有業務流程的正常運作。

未來20年是大模型普及的階段

大模型是通往AGI(通用人工智能)的終極密碼嗎?目前業界仍衆說紛纭,莫衷一是。但是當被問及如何看待以大模型為代表的新一輪AI熱潮時,乙壤月在采訪中給出了一個頗為肯定的回答,他認為“大模型技術的突破,至少是文明級的技術突破”。

《中國經營報》:你為什麼認為“大模型至少是文明級的技術突破”?

乙壤月:人類的發展是一個漫長的曆史過程,科學技術的發展對人類文明的形成與演進,起着至關重要的作用,科技的發展是疊加性進步且不斷加速的。上一次人類文明級的技術突破是蒸汽機,蒸汽機技術把熱能轉換成動能,使人類第一次完成了在生産勞動中以“熱力”代替人的“體力”的革命性飛躍;而這一次大模型技術的突破,是将“電能”轉換成了“智能”,增加了腦力勞動的不斷輸出,是機器智能對人類智能賦能及替代的開端。

說大模型是文明級的技術突破,也是因為大模型的“湧現能力”,機器開始能夠了解人類的語言并且開始“會說人話”了。人與其他動物最本質的差別,在于人類具有高度發達的語言能力,語言被認為是人類智能的标志性能力,當人類沒有語言的時候,我們其實無法去廣泛認知這個世界,語言的邊界其實就是世界的邊界。正如《人類簡史》中所描述——“智人之是以能夠成為這個星球唯一霸主,一個重要的原因是他們發展出了虛拟的語言。”我們常說的大模型全稱是“預訓練大語言模型”,随着大模型技術的突破,人類獨有的語言能力被打破,人機關系呈現出新的特征,因為機器帶來的語言邊界的擴大将導緻我們認知的世界邊界的擴大。機器掌握了語言,強人工智能時代就到來了。當然,實作AGI這一過程一定是漸進的、不斷疊代的。

《中國經營報》:瑞泊創立之初,國内外的大模型領域是一個什麼樣的狀态?

乙壤月:大模型技術屬于人工智能科學中自然語言處理的子領域,很長時間以來都是比較冷門的,因為難度大、門檻高,譬如對于算力、技術、資料的要求都很高,更關鍵的是它還走了與其他“門派”大相徑庭的技術路線——曆史上大部分人工智能研究都非常依賴人類的直覺和經驗,試圖通過精心設計的規則和算法來模拟人類的智能,但它的問題在于人類知識的有限性以及對特定領域的偏見。相反,大模型是利用海量的算力和資料,通過讓模型自監督學習的方法來取得讓人驚訝的成果。強化學習之父、加拿大計算機科學家理查德·薩頓在《苦澀的教訓》一書中說:“過去七十年來,AI 研究走過的最大彎路就是過于重視人類既有經驗和知識。”是以大模型研究團隊一直是“孤勇者”。

一般機構下不了決心做這種投入很大、很少人選擇且前景很不明确的領域,因為算不過來賬。瑞泊開始進行投入預訓練大模型技術的時點,跟國際主流的AI實驗室基本是同步的,當時國内也就大概七八個機構是明确有團隊在跟蹤這項技術的,美國的情況也差不多,但是美國的投入确實要比我們大很多,差着好幾個數量級。我們的感受是這個過程很孤獨,像在茫茫大海中尋找新大陸,沒有信仰是不可能堅持下來的。

《中國經營報》:你怎麼看中國人工智能發展的未來?中國的企業家應當扮演什麼樣的角色?

乙壤月:未來20年将是大模型普及的年代,生活和工作的方方面面都會充斥着大模型。大模型涉及國家安全與國際競争,大陸會避免晶片、作業系統這些核心領域“落後”的曆史重演,尤其是會避免生态被外部所控,核心領域不會使用國外或者不可控的開源系統。

人工智能技術的發展并不是孤立發生的,它需要與企業的核心業務深度融合,才能發揮出真正的商業價值。這就要求企業家不僅要關注技術本身,更要深刻了解自己的業務和市場,進而引領企業在正确的方向上進行技術創新和應用。

我很欣賞美團創始人王興對于企業經營的一個總結:“我們吃了很多虧,交了很多學費,才明白這個世界沒有神話,隻有一些很樸素的道理。便宜的打敗貴的、品質好的打敗品質差的、認真的打敗輕率的、耐心的打敗浮躁的、勤奮的打敗懶惰的、有信譽的打敗沒信譽的。”

對于中國的企業家和創業者們來說,建設人工智能和大模型,這些道理其實就是:資料的品質勝于數量、耐心和細緻的研究勝過浮躁和急躁、持續的學習和适應能力勝過一成不變的模式。最後,我想把諾貝爾實體學獎獲得者理查德·費曼的一句話與大家共勉:“凡是我還不能創造的,就是我還沒有了解。”

老闆秘籍

1.如何讓大模型更好地在各行業落地?

單靠大模型是無法完成那麼多智能化的行業應用需求的,瑞泊提供的是嵌入式的服務,通過聯合實驗室,甚至股權合作的方式完全跟客戶綁定,為企業集團、政府機構、城市建設“量身定制”注重降本增效及價值創造的數字化建設及轉型解決方案,跟瑞泊合作的客戶基本是基于長期主義的,奔着未來十年、二十年一直合作下去的。

2.對于企業應用大模型技術的建議?

雖然大模型技術帶來了許多重要價值,但企業在投入使用前應進行充分的成本效益分析。確定技術投資與預期回報相比對,避免因過度投資新技術而影響企業的财務健康。

首先,企業在選擇時應重視産品的品質、安全性和可控性,避免因技術選型不當而帶來潛在的法律風險和安全隐患。

其次,避免盲目追求新技術,企業應深入分析自身的業務需求和痛點,以確定技術的應用能夠帶來實際的商業價值和社會價值。同時,企業要合理設定技術應用的目标和期望。

再次,在使用大模型技術時,企業必須重視資料隐私保護和安全性問題。

最後,技術的适配性與內建問題需關注,企業需要考慮大模型技術與現有系統的相容性,確定新技術的引入不會幹擾原有業務流程的正常運作。

深度

邁向AGI是一個漸進的過程

人工智能科學從20世紀中葉誕生至今,經曆了幾波冷熱交替的發展浪潮,其間機器學習、資料挖掘、知識圖譜、專家系統、圖像識别、語音識别、自然語言處理等細分領域技術輪番登場。或許是因為長期以來受到科幻小說、影視作品的影響,人們對科技的發展與進步總是寄予“一步到位”“瞬間變身”的想象,而事實上,科技的演進——從大模型這些技術邁向通用人工智能(AGI)是一個漸進式的、進步力量不斷疊加的過程,很多人可能身在其中卻感受不強烈。

乙壤月和瑞泊團隊從大模型技術最初的冷門階段走來,又在最近一年多來真切感受到行業的火熱。他試圖站立在人類文明發展的曆程中來觀察,并基于自己的認知方法論去闡釋其大模型是文明級的技術突破論點,這在衆說紛纭的大模型觀點争鋒中提供了一種新的思考視角。

與此同時,中國人工智能發展的實際水準究竟如何?在日益白熱化的全球科技比拼中,大陸能否占領競争高地?這些最受關注的問題,是對包括瑞泊團隊在内的所有中國AI從業者的靈魂拷問。在采訪過程中,乙壤月多次強調中國發展人工智能的優勢與信心,并且給出了自己的解釋與論證。他認為,幾乎所有産業都在或者即将因為人工智能系統及技術的應用而發生深刻的變化,同時将會創造出全新的服務産業形态和模式。

2024年《政府工作報告》中提出:大力推進現代産業體系建設,加快發展新質生産力。強調要深化大資料、人工智能等研發應用,開展“人工智能+”行動。這是“人工智能+”首次被寫入《政府工作報告》。顯然,人工智能正在成為新質生産力的核心引擎,成為整個經濟社會發展變革的基礎性力量。作為中國的AI從業者,乙壤月提醒要回歸到最本質的初心,重視資料品質,投入耐心與細緻的研究,朝着社會文明變革的方向腳踏實地前進。

履歷

乙壤月

北京瑞泊控股(集團)有限公司創始人、董事長,研究員,清華大學五道口金融學院/日内瓦大學金融學博士、香港理工大學管理學博士。

創立瑞泊前曾在華為集團工作多年,先後從事技術、市場及綜合管理等方面的工作。曾擔任京東商城集團副總裁,擁有超過20年豐富大型IT企業及創業企業管理經驗。

繼續閱讀