精選聯盟

2024中國生成式AI大會演講:大模型的應用創新與落地探索

作者:消費日報

  日前,2024中國生成式AI大會成功舉辦,大會以“重構世界 奔赴未來”為主題,邀請50+位重量級嘉賓同台分享,以前瞻性視野全景式解構生成式AI的時與勢、危與機、破與立。百融雲創AI創新負責人于會上發表演講,暢談大模型的應用創新與落地探索。

  生成式AI帶來了哪些變革?

  自人工智能橫空出世以來,我們經曆了兩個時代的無聲銜接,第一個是決策式AI時代,第二個則是生成式AI時代。當下,生成式AI正以主角的姿态站在了曆史舞台中央。

  與上一個時代比,生成式AI帶來了哪些變革?

  首先是問題空間的急劇擴大。上一個AI時代,在計算機視覺資料集ImageNet上識别一張圖檔,候選集隻有1000個選項。AlphaGo在下圍棋的時候,每一輪決策的候選集有6000個選項。而到了生成式AI時代,以Llama2為例,大模型預測token的候選集有32000個選項,也就是說每吐出一個token要從32000個選項裡面找到一個最優解,問題空間變得非常大。

  其次是應用的重心也發生了改變。生成式AI技術的誕生,讓人工智能的應用方向,從感覺變成了了解、生成和推理,進而影響外部世界。

  “我認為生成式AI是通用人工智能的先導,生成式AI不直接産生通用人工智能,還需要包括智能代理、具身智能等技術的持續發展,才能無限接近通用人工智能的彼岸。”百融雲創AI創新負責人表示。

  三大視角透視大模型的本質

  大模型是生成式AI最為重要的應用成果,也是目前行業内最為熱辣滾燙的賽道。能夠成為生成式AI的明星産品,大模型到底憑什麼?

  百融雲創AI創新負責人認為大模型有三大學質,這三個本質奠定了其深刻的時代性。

  01大模型即壓縮器

  大模型的本質是一個資訊的無損壓縮器,目前最好大模型産品可以實作30倍以上的資訊壓縮比,這是一個非常驚人的數字。依靠強大的壓縮能力,大模型幾乎把所有網際網路上的人類知識都壓縮到了一個模型之中,讓其變得無所不知。

  而且這種壓縮功能不是簡單的資訊抽象化和符号化,大模型能從海量資訊裡發掘潛在規律,進而更好的預測下一個token的輸出。這使得大模型即使面對它不曾見過的情景,或者沒有見過的問題,也能進行作答,仿若人類思考和學習的方式。

  02大模型即作業系統

  每個時代都有自己的作業系統,比如PC時代的Windows,移動互聯時代的iOS和Android,人工智能時代也不例外。大模型将成為人工智能時代的底層作業系統,所有的晶片架構、算法開發等都将圍繞大模型而實作重構。

  03大模型即一種新的程式設計語言

  同時,大模型還是一種新的程式設計語言。

  有了計算機就有了程式設計語言。從曆史來看,程式設計語言一直處于進化之中,從最初的二進制,到彙編語言,再到進階語言。程式設計語言的進化史,就是程式設計門檻逐漸降低的程序。按照這個規律,人人都懂的自然語言将是程式設計語言進化的終極形态。而實際上,大模型一個prompt輸入、模型處理和輸出結果的作業形态,也完全符合程式設計的基本流程。

  面向機器的程式設計語言要求非常精準,0就是0,1就是1,不存在任何模糊和二義性的狀态。

  而面向自然語言的程式設計,沒有另行的文法定義,每個人都可以進行互動,哪怕你的語言非常抽象。但就像硬币的兩面,自然語言作為程式設計語言,雖然泛化能力強,但卻存在不夠精準的問題。比如,在“程式設計”的過程中,如果對預訓練和SFT階段的過程缺少了解,使用提示詞會有盲人摸象的感覺,使用者面對的是一個黑盒作業,隻能通過不斷調整提示詞,去尋找答案。就像是一個沒有地圖、沒有向導的探險家,穿行在一片幽深的森林中。

  大模型将成為下一代數字系統的基石與核心

  毫無疑問,大模型在技術和應用層面具有強大的颠覆性,對于企業而言這将意味着什麼呢?

  “我們認為大模型會成為下一代企業的數字系統基礎和核心。”百融雲創AI創新負責人如是說。

  過去一段時間,各企業都在推動數字化轉型,将資訊和業務流程都搬到了線上,但與此同時也産生了資訊孤島和資料孤島的問題。

  大模型擁有強大的任務了解和工具調用能力,它可以接入并串聯統合企業内部的各個系統,并根據特定任務,擷取足夠的資訊背景,緩存業務流程,以自然語言作為資訊和指令的載體,幫助企業完成業務決策和流程辦理。

  這些能力将使得大模型成為下一代數字系統的基石與核心。可以看到,目前大模型正以主動或者被動的方式,加速向産業滲透。

  百融雲創大模型探索往産業縱深推進

  作為人工智能代表性企業,百融雲創打造了大模型一站式應用開發平台,實作算力、資料和模型等AI資源的統一化管理,推動AI能力的标準化和易用化。

  平台内置了LLM應用、插件、知識庫等子產品,對外提供 API、Copilot SDK、Agent微信釘釘網頁機器人,能夠實作應用的零代碼或者低代碼開發。目前公司内部有一半的員工在平台上定制了業務助理,人機協同共同完成工作。

  “要想實作大模型在産業的進一步落地,準确性和幻覺問題是不可回避的挑戰。”百融雲創AI創新負責人表示。

  大模型想要精準,前置的資料處理環節非常重要。

  在這一環節,百融雲創打造了智能版面識别系統。很多企業内部都有大量非結構化的資料,比如員工履歷、合同、财報等,而這些資料中往往含有很多表格和圖表。

  百融雲創利用智能版面識别系統,對這些非結構化資料進行識别,得到整潔、統一、完善的資料後,再給到大模型進行處理,這将大大提高大模型的準确率。

  “我們做過一些評測,表格識别準确率能達到92%,标題識别準确率達到95%,段落識别準确率達到93%。”百融雲創AI創新負責人表示。

  在解決大模型幻覺問題上,百融雲創采用了生成式增強檢索增強生成(RAG)技術方案,并對Q&A場景專門做了模型能力的強化。這些工作不僅提高了大模型的準确性和可靠性,還使其能夠更好地了解上下文,并将檢索到的知識融入到生成過程中,進而産生更加貼合實際需求的答案。

  精準性和幻覺問題,是大模型的底層挑戰,在上層的應用流程,尤其在代碼流程、對話流程和業務流程層面,百融雲創做了大量的優化工作。

  在代碼流程方面,百融雲創推出程式設計助手BR-Coder,可以為企業提供私有化的部署,輔助開發人員做代碼的續寫、注釋和解答等工作,大幅提升開發效率。

  在對話流程方面,百融雲創通過小語言模型Prompt改寫,可以讓對話流程變得更順暢。

  在業務流程方面,百融雲創大模型能使之變得更加順暢。

  比如很多企業的資料營運場景,涉及到大量的資料查詢、需求溝通、系統開發等工作,整個業務流程非常繁瑣。百融雲創通過大模型設定了一套對話流程,使用者可以在界面上逐漸縮小需求範圍,将資料查詢工作量從幾萬張表縮減到十幾張表,然後再确定所需表名和字段名,大幅提高整個業務流程的準确率和作業效率。

  除了這些優化工作之外,百融雲創還有另外一項重大的技術探索,那就是大模型和多模态的融合。比如基于大模型和語音技術的融合,大模型和動畫影像的融合,打造的數字員工和數字人産品,能支援多國語言,提供真人級的互動體驗,能勝任多區域的線上營銷、線下接待等工作。

  百融雲創大模型技術已經在産業“落地生根”。以某城商行為例,該城商行有幾十萬名休眠白戶,百融雲創首先通過數智化的手段,對使用者進行洞察和分群,進而制定不同的政策去觸達使用者,再利用大模型與使用者進行互動,最終搭配人工實作營銷轉化。最終,在百融雲創的助力下,大量的休眠戶得到了激活,每月貢獻了上億元AUM。

繼續閱讀