精選聯盟

專訪出門問問副總裁李維:兩年内大模型的商業化爆發一定會發生

作者:九派财經

在中國本土的大模型公司中,出門問問是個特殊的存在。

它的總收入中有近七成來自AIGC及AI企業闆塊,且C端内容創作者帶來的收入正穩步上升,已開始扭虧轉盈,即将在港交所挂牌上市。

近日,在第十四屆北京國際電影節科技活動單元現場,記者見到了出門問問副總裁李維。和其他西裝革履的嘉賓不同的是,李維穿着一件藍黑色的夾克,走路的時候背脊微彎,談起大模型滔滔不絕,言辭間甚至有些犀利。

短暫的交流中,記者感受到作為“AIGC第一股”的出門問問,其在商業化路徑上的清醒與理性。李維告訴記者,不論是以短視訊創作者作為目标使用者,還是為中小企業提供搭載大模型能力的互動大屏,都是根據公司特點做出的商業化選擇,這些還隻是第一步。

專訪出門問問副總裁李維:兩年内大模型的商業化爆發一定會發生

李維在台上做主題演講。九派财經 黃依婷攝。

以下是九派财經和李維的對話(有删節):

九派财經:今年我們看到了很多大模型應用爆發,這中間發生了什麼?

李維:以前不同模态模型是單獨存在的,感覺向模态生成能力,比如語音,它和文字了解沒有關系。這樣的結果就是,如果想讓語音帶有感情色彩,就要單獨為感情色彩去做特别的模型調控,需要人為地去“硬編”。現在不需要了。

現在的大模型是在語言文字模型的基礎之上,把其它模态加進來。因為其它模态是感覺向的,但是語言得根據思維來構造,而思維是認知向的。大家用同樣的一個架構去把不同的模态,比如聲音、圖檔、視訊,都當成token(字元),把它切成碎片消化以後,建了一個“大一統”模型,然後在這裡面去做多模态。這樣就容易把各種模态之間的關系給連接配接起來,把認知能力和感覺能力融合在一起,用語言當中的認知能力去賦能不同模态,所有這些主要模态最後都是“大一統”模型裡面的一個表現形式。

九派财經:在出門問問目前的付費使用者中,短視訊内容創作者占據大多數。會期待大模型進一步在專業的電影行業裡落地嗎?

李維:總體上來說,大模型一定能夠賦能電影業。電影是一種綜合藝術,幾乎所有的模态它都涉及到,可以明顯地看到多模态大模型幫助電影工業提升效率。尤其是Sora的出現,電影界不得不重視。因為電影界隻有兩部分人,一部分擁抱AI,一部分還是用傳統方式,覺得這樣很唯美。但最終後者是拼不過前者的。因為大模型成本太低了,如果故事又能吸引人,再唯美的大導演最後在市場上還是會落敗。這個趨勢大家能看到,我們實際上也是向這方面走。

我們的第一步是在像抖音短視訊一樣的草根内容創作當中去賦能,因為相對比較容易實作商業化。我們做SaaS(平台即服務)可以把價錢砍得很低,幾千塊錢一年,這對于一個真正能夠靠生成内容去賺錢的人來說隻是一個零頭。就是說,如果你做的産品能賦能内容創作者,讓你的使用者去賺更多的錢,你就有了付費使用者。我們不做完全面向終端消費者業務的原因是,你的産品對他們來說不是必需品,不能讓他們賺錢。而付費使用者的付費意願對我們商業化是很重要的因素。是以我們首先瞄準的是内容創作者,他們賺錢了才願意把錢的一部分用來購買平台服務。

而從大的category(類目)來說,電影制作、電影從業人員當然也是内容創作者,而且是更進階的内容創作者。但是到什麼節點他們會覺得我們的産品已經到了他們能接受的檔次,這是将來要突破的門檻。

現在的大模型有一個問題,包括Sora,都有可控性的問題。就是你想讓它生成一個東西,它生成的結果有點像你想的那個,但又不完全是你想的;你要多次嘗試,有的時候它老是不聽你的話。大模型的可控性問題對全世界都是個挑戰。

九派财經:大模型賦能内容創作行業的成本降幅有估算過嗎?

李維:瓶頸不是成本,因為成本是可控的。最近我玩Suno,十幾二十美元一個月,我24小時沒日沒夜地玩,它也就收我這麼多錢,但你沒有那麼多時間去拼。你能用AI生産的數量不是瓶頸,cost(成本)也不是瓶頸,關鍵是内容創作者用AI工具生産内容出來以後,他們怎麼挑選出精品,然後推到市場上去,讓人能接受,最後帶來收入。能帶來收入他們就留下來了,帶不來收入就走掉了。是以瓶頸不在我們這裡。

九派财經:對于内容生産行業來說,版權問題尤為關鍵。關于AI生成物的版權問題,您的看法是什麼?

李維:從我們大模型行業的科學角度來看,内容被AI生成出來以後,它就不存在盜取的問題。雖然會有人說,你可能竊取了我的聲音版權,但其實是不可能的。大模型本身生成的文字、音樂、圖像或視訊,本質上不可能有侵權的問題。除非你使用了其它涉及到大模型的技術,如明星換臉視訊,當然侵犯了明星的肖像權。因為不管是盜竊、抄襲都能夠追根溯源,但完全由大模型生成的東西,你是找不到源的。它本質上是模型把所有的内容先切碎了,經過多層的神經網絡消化,再一層一層生成。這個路徑很長,到了最末端的時候,誰也搞不清源頭。

但是,如果大模型模仿名人的聲音或文字過于相似,即便真的是消化了大量内容再重新生成出來的,不是直接拷貝的,也會有侵權問題。例如,某個名人的文章或聲音素材量大到讓大模型學會了特定的風格,确實能夠生成相似的内容,這種行為介于“拷貝”和“生産”之間。

在使用者生成内容方面,我們和Suno一樣,付費使用者“擁有”自己生成的音樂,因為是你想到要去生成的,盡管這一能力由大模型賦予,但是觸發賦予過程的是你,挑選内容再去普及、推廣的也是你。實際上,我們還沒到那一步,沒規定得那麼詳細,但是原則上我認為是類似的:如果你沒有付費,你就沒有商用的權限;如果你付費了,内容就完全是你的。

九派财經:垂直大模型是大模型公司實作商業化的趨勢嗎?

李維:垂直是肯定的。實際上,一般來說是To C和To B。垂直是To B,終端消費者是To C。但是終端消費者不好做,因為有大廠,一個中小型公司沒法跟他們比拼,他們有天然的資料優勢和使用者優勢。這些優勢是中小型公司達不到的。這方面我們有意去避免直接的接觸,是以選擇了To PC,就是Professional Consumer。它好像是To C,但又是To C當中一個很特殊的群體。隻要能夠把服務做好,把門檻降低,讓他們能賺到錢,這個特殊群體就有付費意願。

To B,也就是垂直大模型,今後兩三年會看到更多規模化落地,看到開花結果。現在還隻是處于消化期。因為大模型真正發展起來也就一年半時間,讓大模型把行業資料消化,在基礎模型中去拓展行業能力,對準一個一個不同的場景,還需要時間。我相信這個時間不會超過兩年,大模型的商業化爆發一定會發生。

但是這裡面也有難處。垂直大模型想要真正有競争力,最好是企業本身就在垂直賽道中,有多年的使用者積累和資料積累。如果隻有大模型,沒有行業積累就沒有優勢。是以我們現在在垂直賽道中做的是一些相對不是很縱深的應用,比如數字員工。

最典型的一個場景是很多公司進門處放的大屏,把大屏内容變成能夠互動、有問有答的數字員工,會讓人感到很親切,也比以前要友善。我們選擇的是中小企業,不需要做私有化部署,不需要垂直很深的行業積累,是有一定橫切面、能夠跨過不同垂直賽道的體驗場景。這是根據我們公司的特點去做的商業化選擇。

九派财經:現在的大模型産品離智能湧現還有多遠?

李維:我覺得Suno已經達到了智能湧現的門檻。它可能還達不到頂級,但已經處于中上水準了。它寫的歌比一些平庸的音樂家在房子裡憋了好半天寫出的歌更加動聽。

我以前用Suno寫歌,想嘗試寫一首讓我循環放還聽不膩的歌。我玩了大概有兩個禮拜,發現真的可以達到。要會玩,不是淺嘗辄止,有相當的機率可以做出一個遠遠高于中低水準的東西出來。它的生成效率太高了,我自己現在已經有上百首了,大概有十首我聽不厭。我還拿去問我的音樂家朋友,他說這絕對不是一般人的水準。連行家都被impress(吸引)的時候,你說是不是爆發?我覺得可能算是湧現了。

既然音樂能夠湧現,其它的湧現我覺得也就是時間問題。像電影,大家都知道電影是把素材編起來的,目前的大模型還不具備這個能力,但将來也有可能學到。

其實Sora出來以後,它解決了電影的素材問題,仔細看也不僅僅是一個素材。因為它能生成一分鐘的視訊,學習了運鏡技術,有了原子素材和複合素材的差別。同一個姑娘,一個遠鏡頭、一個近鏡頭,形象不變,你知道還是同樣一個人,這時候就等于把電影當中非常關鍵的“跨素材技巧”學會了。這條延長線上就是電影制作。雖然現在整體技術還沒到這一步,但我覺得是有可能的。電影是一個綜合藝術,是一個最進階的表達形式,是以真正達到那一步的時間點可能更要往後推一點,但這個迹象能看得出來。

回到最開始的問題,現在音樂已經到了所謂“ChatGPT時刻”,被認為是“核彈爆炸”;圖檔也是,AI已經超出了一般藝術家的水準了。我們大概唯一一個還沒到達湧現時刻的就是視訊。但從趨勢上來說,今後三五年是一定能夠達到的。

九派财經記者 黃依婷 發自北京

【來源:九派新聞】

聲明:此文版權歸原作者所有,若有來源錯誤或者侵犯您的合法權益,您可通過郵箱與我們取得聯系,我們将及時進行處理。郵箱位址:jpbl@jp.jiupainews.com

繼續閱讀