參數(shù)競(jìng)賽趨于冷靜微博為何選擇在此時(shí)推出自研大模型？

2025-11-19 19:44:02

11月18日，微博發(fā)布首個(gè)自研開源大模型“VibeThinker”，規(guī)模僅15億參數(shù)。微博AI研發(fā)負(fù)責(zé)人稱，此舉旨在回歸核心場(chǎng)景，不盲目追求算力比拼。當(dāng)前大模型廠商主流選擇仍是增加參數(shù)量，但微博方面認(rèn)為小模型有響應(yīng)快、成本低等優(yōu)勢(shì)。VibeThinker或率先用于評(píng)論羅伯特，未來計(jì)劃擴(kuò)展至搜索等場(chǎng)景。

每經(jīng)記者｜可楊每經(jīng)編輯｜魏官紅

當(dāng)大模型競(jìng)爭(zhēng)從參數(shù)規(guī)模轉(zhuǎn)向落地成效，微博下場(chǎng)了。

11月18日，微博發(fā)布其首個(gè)自研開源大模型“VibeThinker”，模型規(guī)模僅15億參數(shù)，訓(xùn)練成本被控制在約7800美元。

在大模型成本與資源壁壘不斷被拉高之際，為何微博選擇在此時(shí)入場(chǎng)？其選擇的輕量化技術(shù)路徑是否意味著大模型競(jìng)爭(zhēng)已出現(xiàn)新的分叉？

11月19日，微博AI（人工智能）研發(fā)負(fù)責(zé)人在接受《每日經(jīng)濟(jì)新聞》記者（以下簡(jiǎn)稱“每經(jīng)記者”）采訪時(shí)表示，微博并不是要和行業(yè)頭部比拼算力，而是回到微博的核心場(chǎng)景，把真正有效的能力沉淀下來。他認(rèn)為，大模型不必一味追求規(guī)模增大，而應(yīng)圍繞內(nèi)容理解、用戶興趣分層、文本生成等關(guān)鍵場(chǎng)景進(jìn)行針對(duì)性訓(xùn)練。

在用戶增長(zhǎng)趨穩(wěn)、信息流分發(fā)效率成為競(jìng)爭(zhēng)焦點(diǎn)的背景下，自研模型既是技術(shù)選擇，也是一種商業(yè)變量。更關(guān)鍵的問題在于：微博的輕量化路線能否真正帶來平臺(tái)體驗(yàn)或商業(yè)化效率的改善？

押注小模型：VibeThinker背負(fù)成本優(yōu)化期待

當(dāng)前，通過增加參數(shù)量來提升模型能力依舊是大模型廠商們的主流選擇，部分前沿模型的參數(shù)規(guī)模已超過萬億級(jí)，埃隆·馬斯克旗下的xAI計(jì)劃明年初發(fā)布的Grok 5預(yù)計(jì)會(huì)把模型參數(shù)規(guī)模推高到6萬億左右。

微博AI研發(fā)負(fù)責(zé)人對(duì)每經(jīng)記者表示，無論是從模型制作成本、AI應(yīng)用成本、技術(shù)開放性等方面，這種模式都是不可持續(xù)的。

站在推動(dòng)AI應(yīng)用普惠的角度，已有廠商在大模型技術(shù)“摸高”的同時(shí)，開始將目光轉(zhuǎn)向小模型。

上述研發(fā)負(fù)責(zé)人指出，業(yè)界普遍認(rèn)為小模型在解決復(fù)雜任務(wù)和邏輯推理方面存在天生劣勢(shì)，這也是阻礙其廣泛應(yīng)用的核心障礙。但他進(jìn)一步解釋道，小模型在實(shí)際應(yīng)用中具有天然優(yōu)勢(shì)：模型規(guī)模較小意味著服務(wù)響應(yīng)更快、計(jì)算成本更低，同時(shí)更易于在特定場(chǎng)景下進(jìn)行優(yōu)化。

“我們?cè)趯?shí)際AI應(yīng)用中發(fā)現(xiàn)，模型規(guī)模過大導(dǎo)致服務(wù)慢、成本高、用戶體驗(yàn)差等，這促使我們探究小模型復(fù)雜邏輯能力的問題??經(jīng)過一些針對(duì)性的探索和技術(shù)改進(jìn)，小模型經(jīng)過行業(yè)特有數(shù)據(jù)和合理訓(xùn)練方法，也可以具備強(qiáng)大的邏輯推理能力?！蔽⒉〢I研發(fā)負(fù)責(zé)人表示。

記者注意到，在整體業(yè)績(jī)?cè)鏊俜啪彽谋尘跋?，微博正通過AI應(yīng)用尋找新的增長(zhǎng)路徑。

財(cái)報(bào)顯示，微博三季度凈收入為4.42億美元，同比下降5%，歸屬于公司股東的凈利潤(rùn)達(dá)到2.21億美元，高于去年同期的1.31億美元。

數(shù)據(jù)背后，AI應(yīng)用正在發(fā)揮越來越重要的作用：三季度，微博智搜MAU突破7000萬，DAU和檢索量環(huán)比增長(zhǎng)超過50%，搜索總檢索量環(huán)比提升20%。AI技術(shù)正在成為微博推動(dòng)搜索生態(tài)增長(zhǎng)、增強(qiáng)平臺(tái)活躍度的重要工具。

“評(píng)論羅伯特”成小模型實(shí)驗(yàn)場(chǎng)

VibeThinker未來在微博的首要落地場(chǎng)景，很可能是其最為出圈的官方評(píng)論機(jī)器人“評(píng)論羅伯特”。

2023年底，微博推出“評(píng)論羅伯特”，目標(biāo)是在用戶發(fā)帖后自動(dòng)生成評(píng)論，以活躍社交氛圍為核心。它自稱是“天生的捧哏”“有趣的靈魂”“不知疲倦的顯眼包”，被網(wǎng)友戲稱為“賽博街溜子”。

微博用戶“張俊林say”（微博AI研發(fā)人員）在其微博中提到，團(tuán)隊(duì)在研發(fā)評(píng)論工具“羅伯特”過程中，充分挖掘了微博豐富的心理學(xué)領(lǐng)域數(shù)據(jù)，增強(qiáng)了模型在心理指導(dǎo)和情感撫慰上的能力。今年初，隨著DeepSeek-R1開源論文中強(qiáng)化學(xué)習(xí)方法的公布，團(tuán)隊(duì)進(jìn)一步制作了針對(duì)評(píng)論場(chǎng)景的深度思考訓(xùn)練數(shù)據(jù)，并訓(xùn)練Reward模型，推出深度思考版本的羅伯特。

然而，基座模型體量龐大，深度思考過程耗時(shí)且成本高昂。這也正是VibeThinker誕生的初衷：探索一種邏輯推理能力同樣出色、但規(guī)模更小的模型，替代大模型，使每條評(píng)論都能經(jīng)過深度思考。換言之，VibeThinker并非直接作為評(píng)論羅伯特的底層模型，但其研發(fā)起點(diǎn)源于優(yōu)化評(píng)論應(yīng)用的實(shí)際需求。

盡管VibeThinker已對(duì)外開源，但上述微博AI研發(fā)負(fù)責(zé)人在接受每經(jīng)記者采訪時(shí)強(qiáng)調(diào)，VibeThinker仍處于實(shí)驗(yàn)階段，尚未在實(shí)際產(chǎn)品中大規(guī)模應(yīng)用。當(dāng)前開源版本主要側(cè)重展示模型在邏輯推理、競(jìng)賽數(shù)學(xué)和編程能力方面的潛力。“有些人會(huì)認(rèn)為這是一種垂直領(lǐng)域的能力增強(qiáng)，這是一種誤解，邏輯推理能力目前是大模型最關(guān)鍵的能力，而這種能力的提升會(huì)帶動(dòng)模型解決現(xiàn)實(shí)場(chǎng)景的復(fù)雜問題。”

同時(shí)，上述負(fù)責(zé)人表示，未來，VibeThinker將計(jì)劃在To C產(chǎn)品中首先應(yīng)用，尤其是在“評(píng)論羅伯特”這種能體現(xiàn)出微博數(shù)據(jù)優(yōu)勢(shì)和特色的應(yīng)用中采用，利用在微博中挖掘的優(yōu)質(zhì)領(lǐng)域數(shù)據(jù)來調(diào)整VibeThinker，然后考慮逐步擴(kuò)展到搜索、推薦等大量消耗算力的場(chǎng)景。

封面圖片來源：圖片來源：每日經(jīng)濟(jì)新聞資料圖

如需轉(zhuǎn)載請(qǐng)與《每日經(jīng)濟(jì)新聞》報(bào)社聯(lián)系。
未經(jīng)《每日經(jīng)濟(jì)新聞》報(bào)社授權(quán)，嚴(yán)禁轉(zhuǎn)載或鏡像，違者必究。

讀者熱線：4008890008

特別提醒：如果我們使用了您的圖片，請(qǐng)作者與本站聯(lián)系索取稿酬。如您不希望作品出現(xiàn)在本站，可聯(lián)系我們要求撤下您的作品。

上一篇文章

大川新材（834193）：公司擬轉(zhuǎn)讓全資子公司杭州銀湖化工有限公司100%股權(quán)

返回每經(jīng)網(wǎng)首頁

下一篇文章

俄羅斯警告高市早苗！

相關(guān)文章