亚洲精品午夜久久久久久久久久久,国产91精品久久久久久久,国产精品成人av,热99re久久免费视精品频软件,欧美一区欧美二区,在线不卡av网站,亚洲欧洲日本精品一区二区三区

每日經(jīng)濟(jì)新聞
推薦

每經(jīng)網(wǎng)首頁 > 推薦 > 正文

參數(shù)競(jìng)賽趨于冷靜 微博為何選擇在此時(shí)推出自研大模型?

2025-11-19 19:44:02

11月18日,微博發(fā)布首個(gè)自研開源大模型“VibeThinker”,規(guī)模僅15億參數(shù)。微博AI研發(fā)負(fù)責(zé)人稱,此舉旨在回歸核心場(chǎng)景,不盲目追求算力比拼。當(dāng)前大模型廠商主流選擇仍是增加參數(shù)量,但微博方面認(rèn)為小模型有響應(yīng)快、成本低等優(yōu)勢(shì)。VibeThinker或率先用于評(píng)論羅伯特,未來計(jì)劃擴(kuò)展至搜索等場(chǎng)景。

每經(jīng)記者|可楊    每經(jīng)編輯|魏官紅    

當(dāng)大模型競(jìng)爭(zhēng)從參數(shù)規(guī)模轉(zhuǎn)向落地成效,微博下場(chǎng)了。

11月18日,微博發(fā)布其首個(gè)自研開源大模型“VibeThinker”,模型規(guī)模僅15億參數(shù),訓(xùn)練成本被控制在約7800美元。

在大模型成本與資源壁壘不斷被拉高之際,為何微博選擇在此時(shí)入場(chǎng)?其選擇的輕量化技術(shù)路徑是否意味著大模型競(jìng)爭(zhēng)已出現(xiàn)新的分叉?

11月19日,微博AI(人工智能)研發(fā)負(fù)責(zé)人在接受《每日經(jīng)濟(jì)新聞》記者(以下簡(jiǎn)稱“每經(jīng)記者”)采訪時(shí)表示,微博并不是要和行業(yè)頭部比拼算力,而是回到微博的核心場(chǎng)景,把真正有效的能力沉淀下來。他認(rèn)為,大模型不必一味追求規(guī)模增大,而應(yīng)圍繞內(nèi)容理解、用戶興趣分層、文本生成等關(guān)鍵場(chǎng)景進(jìn)行針對(duì)性訓(xùn)練。

在用戶增長(zhǎng)趨穩(wěn)、信息流分發(fā)效率成為競(jìng)爭(zhēng)焦點(diǎn)的背景下,自研模型既是技術(shù)選擇,也是一種商業(yè)變量。更關(guān)鍵的問題在于:微博的輕量化路線能否真正帶來平臺(tái)體驗(yàn)或商業(yè)化效率的改善?

押注小模型:VibeThinker背負(fù)成本優(yōu)化期待

當(dāng)前,通過增加參數(shù)量來提升模型能力依舊是大模型廠商們的主流選擇,部分前沿模型的參數(shù)規(guī)模已超過萬億級(jí),埃隆·馬斯克旗下的xAI計(jì)劃明年初發(fā)布的Grok 5預(yù)計(jì)會(huì)把模型參數(shù)規(guī)模推高到6萬億左右。

微博AI研發(fā)負(fù)責(zé)人對(duì)每經(jīng)記者表示,無論是從模型制作成本、AI應(yīng)用成本、技術(shù)開放性等方面,這種模式都是不可持續(xù)的。

站在推動(dòng)AI應(yīng)用普惠的角度,已有廠商在大模型技術(shù)“摸高”的同時(shí),開始將目光轉(zhuǎn)向小模型。

上述研發(fā)負(fù)責(zé)人指出,業(yè)界普遍認(rèn)為小模型在解決復(fù)雜任務(wù)和邏輯推理方面存在天生劣勢(shì),這也是阻礙其廣泛應(yīng)用的核心障礙。但他進(jìn)一步解釋道,小模型在實(shí)際應(yīng)用中具有天然優(yōu)勢(shì):模型規(guī)模較小意味著服務(wù)響應(yīng)更快、計(jì)算成本更低,同時(shí)更易于在特定場(chǎng)景下進(jìn)行優(yōu)化。

“我們?cè)趯?shí)際AI應(yīng)用中發(fā)現(xiàn),模型規(guī)模過大導(dǎo)致服務(wù)慢、成本高、用戶體驗(yàn)差等,這促使我們探究小模型復(fù)雜邏輯能力的問題??經(jīng)過一些針對(duì)性的探索和技術(shù)改進(jìn),小模型經(jīng)過行業(yè)特有數(shù)據(jù)和合理訓(xùn)練方法,也可以具備強(qiáng)大的邏輯推理能力?!蔽⒉〢I研發(fā)負(fù)責(zé)人表示。

記者注意到,在整體業(yè)績(jī)?cè)鏊俜啪彽谋尘跋?,微博正通過AI應(yīng)用尋找新的增長(zhǎng)路徑。

財(cái)報(bào)顯示,微博三季度凈收入為4.42億美元,同比下降5%,歸屬于公司股東的凈利潤(rùn)達(dá)到2.21億美元,高于去年同期的1.31億美元。

數(shù)據(jù)背后,AI應(yīng)用正在發(fā)揮越來越重要的作用:三季度,微博智搜MAU突破7000萬,DAU和檢索量環(huán)比增長(zhǎng)超過50%,搜索總檢索量環(huán)比提升20%。AI技術(shù)正在成為微博推動(dòng)搜索生態(tài)增長(zhǎng)、增強(qiáng)平臺(tái)活躍度的重要工具。

“評(píng)論羅伯特”成小模型實(shí)驗(yàn)場(chǎng)

VibeThinker未來在微博的首要落地場(chǎng)景,很可能是其最為出圈的官方評(píng)論機(jī)器人“評(píng)論羅伯特”。

2023年底,微博推出“評(píng)論羅伯特”,目標(biāo)是在用戶發(fā)帖后自動(dòng)生成評(píng)論,以活躍社交氛圍為核心。它自稱是“天生的捧哏”“有趣的靈魂”“不知疲倦的顯眼包”,被網(wǎng)友戲稱為“賽博街溜子”。

微博用戶“張俊林say”(微博AI研發(fā)人員)在其微博中提到,團(tuán)隊(duì)在研發(fā)評(píng)論工具“羅伯特”過程中,充分挖掘了微博豐富的心理學(xué)領(lǐng)域數(shù)據(jù),增強(qiáng)了模型在心理指導(dǎo)和情感撫慰上的能力。今年初,隨著DeepSeek-R1開源論文中強(qiáng)化學(xué)習(xí)方法的公布,團(tuán)隊(duì)進(jìn)一步制作了針對(duì)評(píng)論場(chǎng)景的深度思考訓(xùn)練數(shù)據(jù),并訓(xùn)練Reward模型,推出深度思考版本的羅伯特。

然而,基座模型體量龐大,深度思考過程耗時(shí)且成本高昂。這也正是VibeThinker誕生的初衷:探索一種邏輯推理能力同樣出色、但規(guī)模更小的模型,替代大模型,使每條評(píng)論都能經(jīng)過深度思考。換言之,VibeThinker并非直接作為評(píng)論羅伯特的底層模型,但其研發(fā)起點(diǎn)源于優(yōu)化評(píng)論應(yīng)用的實(shí)際需求。

盡管VibeThinker已對(duì)外開源,但上述微博AI研發(fā)負(fù)責(zé)人在接受每經(jīng)記者采訪時(shí)強(qiáng)調(diào),VibeThinker仍處于實(shí)驗(yàn)階段,尚未在實(shí)際產(chǎn)品中大規(guī)模應(yīng)用。當(dāng)前開源版本主要側(cè)重展示模型在邏輯推理、競(jìng)賽數(shù)學(xué)和編程能力方面的潛力。“有些人會(huì)認(rèn)為這是一種垂直領(lǐng)域的能力增強(qiáng),這是一種誤解,邏輯推理能力目前是大模型最關(guān)鍵的能力,而這種能力的提升會(huì)帶動(dòng)模型解決現(xiàn)實(shí)場(chǎng)景的復(fù)雜問題。”

同時(shí),上述負(fù)責(zé)人表示,未來,VibeThinker將計(jì)劃在To C產(chǎn)品中首先應(yīng)用,尤其是在“評(píng)論羅伯特”這種能體現(xiàn)出微博數(shù)據(jù)優(yōu)勢(shì)和特色的應(yīng)用中采用,利用在微博中挖掘的優(yōu)質(zhì)領(lǐng)域數(shù)據(jù)來調(diào)整VibeThinker,然后考慮逐步擴(kuò)展到搜索、推薦等大量消耗算力的場(chǎng)景。

封面圖片來源:圖片來源:每日經(jīng)濟(jì)新聞 資料圖

如需轉(zhuǎn)載請(qǐng)與《每日經(jīng)濟(jì)新聞》報(bào)社聯(lián)系。
未經(jīng)《每日經(jīng)濟(jì)新聞》報(bào)社授權(quán),嚴(yán)禁轉(zhuǎn)載或鏡像,違者必究。

讀者熱線:4008890008

特別提醒:如果我們使用了您的圖片,請(qǐng)作者與本站聯(lián)系索取稿酬。如您不希望作品出現(xiàn)在本站,可聯(lián)系我們要求撤下您的作品。

歡迎關(guān)注每日經(jīng)濟(jì)新聞APP

每經(jīng)經(jīng)濟(jì)新聞官方APP

0

0