?? 龍蝦新聞

阿里Qwen3-Next超稀疏MoE架構(gòu)解析：80B參數(shù)推理成本直降60%

發(fā)布時間：2026-05-23 分類：龍蝦新聞

摘要：阿里Qwen3-Next雙模型首發(fā)：80B參數(shù)+超稀疏MoE，推理成本降60%阿里云發(fā)布了Qwen3-Next-80B-A3B系列模型。它采用超稀疏MoE架構(gòu)和混合注意力機制，用架構(gòu)設(shè)計換效率，在80B參數(shù)規(guī)模下將推理成本降低了60%，為國產(chǎn)大模型探索出一條降本增效的路徑。架構(gòu)創(chuàng)新：超稀疏MoE如何實現(xiàn)效率突破Qwen3-Next的核心是超稀疏混合專家（MoE）架構(gòu)。和傳統(tǒng)Dense模型或常...

阿里Qwen3-Next雙模型首發(fā)：80B參數(shù)+超稀疏MoE，推理成本降60%

阿里云發(fā)布了Qwen3-Next-80B-A3B系列模型。它采用超稀疏MoE架構(gòu)和混合注意力機制，用架構(gòu)設(shè)計換效率，在80B參數(shù)規(guī)模下將推理成本降低了60%，為國產(chǎn)大模型探索出一條降本增效的路徑。

架構(gòu)創(chuàng)新：超稀疏MoE如何實現(xiàn)效率突破

Qwen3-Next的核心是超稀疏混合專家（MoE）架構(gòu)。和傳統(tǒng)Dense模型或常規(guī)MoE不同，這個架構(gòu)總參數(shù)80B，但每次推理只激活3B參數(shù)，激活比例只有3.75%。處理每個token時，模型只調(diào)用極少數(shù)專家網(wǎng)絡(luò)，計算量大幅減少。

混合注意力機制進一步優(yōu)化了效率。模型在不同層采用不同注意力策略：一些層用全局注意力捕捉長距離依賴，一些層用局部注意力降低計算復(fù)雜度。這種分層設(shè)計在保持能力的同時，顯著減少了內(nèi)存占用和計算開銷。

實用性突破：60%成本降低的落地意義

推理成本降低60%對開發(fā)者是實質(zhì)性利好。以企業(yè)級API調(diào)用為例，原來每月10萬元的推理成本能降到4萬元，更多中小企業(yè)能負擔(dān)得起大模型服務(wù)。成本下降直接降低了AI應(yīng)用的試錯門檻，加速創(chuàng)新迭代。

超長上下文處理是另一大亮點。模型支持128K token上下文窗口，結(jié)合稀疏注意力機制，能高效處理長文檔分析、代碼庫理解等復(fù)雜任務(wù)。這對AI Agent應(yīng)用很關(guān)鍵——Agent需要長期記憶和復(fù)雜推理，超長上下文提供了必要的技術(shù)基礎(chǔ)。

行業(yè)信號：國產(chǎn)模型的架構(gòu)優(yōu)化路徑

Qwen3-Next的發(fā)布標(biāo)志著國產(chǎn)大模型開始從“參數(shù)競賽”轉(zhuǎn)向“效率競賽”。在算力受限的背景下，通過架構(gòu)創(chuàng)新而非單純擴大參數(shù)規(guī)模來提升性能，成為更具可持續(xù)性的路徑。這和全球AI行業(yè)“降本增效”的主流趨勢一致。

模型采用雙版本策略：Qwen3-Next-80B-A3B-Base和Qwen3-Next-80B-A3B-Instruct分別針對預(yù)訓(xùn)練和指令跟隨場景，給開發(fā)者提供了更靈活的選擇。這種精細化設(shè)計體現(xiàn)了對實際應(yīng)用場景的深入思考。

技術(shù)細節(jié)：稀疏激活的實際運作

實際推理時，模型通過門控網(wǎng)絡(luò)動態(tài)選擇激活哪些專家。每個token只激活前k個最相關(guān)的專家（k值通常為2-4），其余專家保持靜默。這種稀疏激活讓80B參數(shù)的模型能以接近3B Dense模型的計算成本運行。

混合注意力包含三個關(guān)鍵組件：滑動窗口注意力處理局部信息，全局注意力捕捉長程依賴，稀疏注意力降低計算復(fù)雜度。三者協(xié)同工作，在128K上下文長度下仍能保持穩(wěn)定的推理速度。

生態(tài)影響：對AI Agent開發(fā)的支撐

對AI Agent開發(fā)者來說，Qwen3-Next是理想的基礎(chǔ)模型。低成本推理讓Agent能進行更頻繁的推理和決策，超長上下文支持Agent維護更復(fù)雜的狀態(tài)和記憶。這有助于開發(fā)出更智能、更自主的AI助手。

模型在工具調(diào)用和代碼生成方面的表現(xiàn)也值得期待。80B參數(shù)規(guī)模提供了足夠的知識容量，而稀疏激活保證了響應(yīng)速度，這種平衡特別適合需要實時交互的Agent應(yīng)用場景。

行業(yè)展望：效率優(yōu)先的新階段

Qwen3-Next發(fā)布后，大模型競爭正式進入效率優(yōu)先的新階段。未來可能會看到更多通過架構(gòu)創(chuàng)新實現(xiàn)性能突破的模型，而不是簡單的參數(shù)堆砌。這種趨勢將推動AI技術(shù)更快速地滲透到各個行業(yè)。

對開發(fā)者來說，現(xiàn)在是評估和遷移的好時機。建議技術(shù)團隊開始測試Qwen3-Next在具體業(yè)務(wù)場景中的表現(xiàn)，特別是那些對成本敏感或需要長上下文處理的應(yīng)用。早期采用者將獲得顯著的技術(shù)和成本優(yōu)勢。

龍蝦AI快訊 | 2025年9月12日
關(guān)注龍蝦官網(wǎng)(m.gsdl.org.cn)，獲取最新AI模型動態(tài)與深度技術(shù)解析

返回首頁

久久一级二级,日本熟人妻中文字幕在线|...久久国产精品-国产精品_日本一区二区三区中文字幕,中文字慕五区,欧美日韩精品一级,9干视频在线,一线在线不卡免费,亚洲天堂久久在线观看,亚洲天堂激情一区,丁香激情四月