?? 龍蝦新聞
AI人工智能行業(yè)每日熱點,全球AI前沿動態(tài)
RoboAgent宣稱94%成功率超越GPT-4o,技術(shù)落地驗證成關(guān)鍵
RoboAgent宣稱94%成功率,但技術(shù)落地仍需驗證 星源智與北大聯(lián)合團隊最近發(fā)布了RoboAgent,在未知場景任務(wù)中宣稱達(dá)到94%成功率,性能超越GPT4o。這一成果迅速引發(fā)AI社區(qū)關(guān)注,但其未開源、未公開基準(zhǔn)復(fù)現(xiàn)細(xì)節(jié)、未發(fā)布模型權(quán)重...
Claude Opus 4.8發(fā)布:編碼智能體協(xié)作升級,推理速度提升12%
Anthropic 發(fā)布 Claude Opus 4.8:編碼與智能體協(xié)作能力再升級,推理速度提升 12% Anthropic 正式推出 Claude Opus 4.8,這是 Claude Opus 4.7 的針對性升級版本,核心聚焦于編碼...
Ktx開源:首個可執(zhí)行上下文層如何提升數(shù)據(jù)Agent生產(chǎn)環(huán)境可靠性
Hacker News熱榜第一!Ktx開源:首個可執(zhí)行上下文層,讓數(shù)據(jù)Agent在生產(chǎn)環(huán)境真正可靠 Ktx,一個全新的可執(zhí)行上下文層,今日在Hacker News登頂熱榜。它直擊數(shù)據(jù)Agent在生產(chǎn)環(huán)境中準(zhǔn)確率不足的痛點,旨在通過結(jié)構(gòu)化數(shù)據(jù)...
Claude Opus 4.8實測:推理提速12%長程任務(wù)更穩(wěn),開發(fā)者遷移指南
Claude Opus 4.8 實測:推理提速12%,長程任務(wù)更穩(wěn),已有開發(fā)者遷移 Anthropic 低調(diào)上線了 Claude Opus 4.8(API 名稱:claudeopus48),作為 4.7 版本的直接升級。官方稱其在編程、智能...
Claude 4.6中文版實測:Opus法律文書生成效率超GPT-4o,但國內(nèi)合規(guī)風(fēng)險需警惕
Claude 4.6中文版實測:Opus法律文書生成能力超GPT4o 23%,但國內(nèi)合規(guī)風(fēng)險需警惕 Claude 4.6中文版上線兩天,開發(fā)者社區(qū)的實測報告已經(jīng)鋪開。Opus 4.6在法律文書生成場景中表現(xiàn)突出,相比GPT4o效率提升約23...
文心4.5實測超越GPT-4 Turbo:中文長推理與多輪對話雙維度突破
文心4.5實測碾壓GPT4 Turbo?國產(chǎn)大模型首次在中文長推理+多輪對話雙維度反超 百度文心大模型4.5版本的實測結(jié)果表明,在中文長文本邏輯推理與多輪對話連貫性上,它首次超越了GPT4 Turbo。這標(biāo)志著國產(chǎn)大模型在核心中文應(yīng)用場景取...
清華開源AgentVerse:多智能體協(xié)作框架,Token成本直降70%
清華開源Agent神器,Token成本直降70%!“人工智障”時代終結(jié)了? 清華團隊開源了AgentVerse,一個多智能體協(xié)作框架。它通過動態(tài)任務(wù)分配和記憶共享機制,把大模型API調(diào)用成本砍掉了70%,推理效率提升3倍以上。這直接挑戰(zhàn)了傳...
清華開源PilotDeck Agent:獨立建艙架構(gòu)如何將Token成本降低70%
清華開源PilotDeck Agent:Token成本直降70%,連小龍蝦攤主都在用它自動接單 清華團隊開源了Agent系統(tǒng)PilotDeck,在開發(fā)者社區(qū)火了。它通過獨立建艙架構(gòu)和記憶可視化編輯,配合推理流程優(yōu)化,把Token成本砍掉了7...
文心4.5大模型87ms推理延遲技術(shù)解析:全棧優(yōu)化如何實現(xiàn)AI實時交互突破
文心4.5:87ms延遲背后的技術(shù)反攻 百度文心大模型4.5版本將推理延遲壓至87ms,直接對標(biāo)國際頂尖模型,標(biāo)志著中國AI大模型在實時交互賽道發(fā)起了技術(shù)反攻。 87ms:重新定義實時交互門檻 文心4.5的87ms平均推理延遲,優(yōu)于GPT4...
阿里Qwen3-Next超稀疏MoE模型發(fā)布:訓(xùn)練即推理,成本降半性能提升
阿里Qwen3Next雙模型發(fā)布:首個“訓(xùn)練即推理”MoE架構(gòu),成本砍半性能反升 阿里云發(fā)布了Qwen3Next80BA3B雙模型。這是全球首個采用“訓(xùn)練即推理”架構(gòu)的超稀疏MoE大模型。它在80B總參數(shù)下僅激活3B參數(shù),通過混合注意力機制...