亚洲无码高清观看,成人国产A片免费看

DoNews > 商業(yè) > 豆包大模型2.0發(fā)布，專家模式上線，多數(shù)基準(zhǔn)達(dá) SOTA 水平

豆包大模型2.0發(fā)布，專家模式上線，多數(shù)基準(zhǔn)達(dá) SOTA 水平

李旭 2026-02-14 14:08:03

157341

分享到

DoNews2月14日消息，今天，豆包大模型正式進(jìn)入2.0階段。

隨著Agent時(shí)代到來，大模型將在現(xiàn)實(shí)世界發(fā)揮更大作用。豆包2.0（Doubao-Seed-2.0）圍繞大規(guī)模生產(chǎn)環(huán)境下的使用需求做了系統(tǒng)性優(yōu)化，依托高效推理、多模態(tài)理解與復(fù)雜指令執(zhí)行能力，更好地完成真實(shí)世界復(fù)雜任務(wù)。

豆包2.0系列包含Pro、Lite、Mini三款通用Agent模型和Code模型，靈活適配各類業(yè)務(wù)場(chǎng)景：

豆包2.0 Pro面向深度推理與長鏈路任務(wù)執(zhí)行場(chǎng)景，全面對(duì)標(biāo)GPT 5.2與Gemini 3 Pro；
2.0 Lite兼顧性能與成本，綜合能力超越上一代主力模型豆包1.8；
2.0 Mini面向低時(shí)延、高并發(fā)與成本敏感場(chǎng)景；
Code版（Doubao-Seed-2.0-Code）專為編程場(chǎng)景打造，與TRAE結(jié)合使用效果更佳。

目前，豆包2.0 Pro已在豆包App、電腦端和網(wǎng)頁版上線，用戶選擇「專家」模式即可對(duì)話體驗(yàn)；豆包2.0 Code接入了AI編程產(chǎn)品TRAE；面向企業(yè)和開發(fā)者，火山引擎也已上線豆包2.0系列模型API服務(wù)。

多模態(tài)理解能力全面升級(jí)，多數(shù)基準(zhǔn)達(dá) SOTA 水平

豆包 2.0 全面升級(jí)了多模態(tài)能力，在各類視覺理解任務(wù)上均達(dá)到世界頂尖水平，視覺推理、感知能力、空間推理與長上下文理解能力表現(xiàn)尤為突出，豆包 2.0 Pro 在大多數(shù)相關(guān)基準(zhǔn)測(cè)試中取得最高分。

面對(duì)動(dòng)態(tài)場(chǎng)景，豆包 2.0 強(qiáng)化了對(duì)時(shí)間序列與運(yùn)動(dòng)感知的理解能力，在 TVBench 等關(guān)鍵測(cè)評(píng)中處于領(lǐng)先位置，且在 EgoTempo 基準(zhǔn)上超過了人類分?jǐn)?shù)，表明它對(duì)“變化、動(dòng)作、節(jié)奏”這類信息的捕捉更為穩(wěn)定，在工程側(cè)可用性更高。

長視頻場(chǎng)景中，豆包 2.0 在大多評(píng)測(cè)上超越了其他頂尖模型，且在多個(gè)流式實(shí)時(shí)問答視頻基準(zhǔn)測(cè)試中表現(xiàn)優(yōu)異，能作為 AI 助手完成實(shí)時(shí)視頻流分析、環(huán)境感知、主動(dòng)糾錯(cuò)與情感陪伴，實(shí)現(xiàn)從被動(dòng)問答到主動(dòng)指導(dǎo)的交互升級(jí)，可應(yīng)用于健身、穿搭等陪伴場(chǎng)景。

LLM 與 Agent 表現(xiàn)大幅強(qiáng)化，長程任務(wù)執(zhí)行能力提升

提升長程任務(wù)執(zhí)行能力，需要豐富的真實(shí)世界知識(shí)。通過加強(qiáng)長尾領(lǐng)域知識(shí)，豆包 2.0 Pro 在 SuperGPQA 上分?jǐn)?shù)超過 GPT 5.2，并在 HealthBench 上拿到第一名，在科學(xué)領(lǐng)域的整體成績與 Gemini 3 Pro 和 GPT 5.2 相當(dāng)。

在推理和 Agent 能力評(píng)測(cè)中，豆包 2.0 Pro 在 IMO、CMO 數(shù)學(xué)奧賽和 ICPC 編程競(jìng)賽中獲得金牌成績，也超越了 Gemini 3 Pro 在 Putnam Bench 上的表現(xiàn)，展現(xiàn)了強(qiáng)勁的數(shù)學(xué)和推理能力。在 HLE-text（人類的最后考試）上，豆包 2.0 Pro 取得最高分 54.2 分，在工具調(diào)用和指令遵循測(cè)試中也有出色表現(xiàn)。

豆包 2.0 還進(jìn)一步降低了推理成本。其模型效果與業(yè)界頂尖大模型相當(dāng)，但 token 定價(jià)降低了約一個(gè)數(shù)量級(jí)。在現(xiàn)實(shí)世界的復(fù)雜任務(wù)中，由于大規(guī)模推理與長鏈路生成將消耗大量 token，這一成本優(yōu)勢(shì)將變得更為關(guān)鍵。

Code 模型提升開發(fā)效率，快速搭建復(fù)雜應(yīng)用

豆包 2.0 Code 是基于 2.0 基座模型，針對(duì)編程場(chǎng)景進(jìn)行優(yōu)化的版本。其強(qiáng)化了代碼庫解讀能力，還提升了應(yīng)用生成能力。此外，豆包 2.0 Code 還增強(qiáng)了模型在 Agent 工作流中的糾錯(cuò)能力。

該模型已上線 TRAE 中國版作為內(nèi)置模型，支持圖片理解和推理。

以開發(fā)一個(gè)「TRAE 春節(jié)小鎮(zhèn) · 馬年廟會(huì)」互動(dòng)項(xiàng)目為例。這是一個(gè)比較復(fù)雜的場(chǎng)景，但是通過 TRAE+ 豆包 2.0 Code，只需要 1 輪提示詞，就能構(gòu)建出基本的架構(gòu)和場(chǎng)景，再經(jīng)過幾次調(diào)試，總共 5 輪提示詞，就可完成這個(gè)作品。

字節(jié)跳動(dòng)官方稱，豆包大模型 2.0 系列的更新，是面向現(xiàn)實(shí)世界復(fù)雜任務(wù)的新起點(diǎn)。未來，團(tuán)隊(duì)將繼續(xù)面向真實(shí)場(chǎng)景迭代模型，不斷探索智能上限。