在线中文AV精品人人草视频|日韩特黄AA片av超碰|国模免费在线视频|国产高清无码三级片|小毛片小电影人人上人人操|春色av无码黄片无码区|很爽很爽的香蕉视频|日本伊人小视频|亚洲AV网站免费|四月婷婷精品视频在线

豆包大模型2.0發(fā)布,專家模式上線,多數(shù)基準(zhǔn)達(dá) SOTA 水平

DoNews2月14日消息,今天,豆包大模型正式進(jìn)入2.0階段。

隨著Agent時(shí)代到來,大模型將在現(xiàn)實(shí)世界發(fā)揮更大作用。豆包2.0(Doubao-Seed-2.0)圍繞大規(guī)模生產(chǎn)環(huán)境下的使用需求做了系統(tǒng)性優(yōu)化,依托高效推理、多模態(tài)理解與復(fù)雜指令執(zhí)行能力,更好地完成真實(shí)世界復(fù)雜任務(wù)。

豆包2.0系列包含Pro、Lite、Mini三款通用Agent模型和Code模型,靈活適配各類業(yè)務(wù)場(chǎng)景:

  • 豆包2.0 Pro面向深度推理與長鏈路任務(wù)執(zhí)行場(chǎng)景,全面對(duì)標(biāo)GPT 5.2與Gemini 3 Pro;

  • 2.0 Lite兼顧性能與成本,綜合能力超越上一代主力模型豆包1.8;

  • 2.0 Mini面向低時(shí)延、高并發(fā)與成本敏感場(chǎng)景;

  • Code版(Doubao-Seed-2.0-Code)專為編程場(chǎng)景打造,與TRAE結(jié)合使用效果更佳。

目前,豆包2.0 Pro已在豆包App、電腦端和網(wǎng)頁版上線,用戶選擇「專家」模式即可對(duì)話體驗(yàn);豆包2.0 Code接入了AI編程產(chǎn)品TRAE;面向企業(yè)和開發(fā)者,火山引擎也已上線豆包2.0系列模型API服務(wù)。

多模態(tài)理解能力全面升級(jí),多數(shù)基準(zhǔn)達(dá) SOTA 水平

豆包 2.0 全面升級(jí)了多模態(tài)能力,在各類視覺理解任務(wù)上均達(dá)到世界頂尖水平,視覺推理、感知能力、空間推理與長上下文理解能力表現(xiàn)尤為突出,豆包 2.0 Pro 在大多數(shù)相關(guān)基準(zhǔn)測(cè)試中取得最高分。

面對(duì)動(dòng)態(tài)場(chǎng)景,豆包 2.0 強(qiáng)化了對(duì)時(shí)間序列與運(yùn)動(dòng)感知的理解能力,在 TVBench 等關(guān)鍵測(cè)評(píng)中處于領(lǐng)先位置,且在 EgoTempo 基準(zhǔn)上超過了人類分?jǐn)?shù),表明它對(duì)“變化、動(dòng)作、節(jié)奏”這類信息的捕捉更為穩(wěn)定,在工程側(cè)可用性更高。

長視頻場(chǎng)景中,豆包 2.0 在大多評(píng)測(cè)上超越了其他頂尖模型,且在多個(gè)流式實(shí)時(shí)問答視頻基準(zhǔn)測(cè)試中表現(xiàn)優(yōu)異,能作為 AI 助手完成實(shí)時(shí)視頻流分析、環(huán)境感知、主動(dòng)糾錯(cuò)與情感陪伴,實(shí)現(xiàn)從被動(dòng)問答到主動(dòng)指導(dǎo)的交互升級(jí),可應(yīng)用于健身、穿搭等陪伴場(chǎng)景。

LLM 與 Agent 表現(xiàn)大幅強(qiáng)化,長程任務(wù)執(zhí)行能力提升

提升長程任務(wù)執(zhí)行能力,需要豐富的真實(shí)世界知識(shí)。通過加強(qiáng)長尾領(lǐng)域知識(shí),豆包 2.0 Pro 在 SuperGPQA 上分?jǐn)?shù)超過 GPT 5.2,并在 HealthBench 上拿到第一名,在科學(xué)領(lǐng)域的整體成績與 Gemini 3 Pro 和 GPT 5.2 相當(dāng)。

在推理和 Agent 能力評(píng)測(cè)中,豆包 2.0 Pro 在 IMO、CMO 數(shù)學(xué)奧賽和 ICPC 編程競(jìng)賽中獲得金牌成績,也超越了 Gemini 3 Pro 在 Putnam Bench 上的表現(xiàn),展現(xiàn)了強(qiáng)勁的數(shù)學(xué)和推理能力。在 HLE-text(人類的最后考試)上,豆包 2.0 Pro 取得最高分 54.2 分,在工具調(diào)用和指令遵循測(cè)試中也有出色表現(xiàn)。

豆包 2.0 還進(jìn)一步降低了推理成本。其模型效果與業(yè)界頂尖大模型相當(dāng),但 token 定價(jià)降低了約一個(gè)數(shù)量級(jí)。在現(xiàn)實(shí)世界的復(fù)雜任務(wù)中,由于大規(guī)模推理與長鏈路生成將消耗大量 token,這一成本優(yōu)勢(shì)將變得更為關(guān)鍵。

Code 模型提升開發(fā)效率,快速搭建復(fù)雜應(yīng)用

豆包 2.0 Code 是基于 2.0 基座模型,針對(duì)編程場(chǎng)景進(jìn)行優(yōu)化的版本。其強(qiáng)化了代碼庫解讀能力,還提升了應(yīng)用生成能力。此外,豆包 2.0 Code 還增強(qiáng)了模型在 Agent 工作流中的糾錯(cuò)能力。

該模型已上線 TRAE 中國版作為內(nèi)置模型,支持圖片理解和推理。

以開發(fā)一個(gè)「TRAE 春節(jié)小鎮(zhèn) · 馬年廟會(huì)」互動(dòng)項(xiàng)目為例。這是一個(gè)比較復(fù)雜的場(chǎng)景,但是通過 TRAE+ 豆包 2.0 Code,只需要 1 輪提示詞,就能構(gòu)建出基本的架構(gòu)和場(chǎng)景,再經(jīng)過幾次調(diào)試,總共 5 輪提示詞,就可完成這個(gè)作品。

字節(jié)跳動(dòng)官方稱,豆包大模型 2.0 系列的更新,是面向現(xiàn)實(shí)世界復(fù)雜任務(wù)的新起點(diǎn)。未來,團(tuán)隊(duì)將繼續(xù)面向真實(shí)場(chǎng)景迭代模型,不斷探索智能上限。

豆包大模型2.0發(fā)布,專家模式上線,多數(shù)基準(zhǔn)達(dá) SOTA 水平
掃描二維碼查看原文
分享自DoNews
Copyright ? DoNews 2000-2026 All Rights Reserved
蜀ICP備2024059877號(hào)-1