当前位置：首页 > 快讯 > 正文

OpenAI开源BrowseComp，重塑Agent浏览器评测

来源：互联网时间：2025-04-11 04:45:16

今天凌晨2点，OpenAI发布了一个专门用于智能体浏览器功能的测试基准——BrowseComp。这个测试基准相当具有挑战性，连OpenAI自身的GPT-4o和GPT-4.5的准确率仅为0.6%和0.9%。即使是具备浏览器功能的GPT-4o，其准确率也只有1.9%。然而，OpenAI最新推出的智能体模型Deep Research的准确率达到51.5%，在自主搜索、信息整合和准确性校准等方面表现出色。（AIGC开放社区）

上一篇：美联储柯林斯：关税推高美国商品价格，可能造成美联储推迟降息

下一篇：美联储柯林斯：关税可能使核心通胀在今年“远超”3%

看了这篇文章的人也在看

热门币种

Bitcoin

BTC比特币

60,963.61 USDT

¥435,103.38

-2.72%

Ethereum

ETH以太坊

3,368.69 USDT

¥24,042.67

-0.3%

BNB

BNB币安币

570.68 USDT

¥4,073.00

-0.28%

Tether USDt

USDT泰达币

1.02 USDT

¥7.25

-0.19%

Solana

SOL

135.96 USDT

¥970.36

+7.66%

USDC

1.00 USDT

¥7.15

-0.01%

Toncoin

TON

7.59 USDT

¥54.14

+4.55%

XRP

XRP瑞波币

0.47720 USDT

¥3.41

+0.48%

Dogecoin

DOGE狗狗币

0.12210 USDT

¥0.87140

+2.43%

Cardano

ADA艾达币

0.39050 USDT

¥2.79

+3.88%

免责声明：本网站所有内容均来源于第三方平台及平台用户。今库网对于网站及其内容不作任何类型的保证，网站所有区块链相关资料仅供用户学习及研究之用，不构成任何投资、法律等其他领域的建议和依据。您需谨慎使用相关数据及内容，并自行承担所带来的一切风险。强烈建议您独自对内容进行研究、审查、分析和验证。如有信息侵犯了您的权益，请及时与我们取得联系，本站将立刻删除。联系QQ