魔兽世界虚空仓库有什么用

热点资讯

高管跳槽“挖走”玉米品种十被告被判赔偿近4000万元
阿里巴巴直线拉升！DeepSeek突传重磅！
支持专精特新企业打造“绝活”
贵州银行原董事长李志明，一审宣判
机构：预计2026年CSP合计资本支出增至6000亿美元以上

新闻动态

OpenAI开源浏览智能体评测基准BrowseComp

发布日期：2025-04-15 01:25 点击次数：166

　　当地时间4月10日，美国开放人工智能研究中心（OpenAI）宣布开源包含1266个挑战性问题的基准测试BrowseComp。OpenAI表示，一个高性能的浏览智能体应该能够定位那些难以查找、可能需要在浏览数十甚至数百个网站的过程中才能获取的信息。现有基准测试（如SimpleQA）主要衡量模型检索基本孤立事实的能力，这类测试已被具备快速浏览工具（如支持浏览功能的GPT-4o）的模型所饱和。为了衡量AI智能体在互联网上定位难以查找、相互关联信息的能力，现开源基准测试BrowseComp。

上一篇：没有了

下一篇：嘉实优势成长混合A：2025年第一季度利润1028.47万元净值增长率4.16%