测试
-
OpenAI开源浏览智能体评测基准BrowseComp
当地时间4月10日,美国开放人工智能研究中心(OpenAI)宣布开源包含1266个挑战性问题的基准测试BrowseComp。OpenAI表示,一个高性能的浏览智能体应该能够定位那些难以查找、可能需要在浏览数十甚至数百个网站的过程中才能获取的信息。现有基准测试(如SimpleQA)主要衡量模型检索基本
2025-04-11 08:39:00
-
同心聚力,打造大湾区分析测试领域一流学术大会 ——第三届深圳国际安全健康测试学术会议隆重开幕
来源:【中国食品报融媒体】4月11日,第三届深圳国际安全健康测试学术会议在深圳隆重开幕。大会分两天举行,100多个学术报告主题涉及精准医学、环境与水体、食品、农产品、化工、珠宝首饰与新材料、绿色实验室建设、冷冻电镜等多个学术领域,展示了多组学、质谱、色谱等分析测试前沿技术的最新发展。本次会议采取线上
2025-04-14 14:10:00