测试

您的位置：首页 > 测试 >

OpenAI开源浏览智能体评测基准BrowseComp
当地时间4月10日，美国开放人工智能研究中心（OpenAI）宣布开源包含1266个挑战性问题的基准测试BrowseComp。OpenAI表示，一个高性能的浏览智能体应该能够定位那些难以查找、可能需要在浏览数十甚至数百个网站的过程中才能获取的信息。现有基准测试（如SimpleQA）主要衡量模型检索基本

2025-04-11 08:39:00
同心聚力，打造大湾区分析测试领域一流学术大会 ——第三届深圳国际安全健康测试学术会议隆重开幕
来源：【中国食品报融媒体】4月11日，第三届深圳国际安全健康测试学术会议在深圳隆重开幕。大会分两天举行，100多个学术报告主题涉及精准医学、环境与水体、食品、农产品、化工、珠宝首饰与新材料、绿色实验室建设、冷冻电镜等多个学术领域，展示了多组学、质谱、色谱等分析测试前沿技术的最新发展。本次会议采取线上

2025-04-14 14:10:00