2025-02-23
【OpenAI员工质疑xAI新模型Grok3基准数据真实性】
在最新的AI领域风波中,OpenAI的员工对埃隆・马斯克支持的xAI公司提出质疑,指控其新发布的AI模型Grok3在基准测试中的表现数据存在误导。xAI的联合创始人伊戈尔・巴布什金对此予以否认,并表示公司的测试结果完全透明。据xAI发布的图表,Grok3的两个变体——Grok3 Reasoning Beta和Grok3 mini Reasoning——在AIME 2025测试中的表现超越了OpenAI目前领先的o3-mini-high模型。然而,OpenAI的员工迅速在社交平台X上反驳,指出xAI的图表中遗漏了o3-mini-high在“cons@64”配置下的AIME 2025得分。对此,巴布什金在X平台上回应,强调OpenAI在历史上也曾发布过类似的引导性基准测试图表,尽管这些图表主要用于比较其自身模型之间的性能差异。这一争议凸显了AI行业在技术展示与竞争中的透明度问题。