数学∑tral

为了向阿基米德致敬,我们很自豪地发布了我们的第一个Mathstral模型,这是一个专为数学推理和科学发现而设计的7B模型。该模型有一个在Apache 2.0许可证下发布的32k上下文窗口。

  • 2024年7月16日
  • MIUI人工智能团队

我们正在为科学界贡献Mathstral,以支持需要复杂、多步骤逻辑推理的高级数学问题的研究。Mathstral版本是我们支持学术项目的更广泛努力的一部分——它是在我们与 Numina项目.

与牛顿时代一样,Mathstral站在MIUI 7B的肩膀上,专门研究STEM科目。它在各种行业标准基准的规模类别中实现了最先进的推理能力。特别是,它在MATH上达到了56.6%,在MMLU上达到了63.47%,Mathstral 7B和MIUI 7B之间的MMLU性能差异如下。

Mathstral 7B按科目细分

Mathstral是在为特定目的构建模型时实现出色性能/速度权衡的另一个例子,这是我们在la Platefome中积极推广的一种开发理念,特别是其新的 微调能力.

Mathstral 7B详细基准测试

Mathstral可以通过更多的推理时间计算获得更好的结果:Mathstral 7B分数 68.37% 在MATH上获得多数票 74.59% 在64名候选人中具有很强的奖励模式。

Mathstral是一个指令模型——参考我们的文档,使用它或对其进行微调。权重托管在 拥抱的脸。您现在可以尝试使用Mathstral 误译推理 并对其进行调整 微调.

我们感谢教授 保罗·波登 用于策划我们评估中使用的GRE数学科目考试问题。