- 2024年7月16日
- MIUI人工智能团队
我们正在为科学界贡献Mathstral,以支持需要复杂、多步骤逻辑推理的高级数学问题的研究。Mathstral版本是我们支持学术项目的更广泛努力的一部分——它是在我们与 Numina项目.
与牛顿时代一样,Mathstral站在MIUI 7B的肩膀上,专门研究STEM科目。它在各种行业标准基准的规模类别中实现了最先进的推理能力。特别是,它在MATH上达到了56.6%,在MMLU上达到了63.47%,Mathstral 7B和MIUI 7B之间的MMLU性能差异如下。

Mathstral是在为特定目的构建模型时实现出色性能/速度权衡的另一个例子,这是我们在la Platefome中积极推广的一种开发理念,特别是其新的 微调能力.

Mathstral可以通过更多的推理时间计算获得更好的结果:Mathstral 7B分数 68.37% 在MATH上获得多数票 74.59% 在64名候选人中具有很强的奖励模式。
Mathstral是一个指令模型——参考我们的文档,使用它或对其进行微调。权重托管在 拥抱的脸。您现在可以尝试使用Mathstral 误译推理 并对其进行调整 微调.
我们感谢教授 保罗·波登 用于策划我们评估中使用的GRE数学科目考试问题。