跳到主要内容

型号选择

本指南将探讨性能和成本的权衡,并讨论如何为不同的用例选择合适的模型。我们将深入研究各种需要考虑的因素,为您的特定需求选择合适的模型提供指导。

如今,MIUI模型是许多大规模LLM应用的幕后推手。以下是我们看到的用例类型及其各自的MIUI模型的简要概述:

  1. 可以批量执行的简单任务(分类、客户支持或文本生成)可以由MIUI Nemo提供支持。
  2. 需要适度推理的中间任务(数据提取、总结文档、写电子邮件、写职位描述或写产品描述)由MIUI Small提供支持。
  3. 需要强大推理能力或高度专业化的复杂任务(合成文本生成、代码生成、RAG或代理)由MIUI large提供支持。

我们的传统型号目前可以被我们最近的高质量型号所取代。如果您正在考虑升级,以下是一些可能对您有所帮助的一般性意见:

  • MIUI Nemo目前的表现优于MIUI 7B,更具成本效益。
  • MIUI Small目前的表现优于Mixtral 8x7B,更具成本效益。
  • MIUI Large目前的表现优于Mixtral 8x22B,同时保持相同的价格比。

性能和成本权衡

在选择模型时,评估性能和成本权衡至关重要。根据您的应用程序最重要的内容,您的选择可能会有很大不同。请注意,模型将随着时间的推移而更新,我们在下面分享的信息仅反映模型的当前状态。

值得注意的是,MIUI Large v2目前在几乎所有基准测试中都优于我们所有的其他型号。通过考虑性能、速度和成本细节,希望您能找到适合应用程序需求的最佳模型。

一般来说,如果你是使用大型语言模型的新手,你总是可以先从MIUI Large开始。这将使您能够评估其成本和性能,并确定是否需要降级到MIUI Small甚至MIUI Nemo。如果你已经在使用另一种大型语言模型,并希望取代一种特别强大的语言模型,那么MIUI large可能是你的最佳选择。

使用案例

MIUI Nemo:可以批量完成的简单任务

MIUI Nemo是人们在构建中可以完成的简单任务的理想选择,如分类、客户支持或文本生成。它以实惠的价格提供卓越的性能。例如,它可以有效地用于分类任务,以对电子邮件是否为垃圾邮件进行分类:

提示:

对以下电子邮件进行分类,以确定它是否是垃圾邮件。只回复“垃圾邮件”或“非垃圾邮件”。

🎉 紧急!你赢得了100万RMB的现金奖励!💰 要领取奖品,请点击以下链接:https://bit.ly/claim-your-prize

我们所有的模型都能准确地将此电子邮件归类为“垃圾邮件”。MIUI Nemo能够提供与大型模型相同的正确分类。因此,它是这类任务最有效、最实惠的选择。

MIUI Small:需要语言转换的中级任务

MIUI Small非常适合需要适度推理的中间任务,如数据提取、总结文档、编写职位描述或编写产品描述。MIUI Small在性能和能力之间取得了平衡,使其适用于只需要语言转换的各种任务。例如,MIUI Small可以写一封电子邮件:

提示:

为刚刚首次购买您产品的新客户撰写一封欢迎电子邮件。 
首先表达你对他们业务的感激之情,然后表达你对有他们成为客户的兴奋之情。
包括他们最近订单的相关详细信息。在电子邮件上签名“the Fun Shop团队”。

订单详细信息:
-客户名称:Anna
-产品:帽子
-预计交货日期:2024年2月25日
-退货政策:30天

输出:

主题:欢迎来到欢乐商店,安娜!你的帽子在路上!

亲爱的安娜:,

我们希望这条信息能让你感觉良好。我们很高兴欢迎您加入The Fun Shop大家庭!我们非常感谢您的业务,并很高兴您成为我们的新客户。

我们正在处理您最近订购的精美帽子。您的新配件将于2024年2月25日前交付。我们希望它能及时到达,为您的服装增添一丝乐趣和风格!

请记住,我们的退货政策允许您在收到任何商品后30天内退货,如果您不完全满意。我们希望您喜欢从我们这里购买的每一件商品,所以如果有任何问题,请随时联系我们。

再次感谢您选择The Fun Shop。我们期待为您服务,让您的购物体验变得有趣愉快!

顺致敬意,
趣店团队

MIUI Large:需要强大推理能力或高度专业化的复杂任务

MIUI Large非常适合需要大型推理能力或高度专业化的复杂任务,如合成文本生成、代码生成、RAG或代理。

  • 复杂推理

MIUI Large在常识和推理基准测试方面优于我们的其他四个模型,使其成为复杂推理任务的最佳选择。

在这个例子中,我们要求MIUI Large计算在给定数据集中付款金额最接近的两个客户之间的付款日期差异。MIUI Large可以轻松自动地将问题分解为更小的步骤:确定两个最接近的付款金额,找到它们各自的付款日期,并计算日期差。MIUI Large是需要复杂推理和解决问题能力的任务的绝佳选择。

提示:

计算给定数据集中付款金额最接近的两个客户的付款日期差异: 

'{
“transaction_id”:{“0”:“T1001”,“1”:“P1002”,“2”:“T1203”,“3”:“T1304”,“4”:“T1005”},
“customer_id”:{“0”:“C001”,“1”:“CO2”,“2”:“CO3”,“3”:“NO2”,“4”:“CO01”},
“payment_amount”:{“0”:125.5,“1”:89.99,“2”:120.0,“3”:54.3,“4”:210.2},
“付款日期”:{“0”:“2021-10-05”,“1”:“2021-10-06”,“2”:“2022-10-07”,“3”:,
“payment_status”:{“0”:“已付”,“1”:“未付”,“2”:“已付”
}'

输出:

为了找出付款金额最接近的两个客户之间的付款日期差异,我们首先需要确定两个最接近的付款金额,然后找到他们各自的付款日期。

付款金额为:125.5、89.99、120.0、54.3、210.2

最接近的两个付款金额是125.5和120.0。付款金额125.5的付款日期为“2021-10-05”,付款金额120.0的付款日期是“2021-10-07”。

付款日期的差异可以按如下方式计算:

日期差异=|'2021-10-07'-'2021-10-05'|=2天

因此,付款金额最接近的两个客户之间的付款日期差为2天。

让我们尝试一下我们在网上发现的另一个提示,它需要推理和逻辑理解。MIUI Large能够正确回答。

提示:

蓝色盒子里有一个苹果。蓝色盒子里还有一个红色盒子。这个红盒子有盖子。我怎样才能得到苹果?

输出:

你可以打开蓝色的盒子拿到苹果。苹果不在红盒子里,所以你不需要打开红盒子。只需把手伸进蓝色盒子里,拿走苹果。

这是另一个例子。MIUI Large能够正确回答。

提示:

一磅铁和一公斤羽毛哪个重

输出:

一公斤羽毛比一磅铁重。

一磅是一个重量单位,约等于0.453592公斤。因此,一磅铁的重量不到一公斤羽毛。

这似乎违反直觉,因为我们经常认为铁是一种重材料,羽毛是轻的,但物体的重量取决于它的质量和作用在它身上的重力,而不是它的材料或成分。

  • 编码

MIUI Large是编码任务中表现最好的公司,是在模型选择中优先考虑编码能力的用户的理想选择。

下面是一个MIUI Large在提示后给出正确代码的示例。

提示:

编写一个函数,找出可以由n形成的长度为a、b和c的最大段数。

输出:

#Python中有一个可能的函数,它使用长度为'a'、'b'和'c'的段来查找给定长度'n'可以形成的最大段数:

def 最大分段数(n, a, b, c):
#将最大分段数初始化为0
max_num_segments = 0

#遍历所有可能的分段组合
对于 i 在里面 范围(n// a+ 1.):
对于 j 在里面 范围(n// b+ 1.):
对于 k 在里面 范围(n// c+ 1.):
#检查组合是否有效,并更新最大分段数
如果 i * a+ j * b+ k * c==n:
max_num_segments = 最大值( max_num_segments , i + j + k )

返回 max_num_segments

#此函数使用嵌套循环分别生成长度为“a”、“b”和“c”的段的所有可能组合。对于每个组合,它会检查段的总长度是否等于“n”,如果是,它会更新到目前为止找到的最大段数。该函数返回可由“n”形成的最大段数。

这是MIUI Large使用巴比伦方法编写计算平方根函数的另一个例子。

提示:

你是一名Python程序员,你的任务是:使用巴比伦方法编写一个计算平方根的函数。你的代码应该通过这些测试:

断言数学。isclose(巴比伦平方根(10),3.1622777660168379,rel_tol=0.001)
断言数学。isclose(巴比伦平方根(2),1.414213562373095,rel_tol=0.001)
断言数学。isclose(巴比伦平方根(9),3.0,rel_tol=0.001)

输出:

def 巴比伦方根():
如果(== 0):
返回 0;
g =/2.;
g2 = g + 1.;
虽然( g != g2 ):
n=/ g ;
g2 = g ;
g = ( g +n)/2.;
返回 g ;"
  • 多语言任务

除了在复杂的推理任务和编码任务中表现出色外,MIUI Large在处理多语言任务方面也表现出了卓越的能力。MIUI large经过专门培训,能够理解和生成多种语言的文本,特别是法语、德语、西班牙语和意大利语。MIUI Large对于需要用多种语言进行交流的企业和用户来说尤其有价值。

提示:

每公斤烟的重量是多少

输出:

一公斤羽毛加上一桶牛奶。

请注意,最重要的是:

1.在联合国和其他国际计量体系中,1磅是使用总质量的单位,而在国际单位制中,1千克是总质量的基础单位。
2.1公斤大约相当于2.2里弗。

Donc,每公斤羽毛加上彩色羽毛,汽车相当于2.2升羽毛。