国内ai大模型“安卓时刻”到来！阿里云通义千问免费、开源、可商用-ag凯发k8国际

国内ai大模型“安卓时刻”到来！阿里云通义千问免费、开源、可商用

来源：富途牛牛发布时间：2023-08-04 16:47:10

大模型激战之际，继海外的meta之后，$阿里巴巴-sw(09988.hk)$成为又一家推动人工智能（ai）大模型“安卓时刻”潮流的科技巨头。

(资料图片仅供参考)

8月3日周四，阿里云将70亿参数的通义千问模型开源，包括通用模型qwen-7b和对话模型qwen-7b-chat。这两款模型均已上线国内首个“模型即服务”开放平台魔搭社区，开源、免费、可商用。

开源代码支持对qwen-7b和qwen-7b-chat的量化，支持用户在消费级显卡上部署和运行模型。用户既可从魔搭社区直接下载模型，也可通过阿里云灵积平台访问和调用qwen-7b和qwen-7b-chat，阿里云为用户提供包括模型训练、推理、部署、精调等在内的服务。

魔塔社区已有发帖，专门介绍通义千问上述模型的安装、创空间体验、模型推理、模型训练最佳实践，并附有模型链接及下载情况截图。

公开资料显示，qwen-7b使用去重及过滤后超过2.2万亿tokens的数据进行预训练，是支持中、英等多种语言的基座模型，上下文窗口长度达到8k。它包含高质量中、英、多语言、代码、数学等数据，囊括全网文本、百科、书籍、代码、数学及各个领域垂类。

评测英文综合能力的基准评测之一mmlu的评测结果显示，在英文评测方面，qwen-7b的效果超过了目前国内外其他同类开源预训练模型，对比更大规模版本的模型也具有较强竞争力。中文评测方面，在c-eval验证集上，qwen-7b在同等规模现有模型中取得了最高分数，甚至相比更大规模模型也具有较强竞争力。

以下为qwen-7b的mmlu 5-shot准确率结果对比。

在qwen-7b的基础上，阿里云使用对齐机制打造了基于基座模型的ai助手qwen-7b-chat。它是基于transformer的中英文对话大语言模型，已实现与人类认知对齐。预训练数据类型多样，覆盖广泛，包括大量网络文本、专业书籍、代码等。

无论是在c-eval验证集上，还是在mmlu评测集上，qwen-7b-chat模型的zero-shot准确率均在同类对齐模型中表现较优。

以下为c-eval测试集上的zero-shot准确率结果对比。

通义千问的开源后，阿里云成为国内首个加入大模型开源行列的大型科技企业。今年7月，微软宣布，联手meta发布开源ai模型的可商用版本llama 2，提供openai和谷歌模型的平替产品。也是在7月，智谱ai及清华keg实验室公布，中国顶尖开源大模型chatglm2-6b允许免费商用。

华尔街见闻此前文章提及，开源模型的好处包括用户的接受率更高，然后输入更多数据供人工智能处理。llm拥有的数据越多，其功能就越强大。此外，开源模型使研究人员和开发人员能够发现和解决漏洞，同时提高技术和安全性。

今年4月的2023阿里云峰会上，阿里巴巴宣布向企业开放通义千问，企业可以调用通义千问的能力训练自己的大模型。

阿里云智能集团首席技术官（cto）周靖人当时介绍，未来企业在阿里云上既可以调用通义千问的全部能力，也可以结合企业自身的行业知识和应用场景，训练自己的企业大模型。比如，每个企业都可以有自己的智能客服、智能导购、智能语音助手、文案助手、ai设计师、自动驾驶模型等。

阿里巴巴集团ceo兼阿里云智能集团ceo张勇当时称，阿里巴巴所有产品未来都将接入通义千问大模型。

张勇表示，面向 ai 时代，所有产品都值得用大模型重做一次，而基于这一信念，阿里云也希望帮助更多企业用上大模型，让每家企业都能基于通义千问，拥有具备自己行业能力的专属大模型。

编辑/ruby

标签：

上一篇：港市速睇 | 港股震荡收涨，科指涨超2%；科网股、旅游股全天强势，b站涨近7%，中国中免涨超4%

下一篇：

国内ai大模型“安卓时刻”到

港市速睇 | 港股震荡收涨，科指涨超2%；科网股、旅游股全天强势，b站涨近7%，中国中免涨超4%

48小时点击排行

图片新闻

国内ai大模型“安卓时刻”到来！阿里云通义千问免费、开源、可商用-ag凯发k8国际

猜你喜欢