沃资讯
科技 财经 汽车 游戏 数码 资讯

通义千问出了开源版本!同等参数最强中英文模型Qwen-7B发布

2023-08-03来源:互联网编辑:

通义千问开源!8月3日,AI模型社区魔搭ModelScope上架两款开源模型Qwen-7B和Qwen-7B-Chat,阿里云确认其为通义千问70亿参数通用模型和对话模型,两款模型均开源、免费、可商用。在多个权威测评中,通义千问7B模型取得了远超国内外同等尺寸模型的效果,成为当下业界最强的中英文7B开源模型。

今年4月,阿里云推出自研大模型通义千问,引发井喷式的市场需求。此次小型化模型版本开源,有望抹平模型使用门槛,让海量中小企业和AI开发者更早、更快地用上通义千问。这一举动也让阿里云成为国内首个加入大模型开源行列的大型科技企业。

Qwen-7B是支持中、英等多种语言的基座模型,在超过2万亿token数据集上训练,上下文窗口长度达到8k。Qwen-7B-Chat是基于基座模型的中英文对话模型,已实现与人类认知对齐。开源代码支持对Qwen-7B和Qwen-7B-Chat的量化,支持用户在消费级显卡上部署和运行模型。

用户既可从魔搭社区直接下载模型,也可通过阿里云灵积平台访问和调用Qwen-7B和Qwen-7B-Chat,阿里云为用户提供包括模型训练、推理、部署、精调等在内的全方位服务。

通义千问7B预训练模型在多个权威基准测评中表现出色,中英文能力远超国内外同等规模开源模型,部分能力甚至“跃级”赶超12B、13B尺寸开源模型。

在英文能力测评基准MMLU上,通义千问7B模型得分超过一众7B、12B、13B主流开源模型。该基准包含57个学科的英文题目,考验人文、社科、理工等领域的综合知识和问题解决能力。

在中文常识能力测评基准C-eval上,通义千问在验证集和测试集中都是得分最高的7B开源模型,展现了扎实的中文能力。相比英文世界热闹的AI开源生态,中文社区缺少优秀的基座模型。通义千问的加入有望为开源社区提供更多选择,推动中国AI开源生态建设。

在数学解题能力评测GSM8K、代码能力评测Humaneval等基准上,通义千问7B模型也有不俗表现,胜过所有同等尺寸开源模型和和部分大尺寸开源模型。

阿里云表示,开源大模型可以帮助用户简化模型训练和部署的过程,用户不必从头训练模型,只需下载预训练好的模型并进行微调,就可快速构建高质量的模型。

开源生态对促进中国大模型的技术进步与应用落地至关重要。今年7月,阿里云宣布将促进中国大模型生态的繁荣作为首要目标,向大模型创业公司提供智能算力、开发工具等全方位服务。2022年阿里云牵头发起AI模型社区魔搭,以AI模型为核心服务AI开发者。目前,魔搭聚集了20多家顶尖人工智能机构贡献的1000多款开源模型,已经成为中国大模型开源第一门户。

附:开源地址

魔搭ModelScope:

https://modelscope.cn/models/qwen/Qwen-7B/summary

https://modelscope.cn/models/qwen/Qwen-7B-Chat/summary

Hugging Face:https://huggingface.co/Qwen

GitHub:https://github.com/QwenLM/Qwen-7B

比亚迪德国市场再传捷报:第150台纯电动大巴下线,累计销量破400大关!
快科技11月3日消息,比亚迪商用车官方宣布,德国市场第150台纯电动大巴已正式下线,累计销量超过400台。比亚迪10月的产销数据显示,商用车销量达到2131辆,同比增长188.75%。今年1-10月乘用车销量…

2024-11-03

(第七届进博会)前瞻:进博会老朋友锚定新机遇
谈及为何成为进博会的“忠粉”,他表示,进博会为企业充分展示新质生产力的潜力和优势提供了重要平台,对于跨国企业意义非凡,“一直以来,我们把进博会看作是平台、是机遇、是转化前沿创新成果和推动多方合作的‘催化剂’…

2024-11-03

“60后”台胞秦巴腹地觅乡愁 扎根40载心安即为家
“我的家庭有点‘特殊’,母亲是台湾人,父亲是大陆人,这就是日后我们家成为第一批回陕西定居台胞的原因。”在陕台胞陶怡秀对中新网记者如是说。 那次“旅游”让陶怡秀第一次踏足了崇山峻岭中的小县城宁强,而这个之前素…

2024-11-03

全国秋粮收购超4000万吨 中晚稻市场运行平稳
在国家粮油信息中心近日召开的新季中晚稻产销形势分析会上,与会专家对后期国内稻谷市场总体持较为乐观的预期,预计新季中晚稻价格总体上平稳运行、优质优价。此外,我国对国际大米市场的依赖程度较低,以0.7的比率将进口…

2024-11-03