广州股票配资阿里发布并开源千问3，称成本仅需DeepSeek-R1三分之一

发布日期：2025-05-03 14:20 点击次数：126

4月29日凌晨，阿里巴巴宣布推出新一代通义千问模型Qwen3（千问3）并进行开源。阿里云方面表示广州股票配资，千问3是国内首个混合推理模型，将快思考与慢思考集成进同一个模型，参数量仅为DeepSeek-R1的1/3，成本大幅下降，并在ChatBot Arena等榜单中性能全面超越R1、OpenAI-o1等全球顶尖模型，登顶全球最强开源模型。知情人士对记者表示，这是今年上半年阿里云最核心的技术产品发布。具体来看，通义千问官方发布的技术博客显示，千问3采用混合专家（MoE）架构，总参数量235B

4月29日凌晨，阿里巴巴宣布推出新一代通义千问模型Qwen3（千问3）并进行开源。阿里云方面表示广州股票配资，千问3是国内首个“混合推理模型”，将“快思考”与“慢思考”集成进同一个模型，参数量仅为DeepSeek-R1的1/3，成本大幅下降，并在ChatBot Arena等榜单中性能全面超越R1、OpenAI-o1等全球顶尖模型，登顶全球最强开源模型。知情人士对记者表示，这是今年上半年阿里云最核心的技术产品发布。

具体来看，通义千问官方发布的技术博客显示，千问3采用混合专家（MoE）架构，总参数量235B，激活仅需22B。预训练数据量达36T ，并在后训练阶段多轮强化学习。同时将非思考模式无缝整合到思考模型中，对简单需求可“快思考”，低算力“秒回”答案，对复杂问题可多步骤“深度思考”，两种模式的结合增强了模型实现稳定且高效的“思考预算”控制能力。

阿里云方面表示，性能大幅提升的同时，千问3的部署成本大幅下降，仅需4张H20即可部署千问3满血版，显存占用仅为DeepSeek-R1的三分之一。

目前，千问3已开源了2款30B、235B的MoE模型，以及0.6B、1.7B、4B、8B、14B、32B等6款密集模型，阿里云透露，千问3的30B参数MoE模型实现了10倍以上的模型性能杠杆提升，仅激活3B就能实现上代Qwen2.5-32B模型性能。所有千问3模型都是混合推理模型，API可按需设置“思考预算”（即预期最大深度思考的tokens数量），灵活满足AI应用和不同场景对性能和成本的多样需求。

开源后，用户可在魔搭社区、HuggingFace等平台下载模型并商用，也可以通过阿里云百炼调用千问3的API服务。个人用户可通过通义APP体验千问3，记者了解到，夸克也即将全线接入千问3。

未来，千问3将通过优化模型架构和训练方法等提升模型，以实现几个关键目标：扩展数据规模、增加模型大小、延长上下文长度、拓宽模态范围，并利用环境反馈推进强化学习以进行长周期推理。通义千问团队在技术博客中表示，“Qwen3 代表了我们在通往通用人工智能（AGI）和超级人工智能（ASI）旅程中的一个重要里程碑。我们认为，我们正从专注于训练模型的时代过渡到以训练 Agent 为中心的时代。”

举报第一财经广告合作，请点击这里此内容为第一财经原创，著作权归第一财经所有。未经第一财经书面授权，不得以任何方式加以使用，包括转载、摘编、复制或建立镜像。第一财经保留追究侵权者法律责任的权利。如需获得授权请联系第一财经版权部：banquan@yicai.com 文章作者

陈杨园

相关阅读

独家丨黄仁勋已结束中国之行，知情人士称全程未与DeepSeek会面

第一财经记者从了解黄仁勋中国之行细节的人士方面证实，黄仁勋全程未与DeepSeek会面。

502 04-19 11:24

DeepSeek-V3模型升级，编程与数学能力大幅提升

据悉该模型参数为6850亿。

240 03-25 07:58

跨境电商试练AI，DeepSeek取代了ChatGPT

在这场没有宏大叙事的变革里，每个参与者都在尽可能触摸AI应用新的形状。

258 03-12 19:30

安徽率先利用DeepSeek等大模型技术推出16个场景应用

安徽省率先在全国省级层面完成DeepSeek满血版（671B）本地化部署，推出无差别综窗、公文写作、语音转文字等16个典型应用，并在全省试用推广。

29 03-11 14:31

AI进化速递丨Manus官方回应未参与加密货币等项目

Manus社交账号被冻结广州股票配资，官方回应未参与加密货币等项目；新开普：星普大模型内部测评智能推理效果与DeepSeek-R1相近，算力消耗约其1/20。

51 03-07 20:59 一财最热点击关闭

<< 上一篇：关于股票交易的软件膳食纤维是含量高好还是低好？各品牌大对比，科学摄入量建议！_产品_营养素_补充 | 下一篇：手机股票配资app 渝三峡A连收4个涨停板 >>

栏目分类

信钰证券_最新实盘配资信息_股票开盘最新资讯

4月29日凌晨，阿里巴巴宣布推出新一代通义千问模型Qwen3（千问3）并进行开源。阿里云方面表示广州股票配资，千问3是国内首个混合推理模型，将快思考与慢思考集成进同一个模型，参数量仅为DeepSeek-R1的1/3，成本大幅下降，并在ChatBot Arena等榜单中性能全面超越R1、OpenAI-o1等全球顶尖模型，登顶全球最强开源模型。知情人士对记者表示，这是今年上半年阿里云最核心的技术产品发布。具体来看，通义千问官方发布的技术博客显示，千问3采用混合专家（MoE）架构，总参数量235B

友情链接：

广州股票配资 阿里发布并开源千问3，称成本仅需DeepSeek-R1三分之一

栏目分类

热点资讯

相关资讯

信钰证券_最新实盘配资信息_股票开盘最新资讯

广州股票配资阿里发布并开源千问3，称成本仅需DeepSeek-R1三分之一