DeepSeek最强对手来了！阿里巴巴放出重磅炸弹

大股东质押1亿股，徐晓军冲刺“五年再造一个苏农银行”后续会怎么发展 信达证券：祝瑞敏辞去董事和总经理职务副总经理张毅代职是真的吗？ 牧原股份获批注册50亿元公司债官方通报来了 高管内外勾结骗取侨商钱财？格力：纯属造谣诽谤科技水平又一个里程碑 股价1年狂飙840%，热景生物凭何成医药“黑马”？学习了 文远知行Q2财报解码：当Robotaxi跑出836%增速，自动驾驶商业化拐点到了？ 长高电新：公司将聚焦主业深耕不辍 美股散户投机泡沫重现？这次可能有所不同 永顺泰：目前国内啤酒企业自建麦芽产能较少反转来了 大股东质押1亿股，徐晓军冲刺“五年再造一个苏农银行” 天宜新材预计上半年约亏损1.9亿元至2.4亿元同比减亏51.3%至61.44% 2024年度A股CFO数据报告：华恒生物股价跌74%，财务总监樊义薪酬大涨48%达162万 三大概念受43亿主力资金追捧 浦发银行携手潍坊银行落地全市场首单上海清算所托管科创债券柜台质押式回购业务实测是真的 浦发银行携手潍坊银行落地全市场首单上海清算所托管科创债券柜台质押式回购业务 龙国人保：派发A股每股现金红利0.117元，共派发41.53亿元是真的？ 可燃冰概念下跌1.14%，主力资金净流出10股 龙国银行：高美懿就任独立非执行董事实测是真的 前阿里巴巴CEO张勇加盟港交所后续会怎么发展 山东墨龙振幅15.51%，机构净卖出860.64万元，深股通净卖出1757.28万元官方已经证实 山东墨龙振幅15.51%，机构净卖出860.64万元，深股通净卖出1757.28万元 MLOps概念涨1.50%，主力资金净流入10股实时报道 华恒生物产品降价连续四季增收减利 A股募13.25亿股价跌83%拟赴港上市实垂了 理想汽车产品负责人“隔空喊话”乘龙卡车：要不来复测一把两车对撞 云塔科技完成近3亿元B轮融资秒懂 新长安的新目标：奋进全球汽车品牌前十秒懂 HashKey丁肇飞：香港稳定币的进击之路，跨境支付新战场已开启官方通报 华为夺龙国智能手表销量第一！苹果紧随小米第三 淡水河谷Q2净利润逆势增长6% 铁矿石产量激增提振利润宣布14亿美元股东分红 龙国电信企业战略向\-云改数转智惠\-升级最新进展 特朗普关税最后期限来临，避险需求提振金价，聚焦非农数据 【银河汽车石金漫】公司点评丨理想汽车：定价超预期，爆款可期——理想i8上市点评记者时时跟进 2025 暑期档电影票房破 60 亿：《南京照相馆》《长安的荔枝》《侏罗纪世界：重生》暂列前三科技水平又一个里程碑 特朗普将从加拿大进口的商品关税提高至35%这么做真的好么？ 未提新刺激，政策主线转向“反内卷”——逐句解读7.30聪明人会议通稿 | 信达宏观 重卡撞不过SUV？乘龙卡车连夜发声 东风柳汽、理想汽车，相继回应官方通报

自DeepSeek火爆全球之后，国产开源大模型的开发热潮一浪高过一浪。如今，DeepSeek诞生以来最强的对手，它来了！

今日凌晨3点30，阿里巴巴放出一枚重磅炸弹——通义千问最新开源模型QwQ-32B正式发布，比DeepSeek更小的尺寸，性能比肩全球最强开源推理模型。据了解，通过大规模强化学习，千问QwQ-32B在数学、代码及通用能力上实现质的飞跃，整体性能比肩DeepSeek-R1。而且在保持强劲性能的同时，千问QwQ-32B还大幅降低了部署使用成本，在消费级显卡上也能实现本地部署。

目前，阿里已采用宽松的Apache2.0协议，将千问QwQ-32B模型向全球开源，所有人都可免费下载及商用。同时，用户也将可通过通义APP免费体验最新的千问QwQ-32B模型。目前，QwQ-32B-Preview已经在（chat.qwen.ai）官网上线。

据通义千问Qwen团队介绍，近期的研究表明，强化学习可以显著提高模型的推理能力。例如，DeepSeek-R1通过整合冷启动数据和多阶段训练，实现了最先进的性能，使其能够进行深度思考和复杂推理。而QwQ-32B就是大规模强化学习（RL）对大语言模型的智能的提升作用的最好研究例证。规模上，QwQ-32B是一款仅有320亿参数的模型，其性能却可与具备6710 亿参数（其中370亿被激活）的DeepSeek-R1媲美。

另外，Qwen团队还在推理模型中集成了与Agent相关的能力，使其能够在使用工具的同时进行批判性思考，并根据环境反馈调整推理过程。测试结果显示，在测试数学能力的AIME24评测集上，以及评估代码能力的 LiveCodeBench中，千问QwQ-32B表现与DeepSeek-R1相当，远胜于o1-mini及相同尺寸的R1 蒸馏模型。

在由Meta首席科学家杨立昆领衔的“最难LLMs评测榜” LiveBench、谷歌等提出的指令遵循能力IFEval评测集、由加州大学伯克利分校等提出的评估准确调用函数或工具方面的BFCL测试中，千问QwQ-32B的得分均超越了DeepSeek-R1。

此外，Qwen团队还通过展示了一段简短的示例代码，说明如何通过API使用 QwQ-32B。Qwen团队表示，我们希望我们的一点努力能够证明强大的基础模型叠加大规模强化学习也许是一条通往通用人工智能的可行之路。

受此消息影响，阿里巴巴港股大涨6.7%，截稿前报138.6港元，总市值2.63万亿港元。