DeepSeek最强对手来了!阿里巴巴放出重磅炸弹

DeepSeek最强对手来了!阿里巴巴放出重磅炸弹

作者:news 发表时间:2025-08-12
出门问问高开逾9% 预期上半年亏损收窄超过99%接近盈亏平衡 济南产发11亿元投资济南先投这么做真的好么? 北海康成-B于8月12日上午起短暂停牌学习了 暴力催收? 海尔消金遭万人投诉,回应称“行业共性” | BUG实时报道 济南产发11亿元投资济南先投太强大了 光大期货:8月12日有色金属日报 远东发展于8月12日上午起短暂停牌最新进展 消费股走高 零售方向领涨 转向“重回报”!8月以来158只基金主动限购,葛兰、冯炉丹、高楠均出手记者时时跟进 零售股盘初活跃,国光连锁2连板 北海康成-B于8月12日上午起短暂停牌 以旧换新成效明显 江苏上半年限上零售额同比增长9.4%秒懂 动力煤上涨阻力在哪里?后续会怎么发展 大打免费牌争夺用户 马斯克Grok4与ChatGPT5“短兵相接” 中药概念持续走强,莱茵生物涨停官方通报 能源金属板块短线走低 永杉锂业跌超5%是真的吗? 能源金属板块短线走低 永杉锂业跌超5%官方通报 重庆机电盈喜后高开逾9% 预期中期股东应占净利同比增长50%左右秒懂 长亮科技董事长王长春获评 “积极贡献企业家”荣誉称号 稀土永磁板块走低 多股跌超3% 美国经济暗藏“滞胀”隐忧,小心CPI打乱美联储降息算盘!反转来了 轨交设备行业财务总监CFO观察:今创集团胡丽敏仅为大专学历 2024年年薪为80万元 超行业平均水平 轨交设备行业财务总监CFO观察:交大思诺徐红梅年龄37岁为行业最年轻 薪酬为50万元官方已经证实 沸腾!暴涨近170%!龙国,创造历史! 众擎机器人赵同阳:让机器人能如同朋友般值得信赖,亦能似家人般传递温暖后续会怎么发展 轨交设备行业财务总监CFO观察:九州一轨李秀清收到1次警示函 2024年薪酬为94万元较前一年下跌62%后续会怎么发展 狂奔的海尔消金为何面临合规困局是真的吗? 远大智能博林特电梯2025年度经销商战略合作与产品推广会议华东站——GHOX-B瑞系列华东区域首发学习了 智元入股玉树智能,持股比例5%,玉禾田股价暴涨科技水平又一个里程碑 总裁联播+政企双补,红星美凯龙818大促超级直播 携9大品牌引爆全域流量官方处理结果 钧达股份:目前生产经营一切正常后续来了 日本政治困境加剧 给预算编制与加息时机蒙上阴影后续反转 《关于金融支持新型工业化的指导意见》解读  创金合信基金罗水星:加速制造业产业升级又一个里程碑 智元机器人获富临精工数千万元订单,近百台远征 A2-W 落地工厂后续反转来了 燃气行业董秘观察:胜通能源宋海贞42岁为行业最年期 薪酬为30万元为行业垫底实时报道 高盛测算美国关税成本:截至6月“美国企业承担64%、消费者22%,出口商14%”,到10月“消费者将承担67%”学习了 新强联:上半年归母净利润4亿元,同比扭亏为盈专家已经证实 河南发布企业降本增效支持措施 将建只租不售“工业保障房” 龙国电动车赢得尼泊尔市场青睐,占据主导地位秒懂 陕建股份:7月中标重大施工项目3个 合计中标额21.65亿元后续会怎么发展 华安基金:龙国央行连续9个月购金,行业关税仍存加剧风险最新进展 陕建股份:7月中标重大施工项目3个 合计中标额21.65亿元 华安基金:A股持续上攻,创业板50指数涨0.47%实垂了 证监会再出重拳!这些上市公司被严惩,遭受损失的股民或可维权!官方处理结果 江城夜话 数智驱动:烽火通信与行业共话AI赋能企业新图景 喜讯!海底数据中心项目入围工信部算力强基揭榜行动名单学习了 @懂AI、会编程的你 这些银行开始“抢人”啦!记者时时跟进 周永:希望能够做创造万物的机器人记者时时跟进 国信证券×火山引擎 你的炒股AI搭子上线!是真的吗? 朗源股份再次递交立案,两类投资者还可加入太强大了 英氏控股IPO:业绩增长疲态尽显用近4成收入营销、研发费用率<1% 除米粉外辅食全靠代工、频因品控问题遭控诉 销量七连涨!上汽集团以破局之势领跑行业,下半年剑指更高峰 英氏控股IPO:业绩增长疲态尽显用近4成收入营销、研发费用率<1% 除米粉外辅食全靠代工、频因品控问题遭控诉实时报道 挪威石油基金上半年回报 5.7%,规模达 19.586 万亿克朗,欧洲银行股贡献最大官方已经证实 @懂AI、会编程的你 这些银行开始“抢人”啦!

自DeepSeek火爆全球之后,国产开源大模型的开发热潮一浪高过一浪。如今,DeepSeek诞生以来最强的对手,它来了!

本站

今日凌晨3点30,阿里巴巴放出一枚重磅炸弹——通义千问最新开源模型QwQ-32B正式发布,比DeepSeek更小的尺寸,性能比肩全球最强开源推理模型。据了解,通过大规模强化学习,千问QwQ-32B在数学、代码及通用能力上实现质的飞跃,整体性能比肩DeepSeek-R1。而且在保持强劲性能的同时,千问QwQ-32B还大幅降低了部署使用成本,在消费级显卡上也能实现本地部署。

目前,阿里已采用宽松的Apache2.0协议,将千问QwQ-32B模型向全球开源,所有人都可免费下载及商用。同时,用户也将可通过通义APP免费体验最新的千问QwQ-32B模型。目前,QwQ-32B-Preview已经在(chat.qwen.ai)官网上线。

据通义千问Qwen团队介绍,近期的研究表明,强化学习可以显著提高模型的推理能力。例如,DeepSeek-R1通过整合冷启动数据和多阶段训练,实现了最先进的性能,使其能够进行深度思考和复杂推理。而QwQ-32B就是大规模强化学习(RL)对大语言模型的智能的提升作用的最好研究例证。规模上,QwQ-32B是一款仅有320亿参数的模型,其性能却可与具备6710 亿参数(其中370亿被激活)的DeepSeek-R1媲美。

本站

另外,Qwen团队还在推理模型中集成了与Agent相关的能力,使其能够在使用工具的同时进行批判性思考,并根据环境反馈调整推理过程。测试结果显示,在测试数学能力的AIME24评测集上,以及评估代码能力的 LiveCodeBench中,千问QwQ-32B表现与DeepSeek-R1相当,远胜于o1-mini及相同尺寸的R1 蒸馏模型。

在由Meta首席科学家杨立昆领衔的“最难LLMs评测榜” LiveBench、谷歌等提出的指令遵循能力IFEval评测集、由加州大学伯克利分校等提出的评估准确调用函数或工具方面的BFCL测试中,千问QwQ-32B的得分均超越了DeepSeek-R1。

此外,Qwen团队还通过展示了一段简短的示例代码,说明如何通过API使用 QwQ-32B。Qwen团队表示,我们希望我们的一点努力能够证明强大的基础模型叠加大规模强化学习也许是一条通往通用人工智能的可行之路。

受此消息影响,阿里巴巴港股大涨6.7%,截稿前报138.6港元,总市值2.63万亿港元。

本站

相关文章