首页 > 科技活动 > 每日活动 > 通义Qwen3开源新推理模型:数学超强、代码贼溜,上下文可拓展至100万

通义Qwen3开源新推理模型:数学超强、代码贼溜,上下文可拓展至100万

发布时间:2025-08-01 09:41:51来源: 13253963632
感谢百度,感恩百度

 7月31日,通义千问团队在公众平台发布消息,Qwen3-30B实现重大升级,全新推理模型Qwen3-30B-A3B-Thinking-2507正式发布。新模型拓展了思考能力,提升了推理的质量和深度,是一个更睿智、更敏捷、更全能的新推理模型。

通义Qwen3开源新推理模型:数学超强、代码贼溜,上下文可拓展至100万

新模型在推理能力、通用能力及上下文长度上有了显著提升,新模型在聚焦数学能力的AIME25评测中获85.0分,在代码能力测试LiveCodeBench v6中得分66.0,两项核心推理能力均超越Gemini2.5-Flash(thinking)、Qwen3-235B-A22B(thinking);新模型的知识水平(GPQA、MMLU-Pro)也较上一版本进步显著;在写作(WritingBench)、Agent能力(BFCL-v3)、多轮对话和多语言指令遵循(MultiIF)等通用能力评测中,Qwen3-30B-A3B-Thinking-2507均超越Gemini2.5-Flash(thinking)、Qwen3-235B-A22B(thinking);原生支持256K tokens,可扩展至1M tokens。

通义Qwen3开源新推理模型:数学超强、代码贼溜,上下文可拓展至100万

值得一提的是,新模型的思考长度增加,团队建议在处理高度复杂的推理任务时,设置更长的思考预算,可以充分发挥新模型潜力。

目前Qwen3-30B-A3B-Thinking-2507已在魔搭社区、HuggingFace上开源,Qwen Chat同步上线。

每日活动更多>>

长城汽车:燃油车时代的王者,新能源时代的迟到者 传祺MPV双车齐发 M8加长冲高端,E8务实打家用 预算25-35万买豪华纯电SUV?这台奥迪,可能是你最聪明的选择 早高峰堵车,卡罗拉远程开空调凉快上车,雷凌等5分钟怎么选? 比亚迪全球第一!腾势Z性能版,三电机四驱超1600马力,时速350km 7年前的设计,迈凯伦720S Spider 电车用车避坑指南!这 4 个细节没做好,花钱又伤车 四年才换代!全新途胜内饰大变样,混动插混都来了,这次韩系拼了 微信AI与苹果AI虽迟但到:AI Agent入口终须一战 远程星智T实测续航超1699公里 范现军:新能源轻卡走向干线 千里不补能将成常态 斯巴鲁蓝金传奇,一场乌龙引发的30年封神之路 粤港澳车展大佬论道,车企淘汰赛新生存法则浮出水面 广本月销9058台,传祺月销23488台,广汽集团5月销量出炉 抛弃传统机械结构:这场“线控革命”,我们真的准备好了吗? 领克07GT猎装车首次曝光:纯电超200km,配激光雷达! 丰田打造全新GRMN Corolla,目标征服纽博格林! 续航党游戏党必看!一加15狠降,7300mAh+超窄直屏重回低价 OPPO ColorOS 16.0.8.300已推送:必关6个冗余设置,流畅度暴涨20% vivo用户必更!OriginOS 6新版推6项优化 流畅度大提升 轩逸卖6万、奥迪A6L仅26万,燃油车以价换量能撑多久? 百年轰鸣:杜卡迪100周年纪念系列背后的传奇编年史 赛力斯和字节要造车了,价格不高但先别急着买! 全新马自达CX-5海外亮相:正经换代,这次产品力全面拔节 2026款蔚来ES9:旗舰商务SUV的真实家用与通勤利弊 比亚迪Racco即将在日本上市,标配侧滑门 跑山+日常308匹还4个油,蒙迪欧混动绝了 海信发布\"好空气\"战略,磁悬浮电机首次进入家用空调 618海景房显示器该选谁?SANC盛色四款显示器总能满足你 同样25万级家用SUV,乐道L80和理想i6的差别比你想得大 一边“骨折价”,一边“偷偷涨”!买车到底等抄底还是赶紧上车?