性能比肩 Gemini-2.5 pro、o4-mini:阿里通义千问 Qwen 3 推理模型超级进化,现已开源

抖音秀 热点资讯 8

7 月 25 日消息,阿里通义千问今日宣布正式推出 Qwen3-235B-A22B 思考模型升级版本:Qwen3-235B-A22B-Thinking-2507。

自千问 3 旗舰模型发布后,阿里通义千问团队一直在努力拓展大模型的推理性能,全新开源的 Qwen3-235B-A22B-Thinking-2507,在推理性能和通用能力上均实现巨大飞跃,号称可比肩 Gemini-2.5 pro、O4-mini 等顶尖闭源模型,并创下全球开源模型 SOTA 最佳性能表现:

  • 在编程(LiveCodeBench)、数学(AIME25)等核心能力上,Qwen3 推理模型实现了推理性能的再突破;

  • 在知识(SuperGPQA)、创意写作能力(WritingBench)、人类偏好对齐(Arena-Hard v2)、多语言能力(MultilF)等通用能力上,Qwen3 推理模型也取得了显著进步;

  • 新模型支持 256K 长文本理解,处理超长上下文不费力。

Qwen3-235B-A22B-Thinking-2507目前已在魔搭社区、Hugging Face 开源,采用宽松的 Apache2.0 开源协议,人人均可免费下载商用。

附开源地址:

https://www.modelscope.cn/models/Qwen/Qwen3-235B-A22B-Thinking-2507

https://huggingface.co/Qwen/Qwen3-235B-A22B-Thinking-2507