阿里通义千问发布小尺寸模型Qwen3-4B,性能超越GPT4.1-Nano

gangtielieren2025-08-07 16:43:43TechWeb.com.cn

阿里通义千问今日宣布,其新发布的Qwen3-4B模型系列中的两个新模型——Qwen3-4B-Instruct-2507和Qwen3-4B-Thinking-2507——已经在魔搭社区和HuggingFace平台上正式开源。

新模型在非推理领域表现出色,Qwen3-4B-Instruct-2507全面超越了闭源的小尺寸模型GPT4.1-Nano,并在性能上接近中等规模的Qwen3-30B-A3B(non-thinking)。在推理领域,Qwen3-4B-Thinking-2507的表现甚至可以与Qwen3-30B-A3B(thinking)相媲美。

官方指出,2507版本的Qwen3-4B模型特别适合在手机等端侧硬件上部署,这将使得手机等移动设备能够高效地运行这些模型。

Qwen3-4B-Instruct-2507模型的通用能力得到了大幅提升,不仅超越了商业闭源的小尺寸模型GPT-4.1-nano,而且在性能上接近Qwen3-30B-A3B(non-thinking)。新模型还覆盖了更多语言的长尾知识,并在主观和开放性任务中增强了人类偏好对齐,能够提供更符合人们需求的答复。此外,模型的上下文理解能力扩展至256K,使得小模型也能够处理长文本。

Qwen3-4B-Thinking-2507模型在推理能力上得到了大幅增强,AIME25得分高达81.3分,推理表现可以媲美Qwen3-30B-Thinking模型。特别是在AIME25测评中,该模型在数学能力方面表现出色,以4B参数量获得了81.3分的高分。此外,该模型的Agent分数也非常突出,相关评测均超越了更大尺寸的Qwen3-30B-Thinking模型。模型的256K tokens上下文理解能力支持更复杂的文档分析、长篇内容生成、跨段落推理等场景,为用户提供更加丰富的应用体验。
 

支付宝推出AI独立App“支小宝” AI能跑腿买咖啡订票

9月5日消息,在2024Inclusion·外滩大会上,支付宝全新发布AI生活管家App“支小宝”,这也是国内首个服务型的AI独立App。据了解,区别于传统的图形用户界面,“支小宝”采用极简的对话式交互,用户下达口语指令后,...

苹果iOS 18是否具备生成式人工智能功能 在6月初就有望揭晓

3月25日消息,据外媒报道,上周有外媒在报道中提到,苹果公司和百度就使用后者的生成式人工智能大模型,为在国内市场的部分iPhone机型带来生成式人工智能有过谈判,也同谷歌和OpenAI在国外市场的应用上有过类似的谈...

消息称华为组建医疗卫生军团 推动医疗大模型临床应用

IT之家3月8日消息,据《科创板日报》报道,华为正式组建医疗卫生军团。据悉,医疗卫生军团将重点构建AI辅助诊断解决方案体系,推动医疗大模型在临床场景的应用。IT之家注意到,近期华为在医疗健康领域动作不断。就在...

OpenAI内部文件曝光:欲将ChatGPT打造成超级助手,挑战苹果Siri市场地位

6月3日消息,一份近期解封的由OpenAI于2024年底制定的文件《ChatGPT:2025年上半年战略》揭示了该公司对ChatGPT的宏伟蓝图,其目标直指苹果的Siri。这份文件通过美国司法部对谷歌的反垄断案件曝光,为我们提供了一个...

微软寻求自主AI能力,减少对OpenAI依赖以提高365 Copilot效率

据知情人士透露,微软正在积极研发和引入新的内部和第三方人工智能模型,目的是为了减少对其合作伙伴OpenAI技术的依赖,并进一步降低运营成本。这一策略是微软减少对OpenAI依赖计划的一部分,此前微软曾高度依赖Open...

上一篇:谷歌DeepMind推出Genie 3:AI世界模型 实现实时交互式3D环境生成
下一篇:xAI 联合创始人叫板 OpenAI:我们以更小的团队取得很多的领先优势