阿里通义千问发布小尺寸模型Qwen3-4B,性能超越GPT4.1-Nano
阿里通义千问今日宣布,其新发布的Qwen3-4B模型系列中的两个新模型——Qwen3-4B-Instruct-2507和Qwen3-4B-Thinking-2507——已经在魔搭社区和HuggingFace平台上正式开源。
新模型在非推理领域表现出色,Qwen3-4B-Instruct-2507全面超越了闭源的小尺寸模型GPT4.1-Nano,并在性能上接近中等规模的Qwen3-30B-A3B(non-thinking)。在推理领域,Qwen3-4B-Thinking-2507的表现甚至可以与Qwen3-30B-A3B(thinking)相媲美。
官方指出,2507版本的Qwen3-4B模型特别适合在手机等端侧硬件上部署,这将使得手机等移动设备能够高效地运行这些模型。
Qwen3-4B-Instruct-2507模型的通用能力得到了大幅提升,不仅超越了商业闭源的小尺寸模型GPT-4.1-nano,而且在性能上接近Qwen3-30B-A3B(non-thinking)。新模型还覆盖了更多语言的长尾知识,并在主观和开放性任务中增强了人类偏好对齐,能够提供更符合人们需求的答复。此外,模型的上下文理解能力扩展至256K,使得小模型也能够处理长文本。
Qwen3-4B-Thinking-2507模型在推理能力上得到了大幅增强,AIME25得分高达81.3分,推理表现可以媲美Qwen3-30B-Thinking模型。特别是在AIME25测评中,该模型在数学能力方面表现出色,以4B参数量获得了81.3分的高分。此外,该模型的Agent分数也非常突出,相关评测均超越了更大尺寸的Qwen3-30B-Thinking模型。模型的256K tokens上下文理解能力支持更复杂的文档分析、长篇内容生成、跨段落推理等场景,为用户提供更加丰富的应用体验。
9月5日消息,在2024Inclusion·外滩大会上,支付宝全新发布AI生活管家App“支小宝”,这也是国内首个服务型的AI独立App。据了解,区别于传统的图形用户界面,“支小宝”采用极简的对话式交互,用户下达口语指令后,...
苹果iOS 18是否具备生成式人工智能功能 在6月初就有望揭晓3月25日消息,据外媒报道,上周有外媒在报道中提到,苹果公司和百度就使用后者的生成式人工智能大模型,为在国内市场的部分iPhone机型带来生成式人工智能有过谈判,也同谷歌和OpenAI在国外市场的应用上有过类似的谈...
消息称华为组建医疗卫生军团 推动医疗大模型临床应用IT之家3月8日消息,据《科创板日报》报道,华为正式组建医疗卫生军团。据悉,医疗卫生军团将重点构建AI辅助诊断解决方案体系,推动医疗大模型在临床场景的应用。IT之家注意到,近期华为在医疗健康领域动作不断。就在...
OpenAI内部文件曝光:欲将ChatGPT打造成超级助手,挑战苹果Siri市场地位6月3日消息,一份近期解封的由OpenAI于2024年底制定的文件《ChatGPT:2025年上半年战略》揭示了该公司对ChatGPT的宏伟蓝图,其目标直指苹果的Siri。这份文件通过美国司法部对谷歌的反垄断案件曝光,为我们提供了一个...
微软寻求自主AI能力,减少对OpenAI依赖以提高365 Copilot效率据知情人士透露,微软正在积极研发和引入新的内部和第三方人工智能模型,目的是为了减少对其合作伙伴OpenAI技术的依赖,并进一步降低运营成本。这一策略是微软减少对OpenAI依赖计划的一部分,此前微软曾高度依赖Open...
如何选购kawai电钢琴??2023年kawai选购攻略大全来了!
哈喽!最近有超多小伙伴问我:怎么选一台kawai性价比高的电钢琴?为了解决大家在选择kawai电钢的困惑,我专门...
苹果招募生成式AI人才 提供数十个大模型岗位
根据最新的招聘信息,苹果正在扩大其生成式人工智能领域的专业团队,并计划将这项技术应用于iPhone和iPad等...
昆仑万维旗下Opera生成式AI服务海外用户数突破100万
昆仑万维旗下Opera宣布,生成式AI服务Aria海外用户数突破100万。2023年5月24日,Opera正式推出生成式AI助理...
创始人王慧文退出 美团成AI公司光年之外唯一股东
8月7日消息,据国家企业信用信息公示系统显示,北京光年之外科技有限公司在近期完成工商变更,创始人王慧文...