阿里通义Qwen3:推理模型升级,数学与编程能力飞跃
7月31日消息,人工智能领域再掀热潮。
阿里通义近日推出的推理模型新版本Qwen3-30B-A3B-Thinking-2507,实现了数学推理和代码能力的关键性提升。根据最新报道,该模型在数学推理评测AIME25中取得了85.0分的高分,同时在代码能力测试LiveCodeBench v6中也以66.0分的成绩,显著超越了包括Gemini2.5-Flash(thinking)和旧款旗舰Qwen3-235B在内的竞争对手。
这款名为通义Qwen3的新推理模型不仅在知识水平评测(GPQA、MMLU-Pro)上展示了明显的进步,还在写作能力(WritingBench)、Agent执行能力(BFCL-v3),以及多轮对话和多语言指令处理(MultiIF)等综合能力上表现出显著优势。通过一系列的测试数据比较,Qwen3的综合性能已经超越了同类产品的标准水平。
此次模型升级的特色之一是显著增加了思考长度,这大大提升了模型在面对复杂任务时的处理能力。开发者现在可以利用这一特性,通过延长模型的思考时间,来挖掘其在逻辑推理和多步骤问题解决方面的潜力。
阿里通义已经将这一先进模型在魔搭社区和HuggingFace上开源,同时推出的Qwen Chat智能对话平台也将为用户带来更流畅和高效的交互体验。这一技术进步不仅代表了通义千问在专用推理模型领域的重要突破,也为全球开发者社区贡献了一个更加强大的AI工具。(Suky)
日本文化厅将建立AI系统检测盗版网站,以避免数十亿美元经济损失12月4日消息,据法新社报道,为了遏制动漫和漫画的盗版行为,日本计划借助AI技术追踪相关网站,这些网站每年给该国造成了数十亿美元的经济损失。日本国内出版商团体早些时候披露,目前至少有1000个网站非法提供免费...
外媒称Arm将设立AI芯片部门 力争2025年打造出原型产品5月13日消息,据外媒报道,人工智能尤其是生成式人工智能的蓬勃发展,给芯片领域带来了新的发展机遇,较早开始人工智能领域布局的英伟达,凭借H100、A100等性能出色的产品,占据了大部分的市场份额,从去年开始就已...
可灵的“两幅面孔”过去一年来,AI在快手财报中所占的比例愈发显著。2024年6月,快手正式上线了视频生成大模型可灵,截至2025年2月底,可灵AI的累计营业收入超1亿元。2025年,可灵商业化再提速,仅在一季度便狂揽超1.5亿元收入。从增长...
百川智能推出全球最长上下文窗口大模型Baichuan2-192K,一次可输入35万字超越Claude210月30日消息,百川智能发布Baichuan2-192K大模型。其上下文窗口长度高达192K,是目前全球最长的上下文窗口。Baichuan2-192K能够处理约35万个汉字,是目前支持长上下文窗口最优秀大模型Claude2(支持100K上下文窗口...
2024年智能手机AI功能竞争激烈升温:iPhone 16将引发与三星Galaxy S24的人工智能竞争预备迎接新一轮人工智能竞争的到来,苹果公司和三星电子正准备在2024年展开一场高风险的较量。据最新泄露信息显示,iPhone16可能将与SamsungGalaxyS24正面交锋。GalaxyS24系列预计将引入前沿的设备内和基于云的AI功...
外媒:苹果正在全球范围内寻找生成式人工智能人才
8月7日消息,据外媒报道,苹果公司正在全球范围内寻找生成式人工智能(AI)人才。随着OpenAI旗下AI聊天机器...
苹果计划使用富士康供应的专用服务器测试人工智能服务
据udn援引南华早报的消息,富士康将独家向苹果供应用于训练和测试人工智能服务的专用服务器。由于苹果计划...
外媒称苹果将采用富士康服务器训练和测试人工智能服务
8月9日消息,据外媒报道,在OpenAI训练的人工智能聊天机器人ChatGPT大火之后,谷歌等多家公司加入了生成式...
英伟达在人工智能技术领域的领导地位和近乎垄断的地位「令人震惊」
英伟达日前展示了其新的人工智能处理器芯片GH200,并推出了AIWorkbench功能,供客户开发自己的大型语言模型...