股价已涨200% 海外神秘大模型几乎确定为GLM-5:复用DS架构
2月10日消息,前几天我们提到春节期间国产AI行业会有几款重磅产品推出,除了最受关注的DeepSeek V4之外,智谱的新一代大模型GLM-5也要上线了,推动该公司股价近期大涨200%。
前几天在全球模型服务平台OpenRouter上线了一款代号为“Pony Alpha”的匿名模型,引起了全球关注,因为它的表现很不错,尤其是在写代码方面被认为能达到Claude Opus一个级别。
Pony Alpha到底是哪家的模型一度引发网友热烈讨论,目前几乎可以确定是智谱的GLM-5了,一方面是系统的提示词显示它说自己是GLM,另一方面网友验证了一个GLM大模型家族的特色bug,那就是输入 “锅内倒入植物油烧热” 得到的答案是乱七八糟的,Pony Alpha也符合这个特点。
随着更多信息的挖掘出来,GLM-5的技术架构也差不多明确了,它采用了与DeepSeek-V3/V3.2相同的技术路线——DeepSeek稀疏注意力,简称DSA,总参数量达745B,是上一代GLM-4.7的2倍。
除了DSA之外,GLM-5另一大技术特色是多Token预测(Multi-Token Prediction,MTP),有78层隐藏层,256个专家,每次激活8个,激活参数约44B,稀疏度5.9%,上下文窗口最高支持202K token。
复用DS架构的好处有很多,可以直接受益于vLLM、SGLang等主流推理框架的现有优化,部署门槛将大幅降低。
不过值得关注的是GLM-5的多模态能力,因为DS此前还是文本大模型,不支持视频的,而多模态能力在2026年是新一代大模型不应该缺少的能力。
随着GLM大模型在海内外受到欢迎,智谱公司股价近期也一路上涨,总市值已经到了1500亿港币左右,是数月前IPO上市时的3倍。(宪瑞)
英伟达微软亚马逊软银投资协议达成后 OpenAI估值有望接近8300亿美元1月30日消息,据外媒报道,在孙正义领导的软银洽谈追加投资300亿美元的消息出现之后仅1天,也传出了英伟达、微软和亚马逊这三大科技巨头,洽谈对OpenAI进行大规模投资的消息。从外媒的报道来看,英伟达、微软和亚马...
OpenAI将为ChatGPT用户增加时长提醒:别沉迷AI聊天,健康最重要8月5日消息,OpenAI公司最新发布博文,宣布为了帮助用户更健康地使用聊天机器人,自今天(8月5日)开始,调整ChatGPT的运作方式,将向用户提供使用时长的“温和提醒”,并建议其适当休息。OpenAI表示,他们不是通过...
百川智能 CEO 王小川:坐在电脑面前工作是件危险的事,大概率会被 AI 取代IT之家8月13日消息,据奇点财经报道,王小川今日在中国企业未来之星年会上指出,ChatGPT等大语言模型已经实现“读万卷书”,但没有“行万里路”——更多知识来自“对几千年积攒的文字的积累”,但缺乏来自线下的经验...
业内谈奥特曼被开除:行业大地震,但不影响AI发展大势11月18日消息,美国人工智能初创企业OpenAI周五宣布了一项重大变动,CEO萨姆·奥特曼(SamAltman)将离开公司,而现任首席技术官米拉·穆拉蒂(MiraMurati)将作为临时首席执行官接替他的职位。这突如其来的管理层变...
TechWeb微晚报:DeepSeek成全球增长最快AI工具,苹果与SpaceX为卫星频谱资源“开战”要闻一览:DeepSeek成全球增长最快AI工具央视入股爱奇艺引关注刘慈欣谈AI与科幻文学:未来AI或可替代作家奥迪加速融入中国技术多款车型将引入华为智驾系统苹果与SpaceX为卫星频谱资源“开战”消息称特斯拉一季度交付...
如何选购kawai电钢琴??2023年kawai选购攻略大全来了!
哈喽!最近有超多小伙伴问我:怎么选一台kawai性价比高的电钢琴?为了解决大家在选择kawai电钢的困惑,我专门...
苹果招募生成式AI人才 提供数十个大模型岗位
根据最新的招聘信息,苹果正在扩大其生成式人工智能领域的专业团队,并计划将这项技术应用于iPhone和iPad等...
昆仑万维旗下Opera生成式AI服务海外用户数突破100万
昆仑万维旗下Opera宣布,生成式AI服务Aria海外用户数突破100万。2023年5月24日,Opera正式推出生成式AI助理...
创始人王慧文退出 美团成AI公司光年之外唯一股东
8月7日消息,据国家企业信用信息公示系统显示,北京光年之外科技有限公司在近期完成工商变更,创始人王慧文...