Akamai AI Grid 全球首发,4400 个边缘站点重塑AI推理的“Token 经济”

ximenzaixian2026-03-20 15:39:37TechWeb.com.cn

3月20日消息,近期OpenClaw(昵称:龙虾)的火爆让人们切身感受到AI能力的无限潜力。但是,当全球企业争相将人工智能融入业务核心时,一个根本性的挑战日益凸显:AI 推理的“最后一公里”正在成为性能瓶颈。大型语言模型和多模态应用需要的是瞬时响应,但往返于中心化数据中心的延迟,却让实时交互的体验大打折扣。

在去年10月Akamai 推出Akamai Inference Cloud (AI推理云),将推理能力从核心数据中心扩展至互联网边缘端后,近期Akamai 最新发布了 AI Grid 智能编排,通过将 NVIDIA 算力融入其全球4400个边缘站点,从而解决AI 推理的“最后一公里”问题。

Akamai正在构建一个从集中式“AI 工厂”向分布式“AI 公共设施”演进的蓝图。

边缘即核心:解决延迟的物理法则

传统的 AI 架构遵循“训练集中、推理集中”的模式,这对于需要极低延迟的应用场景而言,存在物理上的局限。无论是物理 AI如自动驾驶、机器人、实时视频处理,还是高并发的个性化推荐,数据从产生到传输至中心节点再返回的往返时间,往往超过了应用本身可容忍的阈值。

市场研究机构的预测揭示了这一趋势的紧迫性:Gartner指出,到2028年,全球AI推理所消耗的算力预计将达到模型训练的3倍。IDC的预测明确指出,到2028年,50%的企业将把推理类用例部署在边缘侧,以驱动新增收入、改善客户体验和优化内部流程。

Akamai 的优势在于其长达数十年的分布式架构积累。其 AI Grid 的核心逻辑并非简单地增加算力,而是通过智能编排,将推理任务调度到距离用户最近的边缘站点。这些站点不再仅仅是内容分发的缓存节点,而是集成了基于 NVIDIA RTX PRO 6000 Blackwell 服务器版 GPU 的推理能力。

通过在网络边缘处理请求,Akamai 绕过了中心云的物理距离限制,使得游戏工作室能够实现亚 50 毫秒的 AI 驱动型 NPC 交互,金融机构能够在登录瞬间完成欺诈检测与个性化推荐,广播公司也能为全球观众提供无延迟的实时转码与配音。

“Token 经济”的智能调度员

随着企业 AI 应用从简单的生成式对话向复杂的代理式和物理 AI 演进,对基础设施的要求也从单纯的算力转向了“连接”与“协同”。

在 Akamai 的构想中,AI Grid 不仅仅是一张物理网络,更是一个具备工作负载感知能力的智能控制平面。这个核心编排器充当着 AI 请求的实时代理,其目标是在大规模分布式环境中优化“Token 经济” (tokenomics),即通过智能路由,平衡每个 Token 的成本、首个 Token 的响应时间以及整体吞吐量。

“AI 工厂是为训练和前沿模型工作负载而构建的,中心化基础设施将继续为这些场景提供最佳的‘Token经济’,”Akamai 云技术事业部首席运营官兼总经理 Adam Karon 表示,“但实时视频、物理 AI 和高并发个性化体验要求推理需要在接触点进行,而不是往返中心化集群。我们的 AI Grid 智能编排为 AI 工厂提供了一种向外扩展推理的方式——利用革新了内容分发的分布式架构,在 4400 个站点以合适的成本和时间路由 AI 工作负载” 。

具体而言,该编排器能够自动识别工作负载的性质,并将其与最合适的计算层匹配。对于需要高密度计算的持续后训练或复杂多模态推理,系统将其导向核心节点的专用 GPU 集群;而对于长尾的、对延迟敏感的轻量级推理任务,则将其保留在边缘,利用语义缓存和 WebAssembly 等轻量化技术进行处理。

这种精细化的资源调度,不仅为高端任务保留了优质的 GPU 周期,也通过充分利用边缘资源,大幅降低了企业的整体推理成本。

打造分布式“AI 公共设施”

事实上, 去年Akamai Inference Cloud (AI推理云)一经推出,就受到客户的推崇。根据Akamai披露,其已与一家处于AI革命前沿的美国大型科技公司签署了为期四年、价值2亿美元的高性能AI计算服务协议。

随着AI Grid的推出,现在Akamai Inference Cloud 不仅仅是把 GPU 放在边缘,它通过 AI Grid 智能编排,将高密度计算从核心分发到触点,使 AI 工厂从孤立的数据中心设施,演变为一个全球分布的、可被实时访问的公共设施。

对于行业而言,这标志着一个重要的转折点:未来的 AI 竞争,将不再仅仅取决于拥有多少算力,更在于如何在全球范围内智能地调度这些算力,以最优的“Token 经济”服务于每一次实时交互。

OpenAI最强模型GPT-5.4重磅发布 首次支持原生操控电脑

3月6日消息,今日,OpenAI正式发布全新大模型GPT-5.4,号称目前能力最强、效率最高的专业工作前沿模型。相比此前的GPT-5.2,GPT-5.4在推理能力、编程能力以及处理专业办公任务方面都有明显提升,尤其是在电子表格、P...

TechWeb微晚报:OpenAI自研AI设备有望2027年量产,比亚迪部分车型限时降价

今日要闻一览:OpenAI与艾维合作开发的AI设备或于2027年量产,外观类似iPodShuffleAnthropic发布全球最强编码模型Claude4,可7小时连续编码,网友:离失业又近一步比亚迪海洋网智驾版车型推出限时一口价:海鸥智驾版...

炸醒整个AI圈的Manus,先“炸伤”了自己?

DeepSeek之后,又一款国产AI成功出圈。3月6日凌晨,中国AI团队Monica宣布推出全球首款通用型AI智能体产品Manus。据悉,Manus在GAIA基准测试中取得了SOTA(State-of-the-Art)的成绩,显示其性能超越OpenAI的同层次大...

Gartner预测AI重塑销售格局,以人为本方为成功关键

2月13日消息,市场调查机构Gartner昨日(2月12日)发布博文,报道称AI的日益普及,将深刻影响销售人员技能、客户需求和销售策略。销售组织需要关注AI带来的机遇和挑战,并积极调整策略以适应新的市场环境。援引该机...

特斯拉准备扩建得州超级工厂,拟年产1000万台Optimus人形机器人

11月11日消息,特斯拉正筹备再度扩建得克萨斯超级工厂(GigafactoryTexas),新建一座专用设施,未来将用于其人形机器人Optimus的量产。据了解,目前特斯拉已在位于北加州弗里蒙特(Fremont)的工厂内设立试点生产线...

TAG:AI Token
上一篇:三星电子将继续大力投资AI半导体研发和设施 今年计划超过700亿美元
下一篇:华为云公布AI新布局:全面锚定行业智能体