Akamai AI推理可降低60%推理时延,李昇:高度分布式架构带来的优势

baobei_ts2025-05-12 15:34:44TechWeb.com.cn

5月12日消息,近几年,在连续完成收购Linode等后,Akamai已经成功转型为一家云服务(公有云)、安全服务和CDN服务三位一体的全球最分布式的计算平台。

截至目前,Akamai在全球130个国家拥有1200多个运营商网络、有超过4000个边缘节点、26个核心云计算节点和10个分布式节点。

随着生成式AI应用数量的爆发式增长,近期,Akamai也推出了AI推理解决方案,旨在加速人工智能推理工作负载,优化效率和成本。

Akamai副总裁暨大中华区总经理李昇表示:“随着AI应用被广泛使用,未来在推理方面的计算需求可能是训练方面需求的十倍、甚至更多,同时,大量推理需求将在边缘发生,这些AI推理需求当中更需要分布式的、低延时的、灵活部署的基础架构。Akamai高度分布的架构设计极具优势,在这一波新的浪潮当中更加适应,也更能够帮助客户快速地在就近于他们用户的地方部署生成式AI模型。”

Akamai副总裁暨大中华区总经理 李昇

Akamai亚太区云计算专家团队负责人李文涛介绍:“Akamai AI推理服务帮助企业提供了高达3倍的推理吞吐能力,降低了高达60%的推理时延,并且相比于同等的传统云计算厂商的基础设施可以帮助客户降低使用成本高达86%之多。”

Akamai亚太区云计算专家团队负责人 李文涛

据介绍,Akamai AI推理解决方案包括四个部分:

一、经典的计算产品线,包括CPU的虚机、GPU的虚机、专属芯片的VPU虚拟机,从不同的层面、不同的维度,帮助客户提供了AI推理的选择。与英伟达、支持英伟达AI的生态系统合作,包括提供对TensorRT这样推理运行环境的支持,以及对丰富的AI模型的支持。

二、数据管理,AI无论是训练还是推理都离不开实时的数据处理能力。Akamai和业界领先的分布式数据平台VastData合作,结合自身全球分布式的边缘云平台帮助企业的AI模型利用实时的数据去加速AI推理服务。包括实时优化AI模型,RAG(Retrieval-Augmented Generation)技术都需要AI模型可以实时获取到相关推理数据,Akamai和VastData的合作帮助客户可以大大提升其交付低时延AI的能力,并且能够提升优化模型的效率。

三、容器化服务。Akamai的LKE企业版,采用托管式的K8s服务,可帮助客户运行在容器化的环境来支持其推理服务。

四、边缘云计算和网络能力。由于Akamai的云平台和骨干网是集成的,所以可以大大降低面向最终用户推理的时延、数据传输时延、提高吞吐效率,并且Akamai在边缘云计算还有一个合作伙伴Fermyon,它提供了WebAssembly(WASM)的支持,这样可以帮助客户在边缘构建无服务器应用来支持其AI推理。

李文涛强调:“因为Akamai边缘的时延基本上是处于互联网的最后一跳,也就是说Akamai离最终用户只有一个网络跳,只有10毫秒到数10毫秒的时延,Akamai可以很好的帮助AI企业解决‘最后一公里”时延的问题’。”

此外,李昇还透露,除了帮助用户在边缘侧快速部署AI模型之外,Akamai也在持续研发和提升这些AI模型的安全能力。Akamai在今年5月的“RSA Conference”上正式发布了Akamai基于AI的防火墙,帮助用户保护其AI模型、防止其AI模型遭到恶意的攻击,包括资源消耗型的攻击、以及恶意的Token注入攻击等。

李昇总结道:“Akamai在中国的业务主要是帮助中国企业‘出海’。在助力客户有效执行和部署他们的AI战略方面,Akamai将在帮助用户有效地部署AI模型的同时确保模型的安全性。”

微软CEO纳德拉:AI像是互联网那样的巨浪 改变了规则

8月18日消息,微软专注于人工智能(AI)技术的研发,并在OpenAI身上投入100多亿美元绝非偶然。该公司首席执行官萨蒂亚·纳德拉(SatyaNadella)认为,AI对公司以及整个行业的影响将与互联网浪潮一样大。早在1995年,...

阿里巴巴通义千问Github页面神秘消失 负责人澄清:团队未解散,正排查原因

今天上午,阿里巴巴旗下的大模型通义千问QwenLM的Github页面突然被下线,包括Qwen2.0在内的项目在访问时全部显示404错误,这无疑给关注这个项目的人们带来了巨大的困惑。面对这一突如其来的情况,阿里巴巴高级算法专...

马斯克遇难题:未来10年内,人形机器人行业难以大规模商业落地

随着以ChatGPT为代表的AI大模型技术加速革新,特斯拉旗下人形机器人也迎来“进化”。9月末,埃隆·马斯克(ElonMusk)创立的特斯拉发布视频,展示其研发的最新“擎天柱”(Optimus)人形机器人,能够执行多种任务,...

炸醒整个AI圈的Manus,先“炸伤”了自己?

DeepSeek之后,又一款国产AI成功出圈。3月6日凌晨,中国AI团队Monica宣布推出全球首款通用型AI智能体产品Manus。据悉,Manus在GAIA基准测试中取得了SOTA(State-of-the-Art)的成绩,显示其性能超越OpenAI的同层次大...

扎克伯格的元宇宙在婚礼上遭调侃 巨亏后Meta转舵AI

IT之家1月15日消息,2022年曾经被视为元宇宙元年,扎克伯格为了实现这一宏愿,不惜将Facebook改名为Meta,大笔资金投入其中。然而,现实狠狠地给了他一个耳光。他的“元宇宙”梦不仅烧光了数十亿美金,还沦为业内笑...

上一篇:马斯克透露Grok 3.5发布时间:一周内完善,目前仍较为粗糙
下一篇:AI初创企业Perplexity在新一轮融资中估值飙升至140亿美元