Meta推出Llama 3大模型 在集成近25000块英伟达H100计算集群上训练
4月19日消息,据外媒报道,Meta公司在当地时间周四推出了他们最新一代大语言模型Llama 3的早期版本,并宣布推出基于这一模型打造的人工智能助手Meta AI。
从外媒的报道来看,同前一代大模型Llama 2一样,Meta新一代的Llama 3大模型,也注重供用户免费使用,目前已有两种不同参数版本的Llama 3可供用户使用,分别为80亿参数和700亿参数,均已可在Meta官网下载。
对于Llama 3大语言模型,Meta公司CEO马克•扎克伯格在接受采访时透露,他们在训练700亿参数的模型时,使用了15T tokens的数据,在训练过程中模型从未达到饱和状态,也就是从未在能力提升过程中遇到瓶颈,Meta最终也解决了训练过程中遇到的问题,并转向训练其他的模型。
正如外媒在报道中所提到的一样,Meta目前推出的还只是Llama 3的早期版本,他们还在训练更强大的模型。外媒在报道中就提到,Meta已宣布他们目前正在训练有4000亿参数的Llama 3模型,部分专家认为他们的这一模型,在MMLU、GPQA、HumanEval、MATH等方面的表现,将与OpenAI的GPT-4 Turbo, Anthropic的Claude 3 Opus和谷歌的Gemini Ultra相当。
作为全球人工智能领域重要参与者的英伟达,在Meta训练的Llama 3上也发挥了关键作用,提供了大量的GPU。
在Meta宣布推出Llama 3之后不久,英伟达就在官网上披露,Meta的工程师是在集成了24,576块H100 GPU的计算集群上训练的Llama 3,这些GPU通过英伟达的Quantum-2 InfiniBand网络连接。在英伟达的支持下,Meta也为他们的旗舰模型调整了网络、软件和模型架构。(海蓝)
粉笔8月推AI智能老师,已开发出首个专注于公务员考试的大模型6月12日消息,公考培训龙头粉笔公司在港交所发布公告,宣布将于2024年8月推出其自研AI智能老师(“AI智能老师”)。AI智能老师将成为粉笔线上平台提供的AI学习工具之一,率先应用于其国家或省级招录类及资格证考试系...
文心一言最新重磅发布 新增5大原生插件8月16日消息,由深度学习技术及应用国家工程研究中心主办的WAVESUMMIT深度学习开发者大会2023举办。百度首席技术官、深度学习技术及应用国家工程研究中心主任王海峰以《大语言模型为通用人工智能带来曙光》为题,阐...
消息称苹果和OpenAI已达成协议 将生成式AI引入iOS 185月27日消息,据外媒报道,传闻几个月的苹果与OpenAI洽谈将生成式人工智能功能引入iOS18一事,有了取得进展的消息,长期关注苹果的一名资深记者,透露双方已经达成了协议。这名资深记者透露,根据双方达成的协议,Op...
大瓜!国产大模型被美国斯坦福大学团队套壳抄袭,CEO回应了6月4日消息,大模型这波热度起来以后,一直是一些国内大模型被质疑套壳国外开源大模型。现在,回旋镖来了。近日,一则国内大模型被美国斯坦福大学团队套壳抄袭的消息在社交媒体上沸沸扬扬。事情起源是,5月29日,斯...
黄仁勋:AI将在5年内赶超人类 ,OpenAI首台AI超算是马斯克买的11月30日消息,英伟达首席执行官黄仁勋周三在《纽约时报》的年度DealBook峰会上表示,人工智能正在超越人类。他指出,如果通用人工智能(AGI)被定义为一种计算机,能够以与人类智能相媲美的方式完成测试,那么“在...
外媒:苹果正在全球范围内寻找生成式人工智能人才
8月7日消息,据外媒报道,苹果公司正在全球范围内寻找生成式人工智能(AI)人才。随着OpenAI旗下AI聊天机器...
苹果计划使用富士康供应的专用服务器测试人工智能服务
据udn援引南华早报的消息,富士康将独家向苹果供应用于训练和测试人工智能服务的专用服务器。由于苹果计划...
外媒称苹果将采用富士康服务器训练和测试人工智能服务
8月9日消息,据外媒报道,在OpenAI训练的人工智能聊天机器人ChatGPT大火之后,谷歌等多家公司加入了生成式...
IBM旗下AI平台将托管Meta大语言模型MetaLlama2
IBM宣布将在其企业人工智能平台WatsonX上托管MetaPlatform的AI语言模型MetaLlama2。据悉,Llama2是Meta于今...