谷歌发布能力最强AI模型Gemini:性能碾压GPT4 语言理解超人类
12月7日消息,北京时间7日凌晨,Google公司突然放出了自己“迄今为止最强大、最通用的模型”Gemini。
Gemini是一款多模态模型,可以归纳并流畅地理解、操作以及组合不同类型的信息,包括文本、代码、音频、图像和视频。第一个版本 Gemini 1.0 推出3款不同尺寸模型:Ultra、Pro 和 Nano。
Gemini能理解“文本、代码、音频、图像和视频”五种信息
其中,Gemini Ultra是规模最大且功能最强大的模型,适用于高度复杂的任务;Gemini Pro是适用于各种任务的最佳模型;Gemini Nano是端侧设备上最高效的模型。
三种尺寸
目前,Gemini 1.0 现已在多种Google产品和平台上推出,包括接入聊天机器人Bard和智能手机Pixel 8 Pro 上。未来几个月,Gemini 将应用于Google更多的产品和服务,如Search、Ads、Chrome 和 Duet AI。
从12月13日开始,开发者和企业客户可以通过 Google AI Studio 或 Google Cloud Vertex AI 中的 Gemini API 获取 Gemini Pro。
谷歌CEO桑达尔•皮查伊(Sundar Pichai)表示:“我们正与 Gemini 一起迈入下一段旅程。Gemini 是我们迄今为止最强大、最通用的模型,它在许多领先的基准测试中都展现出了最先进的性能。”
Gemini Ultra性能超越GPT4
DeepMind CEO戴密斯•哈萨比斯(Demis Hassabis)对Gemini进行了详细介绍。
据介绍,从自然图像、音频和视频理解到数学推理,在被大型语言模型(LLM)研究和开发中广泛使用的 32 项学术基准中,Gemini Ultra 的性能有 30 项都超过了目前最先进的水平。
在 MMLU(大规模多任务语言理解)测试中Gemini Ultra 的得分率为 90.0%,是第一个超过人类专家的模型,GPT-4的得分率为86.4%。
图像理解方面,在新的 MMMU 基准测试中,Gemini Ultra的表现也更优,其得分率达59.4%,GPT-4V的得分率为56.8%。
Gemini Ultra目前正在完成大规模的信任和安全检查,在模型的完善过程中Google将向部分客户、开发者、合作伙伴以及安全和责任专家提供 Gemini Ultra,以供其进行早期试验和提供反馈。并将在明年初向开发者和企业客户提供该模型。
最强AI模型Gemini性能展示
Gemini 1.0具有复杂推理能力,通过阅读、过滤以及理解信息,从数十万份文件中提取见解。
Google工程师演示了一个Gemini提取“20万份科学研究文献”关键信息的例子。
自2021年以来,该研究领域新增了20多万份研究论文,需要更新到原有(截止于202年)的研究中。
以往,科学研究人员只能手动来处理,现在Gemini能够自动区分和过滤与研究领域相关的文献信息,只需要一顿午饭的时间,Gemini帮科学家读完20万篇论文,并画出了更新数据信息后的新图片。
右边为更新数据后的新图
Google表示,Gemini 1.0这种从海量的数据中发掘难以辨别的知识内容的能力将有助于在从科学到金融等多个领域以数字化速度实现新的突破。
Gemini 1.0可以同时识别并理解文本、图像、音频等,因此它能更好地理解具有细微差别的信息,回答与复杂主题相关的问题。Gemini 1.0擅长解释数学和物理等复杂科目中的推理。
Google演示的例子展示了Gemini 1.0解复杂数学题的能力,和归纳整理同类题型的能力。
另外,Gemini 1.0 还可以理解、解释和生成Python、Java、C++、Go编程语言的高质量代码。
Google在两年前发布了编码工具AlphaCode,它是第一个在编程竞赛中性能达到竞赛水平的 AI 代码生成系统。
现在,利用Gemini,Google团队创建了更先进的代码生成系统 AlphaCode 2,它解决的问题的数量是AlphaCode 的2倍,编程能力超过85%的人类程序员。
另外,Google还发布了迄今为止功能最强大、效率最高且可扩展性最强的 TPU 系统 Cloud TPU v5p,旨在为训练前沿 AI 模型提供支持。新一代 TPU 将加速 Gemini 的开发,帮助开发者和企业客户更快地训练大规模生成式 AI 模型,从而更快推出新产品和新功能。
AI PC最新进展:超500款AI模型得以在Ultra处理器上优化运行5月6日消息,近日英特尔宣布在全新英特尔®酷睿™Ultra处理器上,有超过500款AI模型得以优化运行。这是市场上目前可用的业界出众的AIPC处理器,兼具全新AI体验、沉浸式图形和出色电池续航表现。这一重大里程碑是英特...
奇安信集团董事长齐向东:AI如何成为网络安全的核心驱动力6月5日消息,在2024全球数字经济大会数字安全高层论坛暨北京网络安全大会战略峰会上,奇安信集团董事长齐向东表示,AI驱动安全已是大势所趋,未来网络攻防,得AI者得天下。同时,他还剖析了AI驱动安全的三大核心要素...
腾讯QQ开始测试AI对话功能,名为“AI聊天搭子”IT之家3月6日消息,Tech星球发现,腾讯现为QQ推出了一个AI对话功能,名为“AI聊天搭子”,由QQ联合筑梦岛、混元助手合作提供服务,目前已经开启测试,但IT之家暂未获取到测试资格。除此之外,抖音也上线了一款名为“...
如果大模型不可靠,那钉钉的解药是什么?最近两周,钉钉异常活跃,看点频频。从成为阿里集团独立业务的消息开始,到发布个人版,8月22日钉钉又宣布推出AIPaaS及其最新的AI应用——数字员工。在今年这一波大模型技术浪潮中,而钉钉给外界的感觉是:快。从4月...
OpenAI宣布推出企业版ChatGPT 迄今为止最强大版本8月29日消息,据外媒报道,当地时间周一,美国人工智能研究公司OpenAI宣布推出企业版ChatGPT,企业版ChatGPT拥有增强的安全性、隐私性和一系列为企业量身定制的强大功能。ChatGPT是OpenAI于2022年11月30日推出的一种...
如何选购kawai电钢琴??2023年kawai选购攻略大全来了!
哈喽!最近有超多小伙伴问我:怎么选一台kawai性价比高的电钢琴?为了解决大家在选择kawai电钢的困惑,我专门...
苹果招募生成式AI人才 提供数十个大模型岗位
根据最新的招聘信息,苹果正在扩大其生成式人工智能领域的专业团队,并计划将这项技术应用于iPhone和iPad等...
昆仑万维旗下Opera生成式AI服务海外用户数突破100万
昆仑万维旗下Opera宣布,生成式AI服务Aria海外用户数突破100万。2023年5月24日,Opera正式推出生成式AI助理...
创始人王慧文退出 美团成AI公司光年之外唯一股东
8月7日消息,据国家企业信用信息公示系统显示,北京光年之外科技有限公司在近期完成工商变更,创始人王慧文...