谷歌发布新AI模型Genie:一张图片创建可互动的虚拟世界

shuizhiyin2024-02-27 19:59:56新浪科技

新浪科技讯 北京时间2月27日晚间消息,谷歌周一发布了一种新的AI模型Genie,它可以接收文本提示、草图或想法,将其变成一个可以互动和玩耍的虚拟世界。

 Genie拥有110亿个参数,可以说是一个基础世界模型。它由三部分组成,一个时空视频标记器、一个自回归动力学模型,以及一个简单且可扩展的潜在行动模型。

 Genie通过了互联网上超过20万小时的2D游戏视频训练,目前还是一个研究预览版。它是在无监督和无标签视频的情况下进行训练的,能够学习各种角色的动作、控制和行动,做到一致性。

 对用户而言,只要提供一段文本、一张草图,甚至是一个想法,Genie就会完成剩下的工作,生成一款2D游戏。谷歌称,Genie可以将任何图像转换成可互动的2D世界。

 与Sora呈现出的高清晰度和高真实度相比,Genie似乎不那么在意画面真实性,而是将重点放在潜在动作预测上。

 虽然这距离像《星际迷航》中那样的真正全息甲板还有一段路要走,但它确实表明,有一天走进一个房间,用几句话创造一场完全互动的冒险是可能的。

 作为一个研究项目,Genie的上市日期尚未确定,以及是否会成为真正的产品还不清楚。但重要的是其用于内容生成的潜在技术和新方法,包括通向开放世界的未标记学习。

 Genie带来的另一个重大突破是对真实世界物理的更深入理解,这可以用于训练机器人更有效地导航环境,或完成训练中没有经历过的任务。

 谷歌称,Genie开启了图/文生成交互世界的时代,还将成为实现通用AI代理的催化剂。

澜舟科技宣布轻量化大模型孟子3-8B模型正式开源

6月4日消息,在Mengzi3-13B大模型3月底开源后不久,AI初创公司澜舟科技今日宣布全新推出的又一款轻量化大模型——Mengzi3-8B,现已正式开源,并同样支持免费商用。据介绍,Mengzi3-8B是一款高效、低显存需求的AI大模...

报告称OpenAI采集了超一百万小时的YouTube视频来训练GPT-4

4月7日消息,本周早些时候,《华尔街日报》报道称AI公司在收集高质量训练数据方面遇到了困难。今天,《纽约时报》详细介绍了AI公司处理此问题的一些方法,其中涉及到属于AI版权法模糊灰色区域的内容。报道称,OpenAI...

官宣!腾讯全面下调大模型价格 混元-lite免费

5月22日消息,国内大模型全面进入价格战模式。在字节跳动、阿里、百度相继宣布旗下大模型降价之后,刚刚,腾讯也宣布加入战局。腾讯云官方公众号公布了全新大模型价格方案。其中,腾讯主力模型之一混元-lite模型,AP...

李开复:中国大模型竞争异常激烈,甚至可能超过美国,最终将有几个大赢家

12月28日消息,根据风险投资家、谷歌中国前总裁李开复的预测,中国的生成式人工智能创业公司正在经历一场“预选赛”。他今年早些时候创立了零一万物(01.AI),这是一家总部位于北京的初创公司,专注于开发大语言模...

近10年苹果最重要软件更新,能不能挽救iPhone销量

6月11日消息,美国时间周一,苹果公司在其位于加州库比蒂诺的总部举办了2024年全球开发者大会(WWDC)。在这场备受关注的活动中,苹果宣布了对iPhone、Mac、iPad、AppleTV以及AppleWatch等核心产品线软件的全面更新...

TAG:谷歌 AI Genie
上一篇:“欧洲版OpenAI”获微软投资 已推出人工智能聊天机器人和大语言模型
下一篇:大股东施加压力,要求苹果公司披露在AI领域相关计划