英文: The Redmi K80 Pro's Impact: A Mid-Range Smartphone Showdown
DeepMind发布Genie2:一款能生成“无穷无尽”3D世界的AI模型12月5日消息,谷歌旗下人工智能研究机构DeepMind发布了一款名为Genie2的全新AI模型,该模型能够生成具有无限可能性且风格各异的3D世界。作为今年早些时候发布的Genie模型的升级版,Genie2仅需一张图片和一段文字描述,就能构建出交互式的实时3D场景
DeepMind发布Genie2:一款能生成“无穷无尽”3D世界的AI模型
12月5日消息,谷歌旗下人工智能研究机构DeepMind发布了一款名为Genie2的全新AI模型,该模型能够生成具有无限可能性且风格各异的3D世界。作为今年早些时候发布的Genie模型的升级版,Genie2仅需一张图片和一段文字描述,就能构建出交互式的实时3D场景。例如,用户只需输入“一个可爱的机器人置身于茂密的森林中”,Genie2就能立即生成一个可供用户探索的虚拟世界。
Genie2的这项能力与李飞飞创立的WorldLabs以及以色列新兴企业Decart开发的模型有着异曲同工之妙。然而,DeepMind宣称Genie2生成的3D世界在丰富度和多样性上更胜一筹。用户可以使用鼠标或键盘在这些世界中自由活动,例如跳跃、游泳等。
得益于基于视频数据的训练,Genie2能够精准模拟各种物理现象,包括物体的交互、动画效果、照明、反射效果以及非玩家角色(NPC)的行为。许多由Genie2生成的场景在视觉效果上堪比AAA级视频游戏,这可能与其训练数据中包含大量热门游戏体验有关。然而,DeepMind出于商业竞争或其他原因,并没有详细披露其数据来源和训练方法。
这引发了人们对知识产权的担忧。作为谷歌的子公司,DeepMind可以无限制地访问YouTube。谷歌此前曾暗示,其协议允许使用YouTube视频进行模型训练。然而,Genie2在生成过程中是否无意中复制了它“观看”过的视频游戏中未经授权的内容,这有待进一步考量,最终的裁决或许只能由法院给出。
DeepMind表示,Genie2能够从不同的视角(例如第一人称视角和等距视角)生成连贯的3D世界,这些世界可以持续运行长达一分钟,尽管大多数场景的持续时间在10到20秒之间。DeepMind团队在博客文章中指出,Genie2能够根据键盘操作智能地作出反应,准确识别角色并相应地移动它。“例如,我们的模型能够判断方向键应该控制机器人的移动,而不是树木或云朵。”
与其他类似的模型相比,Genie2在解决人造感、连贯性缺失和幻觉等问题上取得了显著进展。许多模型,例如Decart的《我的世界》模拟器Oasis,都存在分辨率低、快速“遗忘”关卡布局等问题。而Genie2能够记住模拟场景中未直接呈现的部分,并在它们重新出现时精准地进行渲染。这与李飞飞WorldLabs的模型异曲同工。
尽管如此,目前利用Genie2制作的游戏仍然缺乏足够的趣味性,因为它们每分钟都会清除玩家的进度。因此,DeepMind将Genie2定位为一种研究和创新工具,主要用于“互动体验”的原型制作以及AI智能体的评估。DeepMind在博客中写道:“得益于Genie2卓越的泛化能力,概念艺术和图纸得以轻松转化为完全互动的环境。借助Genie2,我们的研究人员能够快速构建出丰富多样的环境供AI智能体使用,进而生成训练期间未遭遇过的评估任务,以检验智能体的应对能力。”
对于创意工作者,特别是电子游戏行业的从业者来说,这项技术可能带来复杂的影响。最近,《连线》杂志的一项调查显示,动视暴雪等大型游戏公司正在利用人工智能技术来降低成本、提高效率,并应对员工流失的问题。事实上,动视暴雪已经裁减了数十名员工。
尽管如此,谷歌仍在持续加大对世界模型研究领域的投入,该领域有望成为人工智能领域的下一个重大突破。去年10月,DeepMind成功招募了蒂姆·布鲁克斯(Tim Brooks),他此前负责OpenAI视频生成器Sora的开发工作,现负责DeepMind的视频生成技术和世界模拟器的研发。两年前,DeepMind还从Meta挖来了蒂姆·罗克塔谢尔(Tim Rocktäschel),他因对《NetHack》等电子游戏的“开放性”实验而闻名。
Genie2的出现标志着AI生成3D世界技术的一次显著进步。虽然目前仍存在一些挑战,例如游戏趣味性不足以及知识产权的潜在问题,但Genie2作为一种强大的研究工具,无疑将对人工智能领域以及创意产业产生深远的影响。它为未来的游戏开发、AI智能体评估以及其他互动体验的创建提供了新的可能性,也预示着人工智能在内容创作领域的巨大潜力。 未来的发展方向,有待进一步观察。 DeepMind在人工智能技术的持续投入,也显示了其在该领域的雄心壮志,以及对未来技术的坚定信心。Genie2的成功,无疑将进一步推动人工智能技术的进步,并为世界带来更多创新和可能性。 这项技术的应用范围广泛,未来可能不仅限于游戏开发,还可能扩展到电影制作、建筑设计、城市规划等多个领域。 Genie2的出现,也引发了人们对人工智能技术伦理和社会影响的思考,这需要全社会共同关注和探讨。 在技术进步的同时,我们也需要关注其潜在风险,并制定相应的规章制度,以确保人工智能技术能够更好地服务于人类社会。 DeepMind在Genie2的研发过程中所面临的挑战和取得的成就,也为其他人工智能研究机构提供了宝贵的经验和借鉴。 我们可以期待,未来会有更多类似于Genie2的AI模型出现,它们将不断推动人工智能技术的发展,并为我们带来更加丰富多彩的数字世界。 同时,我们也需要关注技术的发展方向,并确保其能够更好地服务于人类社会,造福于全人类。
英文: The Redmi K80 Pro's Impact: A Mid-Range Smartphone Showdown
标签: DeepMind 发布 Genie2 一款 生成 无穷无尽 3D 世界 AI
声明:本文内容来源自网络,文字、图片等素材版权属于原作者,平台转载素材出于传递更多信息,文章内容仅供参考与学习,切勿作为商业目的使用。如果侵害了您的合法权益,请您及时与我们联系,我们会在第一时间进行处理!我们尊重版权,也致力于保护版权,站搜网感谢您的分享!