-
超火迷你GPT-4视觉能力暴涨,GitHub两万星,华人团队出品
白交 发自 凹非寺量子位 | 公众号 QbitAIGPT-4V来做目标检测?网友实测:还没有准备好。虽然检测到的类别没问题,但大多数边界框都错放了。没关系,有人会出手!那个抢跑GPT-4看图能力几个月的迷你GPT-4升级啦——MiniGPT-v2。△(左边为GPT-4V生成,右边为MiniGPT-v2生成)而且只是一句简单指令:[grounding] describe this image in detail就实现的结果。不仅如此,还轻松处理各类视觉任务。圈出一个物体,提示词前面加个 [identify] 可让模型直接识别出来物体的名字。当然也可以什么都不加,直接问~MiniGPT-v2由来自MiniGPT-4的原班人马(KAUST沙特阿卜杜拉国王科技大学)以及Meta的五位研究员共同开发。上次MiniGPT-4刚出来就引发巨大关注,一时间服务器被挤爆,如今GItHub项目已超22000+星。此番升级,已经有网友开始用上了~多视觉任务的通用界面大模型作为各文本应用的通用界面,大家已经司空见惯了。受此灵感,研究团队想要建立一个可用于多种视觉任务的统一界面,比如图像描述、视觉问题解答等。「如何在单一模型的条件下,使用简单多模态指令来高效完成各类任务?」成为团队需要解决的难题。简单来说,MiniGPT-v2由三个部分组成:视觉主干、线性层和大型语言模型。该模型以ViT视觉主干为基础,所有训练阶段都保持不变。从ViT中归纳出四个相邻的视觉输出标记,并通过线性层将它们投影到 LLaMA-2语言模型空间中。团队建议在训练模型为不同任务使用独特的标识符,这样一来大模型就能轻松分辨出每个任务指令,还能提高每个任务的学习效率。训练主要分为三个阶段:预训练——多任务训练——多模式指令调整。最终,MiniGPT-v2 在许多视觉问题解答和视觉接地基准测试中,成绩都优于其他视觉语言通用模型。最终这个模型可以完成多种视觉任务,比如目标对象描述、视觉定位、图像说明、视觉问题解答以及从给定的输入文本中直接解析图片对象。感兴趣的朋友,可戳下方Demo链接体验:https://minigpt-v2.github...
智能设备 2023-10-19 09:56:05 -
NS《星球大战遗产包》将出实体版:包含7款《星战》
Aspyr和Lucasfilm Games宣布,将为Switch平台推出包含七款《星球大战》游戏的《星球大战遗产包(Star Wars Heritage Pack)》实体版。实体版将于12月8日发售,售价60美元...
游戏资讯 2023-10-19 03:38:56 -
天地劫手游:最新版全角色强度及培养一图流攻略!(10.5)
大家好,我是正在完善表格的何二维一。今天的攻略到了我们来更新最新版全角色培养及强度汇总一图流攻略的日子了,当然这次的版本距离上一版也过去了4个月之久....
游戏资讯 2023-10-19 03:35:15 -
《漫威蜘蛛侠2》角色新模型释出:玩家吐槽丑爆了
近日,游戏博主@DomTheBombYT发布多张《漫威蜘蛛侠2》角色的模型图,角色依次为玛丽·简·沃森、哈利·奥斯本、诺曼·奥斯本、里奥·莫拉莱斯、甘克·李和海莉·库珀。不过,很多玩家也在评论区吐槽这些角色形象太丑:“这些看起来是人工智能生成的...
游戏资讯 2023-10-19 03:32:10 -
Fami通公布《王泪》受喜爱角色排名:塞尔达稳居第一
作为今年年度游戏有力竞争者之一的《塞尔达传说:王国之泪》上市已有近5个月, Fami通在其最新一期杂志(9月刊)中公布了玩家最喜爱角色的调查结果。据悉此次问卷调查时间是在游戏发售后的3个月里进行的,其中有67.7%通关,77...
游戏资讯 2023-10-19 03:31:24 -
COD20的TTK比前作长得多几乎和《冷战》相当
据Dexerto消息,数据分析证实,《使命召唤:现代战争3》中的TTK比《现代战争2》长得多,和《黑色行动:冷战》相当。TTK在《使命召唤》中的重要性是不言而喻的,这是玩家用来计算杀死敌人需要多长时间的指标,确切的时间因武器和附件不同有所差异...
游戏资讯 2023-10-19 03:28:18 -
是挑战也是机遇!蛋仔派对UGC生态大爆的背后是团队长远的策略选择
《蛋仔派对》的爆火给其他厂商展示了UGC的巨大潜力,包括网易自家游戏也开始探索UGC生态。随后,以腾讯为首的厂商们纷纷投向UGC赛道,试图分一杯羹,但是借鉴无新意,单纯的模仿并不能走向更远的未来...
游戏资讯 2023-10-19 03:28:15 -
原神0命完全体增加,五星角色平民化,四星角色还有未来吗?
其实农工发现了一件事情,原神的深渊难度开始在逐渐膨胀,但是原神游戏中的角色命座却开始出现了一些“通缩”的感觉,为什么怎么说呢?以前的角色给人一种习惯就是这些角色必须满命座的时候才是最强的,低命座的时候情况下根本就达不到上场的情况,但是从最近版本来看似乎越来越多的角色已经进化成为了0命完成体,那么以后还需要氪命座吗?关于氪金命座这件事情,以免有人杠农工先补充一点东西,从数据来看玩家们平均抽一个五星角色的成本在1000左右,当然这个是平均成本其中不包括免费白嫖的原石,如果是白嫖原石的话,大部分玩家一年以来即使你全部只用于抽一个角色,很可能只能培养出一个五星满命角色,当然可能有些玩家会更肝除外。那么为什么农工要说五星角色开始逐渐平民化呢?因为从数据来看,其实原神游戏中大部分的五星角色关键命座都集中在1命和2命,有些人可能会说部分角色不也有满命才无敌吗?毕竟不同的角色本身要求就不同,所以这个评价只能以大部分角色为核心出发进行评价,所以根据统计数据来看其实大部分角色的关键命座都集中在1命和2命...
游戏资讯 2023-10-19 03:27:56 -
育碧回应粉丝请求在《AC幻景》中加入“刺客猫”
据Gamerant消息,《刺客信条:幻景》的一位玩家发现了游戏中有一只猫身上存在一个令人惊讶的细节。Reddit用户suckashelfboi101在游戏中发现了一只虎斑猫,而这只猫鼻子部位的毛发图案和《刺客信条》系列的logo相似...
游戏资讯 2023-10-19 03:27:55 -
写在S赛开赛前:LPL四支战队中,有哪些选手拥有登神的条件?
距离英雄联盟S13全球总决赛开幕,只剩下几天的时间了。拳头总算是赶在开赛前,官宣了本届全球总决赛的主题曲《登神》以及其MV...
游戏资讯 2023-10-19 03:27:37 -
玩家新发现:《赛博朋克2077》中V实际上有脸部动画
《赛博朋克2077》已经发售近三年了,而最近更新的2.0版本以及《往日之影》资料片为这款游戏带来了巨量的新内容全新的生命,也因此经常会有玩家声称发现了“隐藏的新内容。”一位网友近日在Reddit论坛发文称:有一个自己玩了600小时才注意到的新发现。这位玩家发现,如果你在V在摩托车上接到电话时将镜头切换到第三人称,V的脸就会动起来,并且非常地生动,且与语音是进行了适配的。但这远远没有达到人脸采集或者是手工动画的程度,因此这很可能是游戏大量使用的JALI技术的产物。JALI是一家专注于在游戏、动画中的面部动画方面推动前沿技术的公司,与CDPR在游戏领域有着合作,该公司希望通过为动画内容制作者、游戏制作者和虚拟头像开发者提供方法,基于多种语言生成最高质量的语音和面部动画,从而改变面部动画的效果。值得注意的是,在该帖子的回复中也有人声称V的脸部动画实际上是在游戏刚推出时就存在的,后期由于适配问题而被删除。但这种说话尚未得到证实,目前来看这项更新可能是2...
游戏资讯 2023-10-19 03:27:13 -
SNK预告《拳皇15》新DLC角色明天正式公布
10月9日,SNKF发布了《拳皇15》下一个DLC角色的预告剪影图,该角色将在10月10日的官方直播中揭晓。这个预告图引起了粉丝们的猜测,从剪影来看,该角色显然是女性,留着长发,伸出一只手,由于头发的长度,它不太可能是游戏中现有的女角色,一些粉丝认为该角色可能来自其他SNK游戏...
游戏资讯 2023-10-19 03:26:35