-
超火迷你GPT-4视觉能力暴涨,GitHub两万星,华人团队出品
白交 发自 凹非寺量子位 | 公众号 QbitAIGPT-4V来做目标检测?网友实测:还没有准备好。虽然检测到的类别没问题,但大多数边界框都错放了。没关系,有人会出手!那个抢跑GPT-4看图能力几个月的迷你GPT-4升级啦——MiniGPT-v2。△(左边为GPT-4V生成,右边为MiniGPT-v2生成)而且只是一句简单指令:[grounding] describe this image in detail就实现的结果。不仅如此,还轻松处理各类视觉任务。圈出一个物体,提示词前面加个 [identify] 可让模型直接识别出来物体的名字。当然也可以什么都不加,直接问~MiniGPT-v2由来自MiniGPT-4的原班人马(KAUST沙特阿卜杜拉国王科技大学)以及Meta的五位研究员共同开发。上次MiniGPT-4刚出来就引发巨大关注,一时间服务器被挤爆,如今GItHub项目已超22000+星。此番升级,已经有网友开始用上了~多视觉任务的通用界面大模型作为各文本应用的通用界面,大家已经司空见惯了。受此灵感,研究团队想要建立一个可用于多种视觉任务的统一界面,比如图像描述、视觉问题解答等。「如何在单一模型的条件下,使用简单多模态指令来高效完成各类任务?」成为团队需要解决的难题。简单来说,MiniGPT-v2由三个部分组成:视觉主干、线性层和大型语言模型。该模型以ViT视觉主干为基础,所有训练阶段都保持不变。从ViT中归纳出四个相邻的视觉输出标记,并通过线性层将它们投影到 LLaMA-2语言模型空间中。团队建议在训练模型为不同任务使用独特的标识符,这样一来大模型就能轻松分辨出每个任务指令,还能提高每个任务的学习效率。训练主要分为三个阶段:预训练——多任务训练——多模式指令调整。最终,MiniGPT-v2 在许多视觉问题解答和视觉接地基准测试中,成绩都优于其他视觉语言通用模型。最终这个模型可以完成多种视觉任务,比如目标对象描述、视觉定位、图像说明、视觉问题解答以及从给定的输入文本中直接解析图片对象。感兴趣的朋友,可戳下方Demo链接体验:https://minigpt-v2.github...
智能设备 2023-10-19 09:56:05 -
是挑战也是机遇!蛋仔派对UGC生态大爆的背后是团队长远的策略选择
《蛋仔派对》的爆火给其他厂商展示了UGC的巨大潜力,包括网易自家游戏也开始探索UGC生态。随后,以腾讯为首的厂商们纷纷投向UGC赛道,试图分一杯羹,但是借鉴无新意,单纯的模仿并不能走向更远的未来...
游戏资讯 2023-10-19 03:28:15 -
外挂也搞先尝后买?COD20开测前夕,制挂团队给玩家送“科技”
20年前,动视的《使命召唤》系列上线了首款作品,随后就开启了在动作射击领域的制霸之路。头十年该系列的单人剧情模式震撼人心,后十年动视对PVP玩法的重视,也让游戏的整体重心产生了变化,并取得了进一步的成功。 而在今年的11月10日,动视将带来《使命召唤:现代战争3》的内容,主机和PC端在本月还会相继进行测试。不过在游戏正式发布前,一个严峻的问题就已经出现在官方和玩家们面前了,那就是横行无忌的外挂。 《使命召唤:现代战争3》的测试分为两个部分,分别是已经开始的主机版测试和即将到来的PC版测试。日前,知名的反外挂组织Anti-Cheat Police Department,在推特发布了动态,让玩家们谨防即将到来的“开挂潮”。 他们之所以会发出这样的警告,原因还是制挂团队太过嚣张。为了能够将自家的外挂更好地推销出去,他们用多种语言喊话,表示会在《使命召唤:现代战争3》测试期间,免费为玩家发放外挂。如果大伙觉得好用,那就等游戏正式上线时再入手吧。 尽管当下PC版还未开启测试,但动视面临的局面已经很危急了。因为在主机版的测试中,外挂问题就已非常严重。《使命召唤》的新闻推特账号charlieINTEL,在几天前发布了视频,指出有PS4玩家在测试服使用外挂的情况。 从原理来说,主机端玩家开挂的过程比在PC端开挂更加繁琐。玩家需要在越狱/破解版的主机设备上,才能完成作弊步骤。目前网上关于《使命召唤:现代战争3》的PS4破解版主机的价值讨论,预估价达到了1.5万元。 当然,破解版设备的价值其实并不重要,重要的是制挂团队有能力让《使命召唤:现代战争3》的主机测试版出现大量外挂。当更容易使用外挂程序的PC版开测后,实际的情况只会更加难以预料。 而动视和制挂团队,以《使命召唤》系列为战场进行交锋的情况,已经持续了相当长一段时间。除了必要的外挂监测,很多时候动视还会发挥自己的“奇思妙想”,上线一些特别的反挂措施。 在今年7月份,动视更新过了《使命召唤:现代战争2》的反挂报告,并介绍了名为【幻象】的反挂功能。 游戏中的反挂系统Ricochet,会在标记外挂玩家后,生成一些只有开挂才能看到的人物形象。这些AI生成的人物会模仿真人玩家的行为,并引诱他们射击。以此为凭证,系统和其他玩家能够更好的分辨开挂者,以进行举报等后续处理。 针对此次《使命召唤:现代战争3》的外挂问题,动视还未做出正面回应。由于是测试版本,尚不知晓反作弊系统届时会不会实装。当下距离游戏的正式发布已不足一月,希望官方在此期间能够找到解决问题的办法吧。 那么大家平时在游戏中,有遇到过开挂者吗? ...
游戏资讯 2023-10-19 03:21:17 -
DuoWOA团队为微软SurfaceDuo发布新驱动,初步支持SurfaceDial
IT之家 10 月 16 日消息,DuoWOA团队近日发布了一套新的 Windows 驱动程序,适用于第一代和第二代 Surface Duo。最值得注意的变化是对 Surface Dial 的初步支持,这是微软早已遗忘的显示器配件。更新日志还包括了一些问题的修复和一般性的稳定性改进。以下是 Surface Duo Windows 驱动程序版本 2310.45 的更新内容:初步支持 Surface Dial(仍在开发中)解决了手机在关机 / 重启时可能需要更长时间或者在关机 / 重启过程中出现错误检查屏幕的问题解决了阻止操作系统升级在 Windows Insider Canary Channel 中正常工作的问题一般性的系统稳定性改进,以提升用户体验。以下是 Surface Duo 2(仍然是概念验证,所以没有什么特别的)的更新内容:将 Surface Duo(第一代)的大部分通用变化合并到 Surface Duo 2解决了触摸功能在最近版本中失效的问题将一些系统驱动程序更新到最新的 10 月版本一般性的系统稳定性改进,以提升用户体验。你可以从 GitHub 下载新的驱动程序。微软于 2016 年 10 月推出了 Surface Dial,与三款兼容设备一同发布:初代 Surface Studio,Surface Book 和第四代 Surface Pro。用户可以通过 Surface Dial 来实现调节音量、浏览网页等,并通过一系列适配的软件,调用控件、绘图工具或其他选项来完成艺术创作。根据不同的使用习惯,用户可以把它放在桌面上用,也可以放在屏幕上用。IT之家注意到,微软似乎已经放弃了这个配件,因为最新的 Surface 设备不再支持 Surface Dial,而且也没有后续产品。然而在发布七年后,Surface Dial 仍然在亚马逊上以 75...
手机互联 2023-10-19 02:47:03 -
国产独立游戏又扑街了?5人团队死磕5年游戏,做出一堆BUG!
大家好,这里是正惊游戏,我是爱吃瓜的正惊小弟。你敢信,一对从零起步学做游戏的小夫妻,用5人团队花费5年时间,就能把世嘉旗下的招牌即时战略游戏《全面战争:三国》给一比一灵魂复刻了?不管你信不信,反正有人是真信了...
游戏资讯 2023-10-19 02:34:59 -
腾讯又一新游上线,《劲舞团》团队打造,曲库里只有50首华语歌?
大家好,这里是正惊游戏,我是正惊小弟。自从《劲乐团》《劲舞团》诞生以来音游就没有太多的变化,都是手眼配合“按”“点”,到了手游时代后才多了一个“滑”的操作。近日一款腾讯运营的新音游上线了,不过大家的注意力好像都集中在薅羊毛上面了。近日由上海纵深乐琪研发,腾讯代理的《劲乐幻想》正式上架了,这是一款音乐社交手游,由《劲乐团》《劲舞团》国服音乐组原班人马打造,玩家可以组建自己的乐队,各自扮演乐队里的吉他手,贝斯手,键盘手,鼓手等角色,合作完成一场场精彩的演出。目前游戏收录了300首歌曲,其中包含流行、嘻哈、电音、国风、摇滚、古典等不同风格的歌曲。虽然游戏抱上了腾讯这个社交帝国的大腿,不过好像没薅到多少腿毛,身为音乐类型的游戏却没有邀请到人气歌手或者流量小鲜肉做代言,开服当天的联动的对象是和音乐毫无关系的百度地图……在如今最火的短视频平台上游戏相关视频的播放量只有272万多,在游戏平台上的关注人数只有9万多,官方社交平台账号的粉丝只有一千出头,贴吧更惨只有320人关注。要知道已运营18年的上古时代的《劲舞团》,在短视频平台上可是有着45.6亿的热度呀!有时候后浪推前浪,前浪撞死沙滩上,但也可能是后浪撞死在前浪的钛合金尾椎上……就目前玩家的评价看来,游戏没达到玩家的预期。有玩家表示游戏这样多种乐器的玩法还是很有创意的,不过游戏手感和画面都一般般。最让这位玩家最受不了的是那些没完没了的首充,活动礼包等信息的弹窗,一些窗口你还关不了。虽然《劲乐幻想》有300首歌曲,但有玩家表示里面竟然就只有50首华语歌曲。还有懂音乐的玩家吐槽,这游戏里的乐器的操作玩法和乐器本身毫无关系,如鼓手竟然出现了长音,感叹当年的《劲乐团》是提高玩家审美,这游戏是拉低玩家的审美。当然还是有给好评的玩家的,有玩家表示游戏玩起来还可以,缝合了很多音游的玩法。小弟嘠绿共:除了评价玩法外,还有很大一部分网友在讨论薅羊毛的操作,因为玩游戏可以领到Q币,不少玩家在网上晒自己抢到了多少Q币。当年九城为了对抗腾讯第一个搞出了玩游戏送Q币的操作,不知道九城看到现在腾讯这番操作有什么感想?一个正惊问题:你希望出现怎么样的音游? 声明:个人原创,仅供参考 ...
游戏资讯 2023-10-19 02:19:41 -
平安健康:李斗出任董事会主席兼CEO,方蔚豪辞任
10月18日消息,平安健康发布公告称,由于个人工作安排原因,方蔚豪辞任平安健康董事会主席、执行董事、首席执行官职务,将前往平安集团其他岗位任职,开启新的重要工作。经审慎考虑和研究,公司董事会一致同意,聘任李斗出任平安健康董事会主席、执行董事、首席执行官,自本公告之日起生效。方蔚豪于2020年加入平安健康,任董事会主席、执行董事、首席执行官。平安健康董事会表示,过去3年方蔚豪为公司战略转型升级,稳步发展做出了重要贡献,为公司管理式医疗战略2.0构建与深化落实打下坚实基础,董事会对方蔚豪先生的贡献表示衷心感谢。在平安健康任职期间,方蔚豪聚焦"医疗健康生态圈"建设,积极打造本公司"管理式医疗+家庭医生会员制+O2O医疗健康服务"独特商业模式,构建"到线、到店、到家"优质服务质量的履约体系,带领公司成为国内领先的医疗健康服务平台和入口。截至2023年6月30日,平安健康App注册用户超4亿,覆盖22个科室的约5万名内外部医生专家,围绕8大专科建立23个专病中心,为用户提供咨询或诊疗服务,满足用户全场景、多层次的医疗健康服务需求。与此同时,平安健康累计服务企业客户数1198家,为员工打造国内领先的"易企健康"健康管理解决方案,助力企业建设幸福职场。平安健康董事会一致同意,聘任李斗为平安健康董事会主席、执行董事、首席执行官。公告显示,李斗曾任中国平安人寿保险股份有限公司董事长特别助理兼居家养老事业部总经理,自2023年8月起加入平安健康并担任本公司非执行董事。此前,李斗曾任玛氏箭牌糖果(中国)有限公司销售副总裁及中国区需求总经理。平安健康董事会表示,李斗先后在医药、快消、保险、养老等多项领域担任高级管理职务,在洞悉消费者需求,并据此部署后端产品研发、供应渠道建设及数字化运营等方面具有深刻洞察和丰富经验。李斗除具备丰富的专业履历和经营经验外,也有很强的战略领悟力和执行力,视野开阔,锐意创新。在平安人寿任职期间,其赋能平安人寿的"健康+"业务模式卓有成效。李斗带领平安人寿居家养老团队从无到有,完成全新产品线建立和服务体系搭建,并与保险融合形成全新销售体系。过去一年,通过打造三位一体全天候陪伴养老管家、10大场景服务一站式供应及智能监督体系,不断探索构建服务壁垒,追求长效经营,取得重大经营成果。平安健康表示,目前公司战略定位笃定,发展路径清晰,经营管理不断升级,财务稳健。相信在新的管理层领导下,公司会进一步实现业务健康、高质量发展。(一橙) ...
互联网 2023-10-19 02:18:28 -
AIAgent,启动!复旦NLP团队发86页长文综述,智能体社会近在眼前
新智元报道编辑:Lumina【新智元导读】近日,一篇探讨基于LLM的Agent综述论文在X上火了!仔细一看,论文署名中甚至一度还有米哈游。9月19日,Jim Fan转发了一篇来自复旦NLP团队对基于LLM的Agent的综述。Agent是能够感知自身所处环境、自我决策并采取行动的人工智能实体。该论文介绍了基于LLM Agent的一般概念框架,包括大脑、感知和行动;以及LLM Agent的应用场景、由LLM Agent组成的社会等。还讨论了LLM Agent领域中的一系列关键议题和开放性问题。有趣的是,在arXiv上提交的前两版论文中,注明了与米哈游合著,论文中则以原神中的海灯节为例,介绍了一个理想中的由AI Agent组成的社会。论文地址:https://arxiv.org/pdf/2309...
智能设备 2023-10-19 02:14:55 -
天猫健康618开门红战报:30余品牌首小时成交额超去年全天
6月1日消息,5月31日晚8点,天猫618开门红正式开售。天猫健康开场5分钟,WonderLab成交额就超过了去年618首日全天...
互联网 2023-06-01 18:09:27 -
奇富科技机器人团队语音论文入选INTERSPEECH2023
6月1日消息,近日,奇富科技机器人团队论文《Eden-TTS:一种简单高效的非自回归“端到端可微分”神经网络的语音合成架构》(Eden-TTS: A Simple and Efficient Parallel Text-to-speech Architecture with Collaborative Duration-alignment Learning)被全球语音与声学顶级会议INTERSPEECH 2023接收。据悉,INTERSPEECH是由国际语音通讯协会(International Speech Communication Association, ISCA)创办的语音信号处理领域顶级旗舰国际会议,是全球最大的综合性语音信号处理盛会,在国际上享有盛誉并具有广泛的学术影响力。奇富科技的论文研究成果为需要文本转语音的应用场景提供了创新的解决方案,提出了一种端到端可微的非自回归神经网络语音合成模型架构。基于文本音素时长与alignment的密切关系,论文提出了一种简单高效的alignment学习方式:首先采用一种新的energy-modulated注意力机制得到guided alignment,然后利用guided alignment计算音素的时长信息,最后通过音素的时长信息构建monotonic alignment。本方法无需外部的alignment信息,无需引入额外的alignment损失函数。对业务提效而言,这种端到端可微的方法使得各个模块可以方便地替换为各种类型的神经网络模块,从而具有良好的扩展性和稳定性。相比于主流的自回归模型,推理速度提升了10倍以上,能够满足实时语音合成的需求。根据进行的多人MOS评测,该方法的MOS分值达到了4.32分(满分为5分),合成语音的自然流畅程度接近于目前最优的自回归模型,显著优于同类型的非自回归模型。此外,与同类型方法相比,该方法可以节约50%以上的训练时间,显著提升模型训练效率。奇富科技在对话机器人领域一直坚持投入、坚持自研。就在两个月前,奇富科技另一篇音频论文《基于多粒度Transformer的多模态情绪识别》(Multilevel Transformer for Multimodal Emotion Recognition)被第48届IEEE声学、语音与信号处理国际会议(IEEE International Conference on Acoustics, Speech and Signal Processing, ICASSP 2023)接收。“我们很高兴在理解用户、优化表达方面取得了关键性的成果。随着奇富GPT对于公司各业务层的重构,我们已经极大提升了对于用户在文本上的理解能力,从语音到文本,再从文本回到语音,更好的识别是为了更好的表达和输出,我们将持续投入,用前沿技术重塑用户体验。”奇富科技首席算法科学家费浩峻表示。(一橙) ...
业界动态 2023-06-01 12:40:34 -
OpenAI捐款10万美元,推动治理人工智能、引导其健康发展
IT之家 5 月 26 日消息,根据路透社报道,OpenAI 将从现有基金中抽出 100 万美元,分别等额的 10 份,用于推动 ChatGPT 的民主进程,制定有效措施,管理人工智能,遏制偏见等其它负面因素,引导其健康发展。OpenAI 在今天的博文中表示,其中划分的 10 万美元(IT之家备注:当前约 70.8 万元人民币),将捐给那些提出相关框架的个人和组织,希望有治理人工智能的方案出炉,让其健康发展。OpenAI 的首席执行官 Sam Altman 告诉路透社:“人工智能系统应该造福全人类,并具有更大的包容性。我们正在启动这个资助计划,朝着这个方向迈出第一步”。OpenAI 表示 10 万美元的投入可能会迸发出治理人工智能的诸多看法,即便是这些建议没有任何“约束力”。 ...
智能设备 2023-05-26 11:18:41 -
阿里健康2023财年营收267.6亿元,利润5.3亿元
5月24日消息,阿里健康于23日晚发布了2023财年全年业绩公告。截至2023年3月31日止12个月,阿里健康营收267.6亿元人民币,同比增长30...
互联网 2023-05-24 09:19:42