首页 > 资讯列表 >  本页面生成Burstly专题报道,Burstly滚动新闻,Burstly业界评论等相关报道!
  • 精确率提升7.8%!首个多模态开放世界检测大模型MQ-Det登NeurIPS2023

    精确率提升7.8%!首个多模态开放世界检测大模型MQ-Det登NeurIPS2023

    新智元报道编辑:LRS【新智元导读】MQ-Det在已有基于文本查询的检测大模型基础上,加入了视觉示例查询功能,同时保留了高泛化性能和细粒度多模态查询,在ODinW-35基准上实现SOTA性能。目前的开放世界目标检测模型大多遵循文本查询的模式,即利用类别文本描述在目标图像中查询潜在目标,但这种方式往往会面临「广而不精」的问题。论文链接:https://arxiv.org/abs/2305...

    智能设备 2023-10-19 02:15:01
  • 微软测试Win11新版Outlook,将带来离线支持

    微软测试Win11新版Outlook,将带来离线支持

    IT之家 10 月 18 日消息,微软近日开始邀请部分 Windows Insider 项目成员,测试 Win11 系统 Outlook 应用的离线功能。新版 Outlook 于 2022 年 5 月开启 Beta 测试,基于 Outlook.com 和 Microsoft Edge WebView,并于今年 9 月登陆 Win11 平台。新版 Outlook 基于网络,此前断网状态下就无法正常使用。微软近期开始邀请用户测试新版 Outlook 的离线功能,在没有网络连接的情况下,也可以运行日历等部分功能。根据 Microsoft 365 路线图内容,微软正测试新版 Outlook 的离线功能,允许用户在没有有效互联网连接的情况下访问邮件、日历条目和联系人等功能,会以 Service Worker 的形式出现。IT之家注:Service Worker 介于Web 应用程序和 Internet 之间,从 Outlook 的某些页面获取数据和文件。当您在线时,该服务会为您记住一些数据和文件,当您尝试在没有互联网连接的情况下访问 Web 应用程序时,Service Worker 可以访问缓存数据和文件。微软指出,离线支持还将涵盖其他核心邮件功能,例如,您可以标记电子邮件、将其传输到不同的文件夹并删除它们。 ...

    智能设备 2023-10-19 02:14:52
  • PSAI修图免费平替来了!StabilityAI又放大招,核弹级更新一键扩图

    PSAI修图免费平替来了!StabilityAI又放大招,核弹级更新一键扩图

    新智元报道编辑:编辑部【新智元导读】Stability AI再放大招,Uncrop Clipdrop一键扩图+重构图片,Photoshop Generative Fill免费平替来了。此前,PS的重建图像功能就让人无比振奋,让无数人惊呼今天,Stability AI又放大招了。它联合Clipdrop推出了Uncrop Clipdrop——一个终极图像比例编辑器。从Uncrop这个名字上,我们就能看出它的用途。它是一个AI生成的「外画」工具,通过创建扩展背景,这个工具可以补充任何现有照片或图像,来更改任何图像的比例。敲黑板:通过Clipdrop网站,就可以免费试用这个工具了,无需登录!比例任意调,满意为止Uncrop基于Stability AI的文本到图像模型Stable Diffusion XL构建。通过先进的算法和深度学习技术,Uncrop会自动分析上传图像中的内容,然后生成视觉上合理的产出。这可解了许多修图师和画手的燃眉之急了。拍了一张近乎完美的照片,就是构图不尽人意,怎么办?Uncrop给你一键解决!很多时候,为了让图像显示在横幅或大画布上,我们都需要调整图像大小,把它调到合适的尺寸,而且不能扭曲,不能丢失重要的细节,Uncrop完全解决了这样的烦恼。拍出的横图想变竖图?Uncrop帮你解忧。竖图变横图?也是易如反掌。比例不合适的照片,可以随意拉到你想要的比例。不过呢,Uncrop也有自己的局限性。如果是极端的未剪裁图像,或者大量缺失内容的图像,会产生不太准确的结果。因此,我们需要尽可能确保原始图像的高质量,才能获得最佳效果。另外,Uncrop是依靠算法来分析周围的像素、填补空白,它的精度可能会因为场景的复杂性而不同。效果演示官方的介绍效果视频:网友们分享了自己做的外画效果实例:上手体验看到效果这么好,小编忍不住手痒了,立马上手实测了一波。实操起来感受就是:操作非常方便。就像上边的GIF展示的那样,选好一张图片,拖拽到页面中的指定区域。就可以像下图这样选择自己想要扩展的范围,然后等几秒钟,平台就会生成4张扩展完成的图片供你挑选保存。而且还可以针对某一张生成的图片结合Clipdrop的AI修图进行再加工。去除背景。锐化。再让AI对处理过的图片进行风格重构。经过几次AI的套娃生成加工之后,图片不仅仅被扩展了,还可以根据用户的具体需求进行风格和内容上的彻底「进化」。这时候,就是设计师们发挥自己的创造力的时候了!我们也针对人像,运动场景,静物场景做了一些测试。人像原图扩展效果扩展出来的部分效果确实挺自然。不过因为不能用Prompt指引方向,扩展的效果比较随机。重构效果扩展后重构效果AI生成人物图像的老问题手指解决的还是不理想。而且重构之后小姐姐的身体比例稍微有点问题,颜值也感觉降低了。静物原图扩展效果扩展效果比较自然,几乎看不出什么违和感。扩展重构效果但是重构之后线条扭曲的比较明显,整个画面的风格会有比较大的变化。运动场景原图扩展效果很敏感地捕捉到了图片的动态风格,扩展效果不错。扩展后重构效果重构之后主体已经消失,只留下动态的模糊画面,AI对于内容要点把握的还不好。当我尝试想让一张风景照无限扩展变成一张全景照片时。发现对于已经被扩展过的部分,Uncrop的扩展功能是不能继续套娃的。开源版SD-XL4月,Stability AI将Stable Diffusion XL开始面向公众测试。值得一提的是,开源的SD-XL就已经达到了Midjourney水平,能够图像细节等方面表现更好,几乎完全可控。关于Stable Diffusion XL模型的具体信息,官方并没有透露太多,目前只知道是一个与v2模型架构相似、但规模和参数量更大的模型。SD-v2.1包括9亿参数,SD-XL大约有23亿参数,Emad表示正式版可能会额外发布一个更小的蒸馏版本。SD-XL相比之前版本的改进如下:使用较短的描述性prompt即可生成高质量图像可以生成更贴合prompt的图像图像中的人体结构更合理与 v2...

    智能设备 2023-06-13 10:59:19
  • Gurman:苹果已在开发M3芯片的MacBookAir,2024年发布

    Gurman:苹果已在开发M3芯片的MacBookAir,2024年发布

    IT之家 6 月 11 日消息,彭博社的 Mark Gurman 称,苹果已经在开发配备 M3 芯片的 13 英寸和 15 英寸 MacBook Air 机型,预计将在 2024 年发布。据报道,当前的 13 英寸 MacBook Air 于 2022 年 6 月发布,而 15 英寸机型于下周上市...

    智能设备 2023-06-13 10:57:44
  • Instagram被曝将引入AI聊天机器人拥有30种人物性格

    Instagram被曝将引入AI聊天机器人拥有30种人物性格

    6月7日消息,Meta正在加速采用生成式人工智能技术,并将其整合到包括广告在内的各种平台上。现在,该公司正在Instagram上测试一项新功能...

    互联网 2023-06-07 07:40:29
  • 苹果宣布StandBy功能:让iPhone变身智能屏幕

    苹果宣布StandBy功能:让iPhone变身智能屏幕

    IT之家 6 月 6 日消息,苹果在今天召开的 WWDC 2023 开幕演讲中,宣布了 StandBy 功能,iPhone 启用之后,可以充当智能屏幕(Smart Display),对于使用智能家居的用户来说是一项实用功能。苹果宣布将在今年秋季推出的 iOS 17 更新中,推出 StandBy 功能...

    手机互联 2023-06-06 21:39:26
  • 苹果推出新应用Journal,记录用户的日常活动

    苹果推出新应用Journal,记录用户的日常活动

    财联社6月6日电,苹果推出新款APP “Journal”,这是一款新的应用程序,将于今年晚些时候登陆iPhone平台,可用于记录用户的日常、音乐、位置、照片和活动。此外,苹果推出的新款APP“StandBy”将把一台闲置的iPhone转化为一种播放器...

    业界动态 2023-06-06 01:44:05
  • 新款MacStudio将搭载M2Max和M2Ultra芯片

    新款MacStudio将搭载M2Max和M2Ultra芯片

    财联社6月6日电,苹果宣布,新款Mac Studio将搭载M2 Max和M2 Ultra芯片。苹果还推出搭载M2 Ultra芯片的MAC Pro...

    业界动态 2023-06-06 01:23:53
  • Gurman称苹果有望在WWDC23上宣布不再使用“嘿,Siri”唤醒词

    Gurman称苹果有望在WWDC23上宣布不再使用“嘿,Siri”唤醒词

    IT之家 6 月 4 日消息,据彭博社记者马克・古尔曼(Mark Gurman)透露,苹果公司可能在下周的 WWDC23 大会上宣布一项重大改变,即取消目前唤醒语音助手 Siri 所需的“嘿,Siri”唤醒词,用户只需说“Siri”就可以激活语音助手。古尔曼在推特上重申了这一消息,并表示这项改变可能是下周大会上的重要公告之一...

    手机互联 2023-06-04 09:03:41
  • Gurman:苹果iOS17钱包应用将可显示第三方信用卡余额

    Gurman:苹果iOS17钱包应用将可显示第三方信用卡余额

    IT之家 6 月 3 日消息,根据彭博社的 Mark Gurman 今天的一份报告,从 iOS 17 开始,iPhone 上的钱包应用有望能够显示更多信用卡余额,目前只能在应用中查看 Apple Card 的余额。Gurman 称:“随着公司深入金融服务领域,钱包应用将得到升级,可能包括更深入地与第三方信用卡绑定,以显示余额信息,从而提高 Apple Card 的体验...

    手机互联 2023-06-03 13:35:40
  • 奇富科技机器人团队语音论文入选INTERSPEECH2023

    奇富科技机器人团队语音论文入选INTERSPEECH2023

    6月1日消息,近日,奇富科技机器人团队论文《Eden-TTS:一种简单高效的非自回归“端到端可微分”神经网络的语音合成架构》(Eden-TTS: A Simple and Efficient Parallel Text-to-speech Architecture with Collaborative Duration-alignment Learning)被全球语音与声学顶级会议INTERSPEECH 2023接收。据悉,INTERSPEECH是由国际语音通讯协会(International Speech Communication Association, ISCA)创办的语音信号处理领域顶级旗舰国际会议,是全球最大的综合性语音信号处理盛会,在国际上享有盛誉并具有广泛的学术影响力。奇富科技的论文研究成果为需要文本转语音的应用场景提供了创新的解决方案,提出了一种端到端可微的非自回归神经网络语音合成模型架构。基于文本音素时长与alignment的密切关系,论文提出了一种简单高效的alignment学习方式:首先采用一种新的energy-modulated注意力机制得到guided alignment,然后利用guided alignment计算音素的时长信息,最后通过音素的时长信息构建monotonic alignment。本方法无需外部的alignment信息,无需引入额外的alignment损失函数。对业务提效而言,这种端到端可微的方法使得各个模块可以方便地替换为各种类型的神经网络模块,从而具有良好的扩展性和稳定性。相比于主流的自回归模型,推理速度提升了10倍以上,能够满足实时语音合成的需求。根据进行的多人MOS评测,该方法的MOS分值达到了4.32分(满分为5分),合成语音的自然流畅程度接近于目前最优的自回归模型,显著优于同类型的非自回归模型。此外,与同类型方法相比,该方法可以节约50%以上的训练时间,显著提升模型训练效率。奇富科技在对话机器人领域一直坚持投入、坚持自研。就在两个月前,奇富科技另一篇音频论文《基于多粒度Transformer的多模态情绪识别》(Multilevel Transformer for Multimodal Emotion Recognition)被第48届IEEE声学、语音与信号处理国际会议(IEEE International Conference on Acoustics, Speech and Signal Processing, ICASSP 2023)接收。“我们很高兴在理解用户、优化表达方面取得了关键性的成果。随着奇富GPT对于公司各业务层的重构,我们已经极大提升了对于用户在文本上的理解能力,从语音到文本,再从文本回到语音,更好的识别是为了更好的表达和输出,我们将持续投入,用前沿技术重塑用户体验。”奇富科技首席算法科学家费浩峻表示。(一橙) ...

    业界动态 2023-06-01 12:40:34
  • 摩托罗拉MotoGStylus5G(2023)发布,搭载骁龙6Gen1芯片

    摩托罗拉MotoGStylus5G(2023)发布,搭载骁龙6Gen1芯片

    IT之家 5 月 31 日消息,摩托罗拉推出了其第三代 Moto G Stylus 5G 手机,是首批采用高通骁龙 6 Gen 1 芯片组的设备之一。该设备保留了位于充电端口旁边的标志性手写笔,但不支持三星 Galaxy S23 Ultra 的 S Pen 那样的蓝牙或压感功能。Moto G Stylus 5G (2023) 采用 6.6 英寸 FHD + 分辨率的 IPS LCD 屏幕,刷新率为 120Hz。屏幕上有一个小小的孔洞,用于放置 1600 万像素的前置摄像头。今年的 Moto G Stylus 在后面增加了一颗 5000 万像素的主摄像头(f / 1...

    手机互联 2023-05-31 07:54:45

站长搜索

http://www.adminso.com

Copyright @ 2007~2024 All Rights Reserved.

Powered By 站长搜索

打开手机扫描上面的二维码打开手机版


使用手机软件扫描微信二维码

关注我们可获取更多热点资讯

站长搜索目录系统技术支持