-
奇富科技机器人团队语音论文入选INTERSPEECH2023
6月1日消息,近日,奇富科技机器人团队论文《Eden-TTS:一种简单高效的非自回归“端到端可微分”神经网络的语音合成架构》(Eden-TTS: A Simple and Efficient Parallel Text-to-speech Architecture with Collaborative Duration-alignment Learning)被全球语音与声学顶级会议INTERSPEECH 2023接收。据悉,INTERSPEECH是由国际语音通讯协会(International Speech Communication Association, ISCA)创办的语音信号处理领域顶级旗舰国际会议,是全球最大的综合性语音信号处理盛会,在国际上享有盛誉并具有广泛的学术影响力。奇富科技的论文研究成果为需要文本转语音的应用场景提供了创新的解决方案,提出了一种端到端可微的非自回归神经网络语音合成模型架构。基于文本音素时长与alignment的密切关系,论文提出了一种简单高效的alignment学习方式:首先采用一种新的energy-modulated注意力机制得到guided alignment,然后利用guided alignment计算音素的时长信息,最后通过音素的时长信息构建monotonic alignment。本方法无需外部的alignment信息,无需引入额外的alignment损失函数。对业务提效而言,这种端到端可微的方法使得各个模块可以方便地替换为各种类型的神经网络模块,从而具有良好的扩展性和稳定性。相比于主流的自回归模型,推理速度提升了10倍以上,能够满足实时语音合成的需求。根据进行的多人MOS评测,该方法的MOS分值达到了4.32分(满分为5分),合成语音的自然流畅程度接近于目前最优的自回归模型,显著优于同类型的非自回归模型。此外,与同类型方法相比,该方法可以节约50%以上的训练时间,显著提升模型训练效率。奇富科技在对话机器人领域一直坚持投入、坚持自研。就在两个月前,奇富科技另一篇音频论文《基于多粒度Transformer的多模态情绪识别》(Multilevel Transformer for Multimodal Emotion Recognition)被第48届IEEE声学、语音与信号处理国际会议(IEEE International Conference on Acoustics, Speech and Signal Processing, ICASSP 2023)接收。“我们很高兴在理解用户、优化表达方面取得了关键性的成果。随着奇富GPT对于公司各业务层的重构,我们已经极大提升了对于用户在文本上的理解能力,从语音到文本,再从文本回到语音,更好的识别是为了更好的表达和输出,我们将持续投入,用前沿技术重塑用户体验。”奇富科技首席算法科学家费浩峻表示。(一橙) ...
业界动态 2023-06-01 12:40:34 -
苹果首款头显RealityPro高清渲染图曝光:配“数字表冠”
IT之家 6 月 1 日消息,国外科技媒体 9to5Mac 基于现有公开的技术专利、相关报告,并参考部分传闻信息,制作了苹果首款 AR / VR 头显 Reality Pro 的高清渲染图。该媒体认为苹果 Reality Pro 头显采用类似于传统滑雪护目镜的设计,并融入了一些 Apple Watch、AirPods Max 的设计风格。在头显顶部配有两个物理按钮,左侧为一个可按击的按钮,用于开启 / 关闭某项软件功能;右侧为一个名为“Reality Dial”数字表冠,可以切换 AR 和 VR 场景视图。头显还配有一系列传感器和摄像头,但巧妙地伪装在框架中。头显的带子左侧是一体式的,无法取下,只有通过右侧取下。这款头显不内置电池,消费者需要额外佩戴连接到头显的电池组。在右侧还有一个可兼作充电器的扣子。我们想象这看起来很像感应式 Apple Watch 充电器。IT之家此前报道,罗斯・杨在推文中表示,苹果首款头显将配备 2 块 1.4 英寸的屏幕,材质为 Micro OLED(OLED on Silicon),亮度会超过 5000 尼特,像素密度为每英寸 4000 个像素点,每块屏幕的分辨率也达到了 4K。苹果的这款头显凭借着高于 5000 尼特的亮度,可以支持主流头显市场并不具备的 HDR 内容。 ...
智能设备 2023-06-01 10:45:39 -
OpenAI将用新方法来训练模型以对抗人工智能“幻觉”
①检测并减轻模型的逻辑错误或幻觉,是构建通用人工智能(AGI)的关键一步; ②这种方法被称为“过程监督”,而不是“结果监督”,它可能会提高人工智能的性能与准确性。 财联社6月1日讯(编辑 牛占林)美东时间周三,OpenAI发布的最新研究论文显示,该公司正在用一种新的方法来训练人工智能(AI)模型,以对抗人工智能“幻觉”...
智能设备 2023-06-01 10:45:29 -
任天堂Switch模拟器YuzuEmulator登陆安卓平台
IT之家 5 月 31 日消息,近日 Yuzu 开发团队宣布,他们的任天堂 Switch 模拟器已经正式支持安卓平台。Yuzu 是目前 PC 上最受欢迎的 Switch 模拟器之一,能够让用户在更强大的硬件上玩自己喜爱的 Switch 游戏,现在其终于登陆了安卓平台...
智能设备 2023-05-31 10:53:51 -
苹果邀请开发者“编码新世界”,暗示即将推出RealityPro头显
IT之家 5 月 31 日消息,距离苹果公司的全球开发者大会(WWDC)只有不到一周的时间,苹果公司在其开发者网站上发布了一篇博客文章,暗示了即将推出的 Reality Pro 头戴式设备,邀请开发者关注并学习如何“编码新世界(Code new worlds)”。“编码新世界”这一标语是苹果公司今天才开始使用的,明显是对新软件平台的暗示...
智能设备 2023-05-31 10:53:49 -
刷新率高达165Hz!摩托罗拉正式发布MotoEdge+
近日,摩托罗拉在美国市场推出了一款新的机型——Moto Edge + 2023款,这款手机的亮点在于其搭载了一块儿6.67英寸的AMOLED屏幕,分辨率为1080x2400,支持自适应165Hz刷新率、HDR10 + 和杜比视界技术。165Hz刷新率的屏幕在目前手机市场上并不多见,大多数旗舰机型还是采用120Hz刷新率的屏幕。设计方面,该机正面采用居中打孔设计,并且使用了曲面屏幕,边框控制很优秀,正面观感不错;背面采用左上方形三摄模块,机身正中间是摩托罗拉的LOGO。性能方面,Moto Edge+ 2023款搭载了来自高通的骁龙8 Gen 2处理器,并配备了8GB的运行内存,提供256GB和512GB的存储空间。高通骁龙8 Gen 2这颗芯片大家一定不陌生,它采用4纳米工艺制造,拥有1+4+3八核架构的CPU,最高主频达到3...
手机互联 2023-05-30 11:44:09 -
可装RTX4090显卡,酷冷至尊展示紧凑型机箱NCore100Max
IT之家 5 月 30 日消息,酷冷至尊(Cooler Master)在 Computex 2023 大展上,展示了一款适配英伟达旗舰 RTX 4090 显卡的紧凑型机箱-NCore 100 Max。NCore 100 Max 机箱高度为 481mm,宽度为 212mm、厚度在 155 至 172mm 之间。该机箱内部有足够的空间容纳长度达 357 毫米的 GeForce RTX 4090,允许安装厚度为三槽位、四槽位的显卡。NCore 100 Max 机箱内部使用 Mini-ITX 主板,没有透明背板和 RGB 灯效,不过有带灰尘过滤器的穿孔铝墙。NCore 100 Max 机箱预装 850WV SFX Gold ATX 3.0 电源和一个用于 2...
智能设备 2023-05-30 10:51:39 -
透明屏幕iPhone有希望了?曝三星将加速透明OLED量产
据韩国媒体报道,三星显示正计划于2023年下半年发布透明OLED屏幕试制品。该公司正在开发采用量子点技术的透明OLED,并计划最快于今年下半年推出试制品...
手机互联 2023-05-30 00:54:03 -
RedmiNote12TPro买到赚到!卢伟冰:恐怕再难有了
快科技5月29日消息,小米集团卢伟冰发文表示,Redmi Note 12T Pro这样顶级的LCD屏手机恐怕再难有了,希望Note 12T Pro成为LCD真爱粉们的心头好。那Redmi为什么还要坚持做LCD手机?卢伟冰表示,因为我们的用户需要...
手机互联 2023-05-29 11:08:18 -
RedmiNote12TPro官宣:搭载联发科天玑8200-Ultra,LCD屏
IT之家 5 月 29 日消息,今日 Redmi 官方公布了 Redmi Note 12T Pro 手机,该机搭载联发科天玑 8200-Ultra 移动处理平台,上代同款旗舰 LCD 屏幕,将于明天 10 点预售。Redmi Note 12T Pro 此前已入网,入网信息显示,该机支持5G 异网漫游、67W 快充、12GB 内存,其他具体信息有待官方进一步揭晓...
手机互联 2023-05-29 11:08:14 -
小米RedmiNote12TPro手机跑分曝光:天玑8200-Ultra处理器
IT之家 5 月 29 日消息,根据小米 Redmi 红米手机官方消息,新款 LCD 屏 Redmi 手机将于今日(5 月 29 日)9 点公布。根据此前爆料和入网信息,这款新机将是Redmi Note 12T Pro。Redmi Note 12T Pro 手机入网型号为23054RA19C,IT之家发现该机已出现在 Geekbench 跑分中,单核 1224,多核 3921,根据 1 + 3 + 4 核心最高 3.1GHz 规格来看,与小米 Civi 3 手机搭载的联发科天玑 8200-Ultra 处理器信息相同。入网信息还显示,Redmi Note 12T Pro 手机支持 5G 异网漫游、67W 快充、12GB 内存,其他具体信息有待官方进一步揭晓,大家可以期待一下新机在 618 期间能否进一步拉低市场价格。 ...
智能设备 2023-05-29 10:15:51 -
佳能开发出新型QD-OLED材料:用铅替代稀土金属,成本降低99%
IT之家 5 月 29 日消息,据日经新闻报道,佳能已开发出一种不使用稀土金属的有机发光二极管(OLED)面板材料,计划在几年内将该技术商业化。▲ 图源佳能这种新材料是量子点 QD-OLED,即直径为 1 纳米的微小半导体粒子...
智能设备 2023-05-29 10:15:47