-
奇富科技机器人团队语音论文入选INTERSPEECH2023
6月1日消息,近日,奇富科技机器人团队论文《Eden-TTS:一种简单高效的非自回归“端到端可微分”神经网络的语音合成架构》(Eden-TTS: A Simple and Efficient Parallel Text-to-speech Architecture with Collaborative Duration-alignment Learning)被全球语音与声学顶级会议INTERSPEECH 2023接收。据悉,INTERSPEECH是由国际语音通讯协会(International Speech Communication Association, ISCA)创办的语音信号处理领域顶级旗舰国际会议,是全球最大的综合性语音信号处理盛会,在国际上享有盛誉并具有广泛的学术影响力。奇富科技的论文研究成果为需要文本转语音的应用场景提供了创新的解决方案,提出了一种端到端可微的非自回归神经网络语音合成模型架构。基于文本音素时长与alignment的密切关系,论文提出了一种简单高效的alignment学习方式:首先采用一种新的energy-modulated注意力机制得到guided alignment,然后利用guided alignment计算音素的时长信息,最后通过音素的时长信息构建monotonic alignment。本方法无需外部的alignment信息,无需引入额外的alignment损失函数。对业务提效而言,这种端到端可微的方法使得各个模块可以方便地替换为各种类型的神经网络模块,从而具有良好的扩展性和稳定性。相比于主流的自回归模型,推理速度提升了10倍以上,能够满足实时语音合成的需求。根据进行的多人MOS评测,该方法的MOS分值达到了4.32分(满分为5分),合成语音的自然流畅程度接近于目前最优的自回归模型,显著优于同类型的非自回归模型。此外,与同类型方法相比,该方法可以节约50%以上的训练时间,显著提升模型训练效率。奇富科技在对话机器人领域一直坚持投入、坚持自研。就在两个月前,奇富科技另一篇音频论文《基于多粒度Transformer的多模态情绪识别》(Multilevel Transformer for Multimodal Emotion Recognition)被第48届IEEE声学、语音与信号处理国际会议(IEEE International Conference on Acoustics, Speech and Signal Processing, ICASSP 2023)接收。“我们很高兴在理解用户、优化表达方面取得了关键性的成果。随着奇富GPT对于公司各业务层的重构,我们已经极大提升了对于用户在文本上的理解能力,从语音到文本,再从文本回到语音,更好的识别是为了更好的表达和输出,我们将持续投入,用前沿技术重塑用户体验。”奇富科技首席算法科学家费浩峻表示。(一橙) ...
业界动态 2023-06-01 12:40:34 -
马斯克时隔半年重登“世界首富宝座”资产近2000亿美元
①特斯拉今年迄今的涨幅已达88.65%; ②马斯克目前的净资产约为1923亿美元,而法国富豪Arnault的净资产约为1866亿美元; 财联社6月1日讯(编辑 黄君芝)时隔半年,特斯拉首席执行官埃隆·马斯克(Elon Musk)重新获得了世界首富的头衔。截至周三美股收盘,特斯拉股价涨1...
智能设备 2023-06-01 10:45:27 -
任天堂Switch模拟器YuzuEmulator登陆安卓平台
IT之家 5 月 31 日消息,近日 Yuzu 开发团队宣布,他们的任天堂 Switch 模拟器已经正式支持安卓平台。Yuzu 是目前 PC 上最受欢迎的 Switch 模拟器之一,能够让用户在更强大的硬件上玩自己喜爱的 Switch 游戏,现在其终于登陆了安卓平台...
智能设备 2023-05-31 10:53:51 -
苹果邀请开发者“编码新世界”,暗示即将推出RealityPro头显
IT之家 5 月 31 日消息,距离苹果公司的全球开发者大会(WWDC)只有不到一周的时间,苹果公司在其开发者网站上发布了一篇博客文章,暗示了即将推出的 Reality Pro 头戴式设备,邀请开发者关注并学习如何“编码新世界(Code new worlds)”。“编码新世界”这一标语是苹果公司今天才开始使用的,明显是对新软件平台的暗示...
智能设备 2023-05-31 10:53:49 -
不锈钢材质,苹果早期AppleWatch原型曝光
IT之家 5 月 31 日消息,原型收藏家 Kosutami 在分享 MagSafe 磁吸充电器原型的时候,还分享了一款不锈钢材质的 Apple Watch 手表金属外壳。他在推文中表示,这款 Apple Watch 是早期“头脑风暴”开发过程中的产物,其尺寸并非 38mm 或者 42mm,而是介于两者之间...
手机互联 2023-05-31 07:54:43 -
骁龙778G+神U加持!vivoS17现身Geekbench网站
vivo即将于5月31日发布S17系列手机,其中包括S17、S17 Pro两款机型。最新曝光的型号为V2283A的vivo S17已经跑上了Geekbench,并显示单核分数817,多核分数2607。预计该机搭载骁龙778G+芯片,内存容量为12GB,运行Android 13操作系统。此外,vivo S17系列手机将搭载智慧柔光环、超感知光谱传感器、前置5000万广角柔光、专业长焦人像镜头等多项高端配置。全系标配6.78英寸1...
手机互联 2023-05-30 00:54:09 -
中国科学院院士李静海:2022年中国数字经济规模达50.2万亿元,总量稳居世界第二
5月29日消息,近日中关村平行论坛“互联网3.0:未来互联网产业发展论坛”现场,中国科学院院士、北京市科学技术协会主席李静海发表主题演讲。他强调,2022年中国数字经济规模达50...
互联网 2023-05-29 16:34:32 -
苹果iPhone将于7月26日关闭“我的照片流”,推荐使用iCloud
苹果公司宣布将于2023年7月26日关闭“我的照片流”服务,这是一项允许用户在多个苹果设备之间共享照片的服务。这项服务的优点是可以自动将用户拍摄的照片同步到所有的设备上,用户可以随时在不同的设备上查看和分享这些照片...
手机互联 2023-05-29 11:08:32 -
摩托罗拉Razr40手机亮相Geekbench,确认搭载高通骁龙7Gen1
IT之家 5 月 28 日消息,摩托罗拉新一代折叠屏手机将于 6 月 1 日正式面向全球发布,预计是摩托罗拉 Razr 2023 机型,预计将包括摩托罗拉 Razr 40 和 Razr 40 Ultra。IT之家发现,摩托罗拉 Razr 40 已经出现在了 Geekbench 跑分数据库中,并且还通过了国家 3C 质量认真...
手机互联 2023-05-28 11:08:25 -
英伟达AI智能体接入GPT-4,完胜AutoGPT!自主写代码独霸我的世界,无需人类插手
新智元报道编辑:Aeneas 好困【新智元导读】给游戏行业来点GPT-4式震撼?这个叫Voyager的智能体不仅可以根据游戏的反馈自主训练,而且还能自行写代码推动游戏任务。继斯坦福的25人小镇后,AI智能体又出爆款新作了。最近,英伟达首席科学家Jim Fan等人把GPT-4整进了「我的世界」(Minecraft)——提出了一个全新的AI智能体Voyager。Voyager的厉害之处在于,它不仅性能完胜AutoGPT,而且还可以在游戏中进行全场景的终身学习!比起之前的SOTA,Voyager获得的物品多出了3.3倍,旅行距离变长了2...
智能设备 2023-05-27 16:03:18 -
这个比ChatGPT情商还高的AI,我可以和它聊三天三夜
狂拿考试高分让学生瑟瑟发抖,加入联网功能叫传统搜索战战兢兢,升级工作全家桶搞得打工人又悲又喜....
智能设备 2023-05-27 16:02:52 -
GPT-4玩《我的世界》15倍速攀科技,不看画面全靠代码操作
克雷西 发自 凹非寺量子位 | 公众号 QbitAI把GPT-4放进一个虚拟世界会怎么样?比如《我的世界》。英伟达开发最新方法Voyager,在游戏中点亮科技树的速度是此前方法的15.3倍,同时获得的独特物品是此前的3...
智能设备 2023-05-27 16:02:52