-
奇富科技机器人团队语音论文入选INTERSPEECH2023
6月1日消息,近日,奇富科技机器人团队论文《Eden-TTS:一种简单高效的非自回归“端到端可微分”神经网络的语音合成架构》(Eden-TTS: A Simple and Efficient Parallel Text-to-speech Architecture with Collaborative Duration-alignment Learning)被全球语音与声学顶级会议INTERSPEECH 2023接收。据悉,INTERSPEECH是由国际语音通讯协会(International Speech Communication Association, ISCA)创办的语音信号处理领域顶级旗舰国际会议,是全球最大的综合性语音信号处理盛会,在国际上享有盛誉并具有广泛的学术影响力。奇富科技的论文研究成果为需要文本转语音的应用场景提供了创新的解决方案,提出了一种端到端可微的非自回归神经网络语音合成模型架构。基于文本音素时长与alignment的密切关系,论文提出了一种简单高效的alignment学习方式:首先采用一种新的energy-modulated注意力机制得到guided alignment,然后利用guided alignment计算音素的时长信息,最后通过音素的时长信息构建monotonic alignment。本方法无需外部的alignment信息,无需引入额外的alignment损失函数。对业务提效而言,这种端到端可微的方法使得各个模块可以方便地替换为各种类型的神经网络模块,从而具有良好的扩展性和稳定性。相比于主流的自回归模型,推理速度提升了10倍以上,能够满足实时语音合成的需求。根据进行的多人MOS评测,该方法的MOS分值达到了4.32分(满分为5分),合成语音的自然流畅程度接近于目前最优的自回归模型,显著优于同类型的非自回归模型。此外,与同类型方法相比,该方法可以节约50%以上的训练时间,显著提升模型训练效率。奇富科技在对话机器人领域一直坚持投入、坚持自研。就在两个月前,奇富科技另一篇音频论文《基于多粒度Transformer的多模态情绪识别》(Multilevel Transformer for Multimodal Emotion Recognition)被第48届IEEE声学、语音与信号处理国际会议(IEEE International Conference on Acoustics, Speech and Signal Processing, ICASSP 2023)接收。“我们很高兴在理解用户、优化表达方面取得了关键性的成果。随着奇富GPT对于公司各业务层的重构,我们已经极大提升了对于用户在文本上的理解能力,从语音到文本,再从文本回到语音,更好的识别是为了更好的表达和输出,我们将持续投入,用前沿技术重塑用户体验。”奇富科技首席算法科学家费浩峻表示。(一橙) ...
业界动态 2023-06-01 12:40:34 -
小米MIXFold3曝光:屏下摄像头+潜望长焦再无短板
快科技5月30日消息,博主数码闲聊站透露,小米MIX Fold 3弥补了上一代的遗憾,内屏配置了屏下摄像头,同时支持了50W无线闪充,还搭载了5倍潜望式长焦镜头。对比上代,小米MIX Fold 3最大的变化之一就是屏下摄像头的回归。小米MIX Fold 2一般来说,要实现屏幕下摄像头的成像,关键就是要让传感器感知接受光,但显示面板一般并不透光。因此需要调整显示像素的排列布局,让一部分光照进去,传导至屏幕下的摄像头传感器实现成像。另外,小米MIX Fold 3搭载高通第二代骁龙8移动平台。CPU部分包含1个最高主频3.2GHz的Cortex-X3超大核 + 4个最高主频2...
手机互联 2023-05-30 11:43:49 -
特斯拉开始交付搭载HW4硬件的ModelY,摄像头更加强大
IT之家 5 月 28 日消息,特斯拉已经开始交付其加州弗里蒙特工厂生产的部分 Model Y 车型,这些车型安装有 Hardware 4 (HW4),这是其最新版本的自动驾驶计算机。特斯拉一直在开发 HW4,今年早些时候该计算机的第一批图片就被曝光...
智能设备 2023-05-29 10:15:41 -
一招教你看懂iPhone序列号的含义,快速分辨机器好坏
用过苹果手机的朋友们都知道序列号代表着该机器的特有身份信息,但是你真的懂序列号吗?今天就来给大家讲讲吧~一般可以通过外包装查看到相关序列号,或者打开手机-设置—通用—关于本机,查看到本机的序列号。以下面序列号为例,拆分成为五个部分,依次代表代工厂、产线、年份周数、识别码、型号内存颜色...
手机互联 2023-05-25 08:22:34 -
OpenAI官方AI聊天机器人ChatGPT上架AppStore
IT之家 5 月 19 日消息,OpenAI 于今天正式宣布适用于 iPhone 和 iPad 的 ChatGPT 官方应用程序。OpenAI 的聊天机器人 ChatGPT 此前仅限于网页端,不少开发者为此在 App Store 上推出了第三方移动端产品,而欺诈者也瞄准这个热点,推出了不少欺诈应用...
智能设备 2023-05-19 11:51:58 -
马斯克:人形机器人Optimus将使用FSD系统数量超过特斯拉汽车
5月17日消息,美国当地时间周二,特斯拉2023年年度股东大会在该公司位于美国得州奥斯汀的工厂召开。该公司首席执行官埃隆·马斯克(Elon Musk)现场回答了股东诸多提问,包括Cybertruck量产交付、FSD开发进展、新车型研发情况、人形机器人Optimus以及推特等话题...
业界动态 2023-05-17 09:23:47 -
小米14Pro曝光:新外观漂亮摄像头再升级
小米14 Pro将在11月发布,而且大几率首发骁龙8 Gen3,跑分将突破160万,而目前外观和参数也相继曝光,新机配备了5000万像素潜望式长焦镜头,也就是13 Ultra的性能首次下放给14 Pro手机。外观方面也有很大的提升,将会采用全新的设计,更好看了...
手机互联 2023-05-17 08:53:54 -
新谷歌AI搜索与聊天机器人Bard有何不同?
5月11日消息,美国当地时间周三,谷歌发布了一款更新的核心搜索产品,该产品在搜索结果中嵌入了更多人工智能。谷歌希望此举能帮助消除人们的疑虑,挽回其正在输给微软必应搜索的形象...
业界动态 2023-05-11 09:58:23 -
亚马逊被曝秘密研发新家用机器人具备类似ChatGPT功能
5月10日消息,据泄露的内部文件显示,零售巨头亚马逊正秘密研发其家用机器人Astro的升级版,以使它能更好地理解其所观察到的东西,并更智能化地对事物做出反应。文件显示,该项目的内部代号为“Burnham”,该项目为Astro增加了一层“智能和对话语音界面”...
业界动态 2023-05-10 07:34:19 -
想走出这个实验室,一台手机要被机器人“敲打”20万次
杨净发自凹非寺量子位|公众号QbitAI北京一个150平米的厂房里,一群装有摄像头和AI算法、可自主行动的机器人正在7*24小时不间断地运作。他们只有一个目的:“攻击”人类的智能手机...
智能设备 2023-05-08 13:15:50 -
微软宣布开放必应聊天机器人,登录微软账户即可访问
5月5日消息,当地时间周四,微软向所有用户开放了必应聊天机器人。现在只需要使用微软账户登录必应搜索引擎或Edge浏览器,就可以访问公开预览版的必应聊天机器人...
业界动态 2023-05-05 08:21:15 -
不用进等待名单了!微软开放BingChat聊天机器人功能
【网易科技5月4日报道】据外媒报道,微软今天宣布将BingGPT-4聊天机器人开放给所有用户,并取消等待名单。用户可以使用微软账户登录新的必应或Edge,即可使用由GPT-4驱动的开放预览版...
智能设备 2023-05-04 16:39:06