首页 > 资讯列表 >  本页面生成Cloudant专题报道,Cloudant滚动新闻,Cloudant业界评论等相关报道!
  • 奇富科技机器人团队语音论文入选INTERSPEECH2023

    奇富科技机器人团队语音论文入选INTERSPEECH2023

    6月1日消息,近日,奇富科技机器人团队论文《Eden-TTS:一种简单高效的非自回归“端到端可微分”神经网络的语音合成架构》(Eden-TTS: A Simple and Efficient Parallel Text-to-speech Architecture with Collaborative Duration-alignment Learning)被全球语音与声学顶级会议INTERSPEECH 2023接收。据悉,INTERSPEECH是由国际语音通讯协会(International Speech Communication Association, ISCA)创办的语音信号处理领域顶级旗舰国际会议,是全球最大的综合性语音信号处理盛会,在国际上享有盛誉并具有广泛的学术影响力。奇富科技的论文研究成果为需要文本转语音的应用场景提供了创新的解决方案,提出了一种端到端可微的非自回归神经网络语音合成模型架构。基于文本音素时长与alignment的密切关系,论文提出了一种简单高效的alignment学习方式:首先采用一种新的energy-modulated注意力机制得到guided alignment,然后利用guided alignment计算音素的时长信息,最后通过音素的时长信息构建monotonic alignment。本方法无需外部的alignment信息,无需引入额外的alignment损失函数。对业务提效而言,这种端到端可微的方法使得各个模块可以方便地替换为各种类型的神经网络模块,从而具有良好的扩展性和稳定性。相比于主流的自回归模型,推理速度提升了10倍以上,能够满足实时语音合成的需求。根据进行的多人MOS评测,该方法的MOS分值达到了4.32分(满分为5分),合成语音的自然流畅程度接近于目前最优的自回归模型,显著优于同类型的非自回归模型。此外,与同类型方法相比,该方法可以节约50%以上的训练时间,显著提升模型训练效率。奇富科技在对话机器人领域一直坚持投入、坚持自研。就在两个月前,奇富科技另一篇音频论文《基于多粒度Transformer的多模态情绪识别》(Multilevel Transformer for Multimodal Emotion Recognition)被第48届IEEE声学、语音与信号处理国际会议(IEEE International Conference on Acoustics, Speech and Signal Processing, ICASSP 2023)接收。“我们很高兴在理解用户、优化表达方面取得了关键性的成果。随着奇富GPT对于公司各业务层的重构,我们已经极大提升了对于用户在文本上的理解能力,从语音到文本,再从文本回到语音,更好的识别是为了更好的表达和输出,我们将持续投入,用前沿技术重塑用户体验。”奇富科技首席算法科学家费浩峻表示。(一橙) ...

    业界动态 2023-06-01 12:40:34
  • 苹果iPhone将于7月26日关闭“我的照片流”,推荐使用iCloud

    苹果iPhone将于7月26日关闭“我的照片流”,推荐使用iCloud

    苹果公司宣布将于2023年7月26日关闭“我的照片流”服务,这是一项允许用户在多个苹果设备之间共享照片的服务。这项服务的优点是可以自动将用户拍摄的照片同步到所有的设备上,用户可以随时在不同的设备上查看和分享这些照片...

    手机互联 2023-05-29 11:08:32
  • Mudra表带开启预订,一个响指手势搞定AppleWatch交互

    Mudra表带开启预订,一个响指手势搞定AppleWatch交互

    IT之家 5 月 26 日消息,Wearable Devices Ltd.(WLDS)今天宣布,适用于 Apple Watch 的 Mudra 表带开启预订,售价 249 美元,限时优惠售价为 199 美元(IT之家备注:当前约 1409 元人民币)。这款 Mudra 表带最大的亮点在于满足生活场景中,不利于双手操作 Apple Watch 的情况下,通过一个响指手势,实现切换曲目、调整音量、接听来电、关闭闹钟、拍照等各种操作。其工作原理是获得专利的 SNC(表面神经传导)传感器,通过将皮肤表面的离子电活动转换为电压(离子交换)来感知手腕发出的生物电势。当移动手指时,Mudra Band 中的电极会捕捉到从你的大脑发出的神经信号,通过手腕传给你的手指。实时准确地通过 SNC 传感器捕捉神经信号,以及深度学习 AI 算法破译信号模式,对正在移动的手指进行分类。 ...

    智能设备 2023-05-26 11:18:31
  • 北森发布iTalentX7.0平台:推出AI领导力教练Mr.Sen

    北森发布iTalentX7.0平台:推出AI领导力教练Mr.Sen

    【网易科技5月25日报道】今天,“HR SaaS第一股”北森在香港联交所上市后首次公开亮相,发布全新平台iTalentX7.0,推出“业人一体,为员工而设计”的价值主张,带来AI领导力教练Mr...

    智能设备 2023-05-25 22:06:36
  • 微软宣布将于明日发布Win11“Moment3”更新,需手动检查安装

    微软宣布将于明日发布Win11“Moment3”更新,需手动检查安装

    IT之家 5 月 23 日消息,Windows 11 用户将迎来最新的功能更新,经过数月在 Windows Insider 计划中的测试,Windows 11“Moment 3”更新已经准备好明日公开发布。这次功能更新还没有官方名称(微软似乎不再喜欢像“Fall Creators Update”这样的奇怪名字),但外界称之为“Moment 3”...

    智能设备 2023-05-24 10:54:49
  • 微软叠buff!CopilotAI助理链接Bing并可用于所有Windows应用

    微软叠buff!CopilotAI助理链接Bing并可用于所有Windows应用

    【网易科技5月24日报道】微软昨日在其年度 Build 开发者大会上宣布推出Windows Copilot系统级的AI助理,它集成了Bing搜索功能,并可用于Windows的所有应用。此外,微软同步引入了一系列其他AI增强功能,包括将Bing Chat插件扩展到Windows、引入新的混合AI循环以支持跨平台和跨Azure的AI开发、推出Dev Home以提高开发人员的工作效率,并在Microsoft Store中引入新的AI功能和体验...

    智能设备 2023-05-24 09:40:19
  • 苹果更新的iCloud加密功能,为什么引来FBI不满

    苹果更新的iCloud加密功能,为什么引来FBI不满

    今天我们来聊聊一个热门话题——苹果更新的iCloud加密功能,为什么引来FBI不满的问题。首先,我们来了解一下iCloud加密功能的内容...

    手机互联 2023-05-24 01:27:02
  • 自动写代码?GoogleColab叫板githubcopilot

    自动写代码?GoogleColab叫板githubcopilot

    【网易科技5月18日报道】近日,谷歌宣布了Google Colaboratory(Colab)将加入全新的AI编码功能。据了解,该功能由全新的「文生代码」模型Codey提供支持,支持20多种编码语言,包括Go、谷歌标准SQL、Java、Javascript、Python和Typescript等...

    智能设备 2023-05-18 14:56:18
  • 保时捷成第二家支持苹果AppleMapsEVRouting的车企

    保时捷成第二家支持苹果AppleMapsEVRouting的车企

    IT之家 5 月 18 日消息,保时捷近日宣布和苹果公司展开合作,成为第 2 家正式部署 Apple Maps EV Routing 的电动汽车制造商。苹果在 WWDC 2020 开发者大会上,首次宣布在 Apple Maps 中支持 EV Routing,并透露正在和福特、宝马两家车企展开合作...

    智能设备 2023-05-18 10:53:17
  • NoiseColorFitPulse3手表发布

    NoiseColorFitPulse3手表发布

    IT之家 5 月 18 日消息,Noise ColorFit Pulse 3 智能手表已在印度推出,首发价 1599 印度卢比(IT之家备注:当前约 136 元人民币),带来了更大的显示屏、语音通话支持、额外运动模式、IP68 防护等级等,提供深黑色、复古棕色、银灰色、翡翠绿色和玫瑰粉色。Noise ColorFit Pulse 3 智能手表采用金属框架和 18 毫米硅胶表带,拥有 IP68 防护等级,这意味着可以在深达 1.5 米的淡水中防水达 30 分钟。与 ColorFit Pulse 2 相比,Noise ColorFit Pulse 3 显示屏可视区域扩大 14%,边框缩小 17%,采用 1...

    手机互联 2023-05-18 10:06:01
  • 上QQ就可AI绘画?Midjourney中文版来了内测申请已在QQ频道上线

    上QQ就可AI绘画?Midjourney中文版来了内测申请已在QQ频道上线

    ①Midjourney官方中文版已经开启内测申请,其将搭载在QQ频道上,每周一、周五下午6点统一开放,达到一定人数后会关闭入口,用户扫描相关二维码即可加入;②有知情人士透露,Midjourney入驻QQ频道并开放招募,目前还只是自己的行为。《科创板日报》5月16日讯(记者 张洋洋)5月15日晚,AI绘画工具Midjourney又悄悄搞了一个大动作...

    智能设备 2023-05-16 10:09:21
  • WPSAI展示类微软Copilot能力:接入文字、表格、PPT、PDF四大办公组件

    WPSAI展示类微软Copilot能力:接入文字、表格、PPT、PDF四大办公组件

    5月16日消息, WPS AI正式对外展示了类微软Copilot的能力,继4月18日搭载在轻文档落地后,WPS AI加速进化,接入了文字、海外版表格、PPT演示文稿、PDF四大日常办公组件。WPS AI现已支持输入主题一键生成PPT演示文稿,并且还可以提供进一步细化调节的功能...

    互联网 2023-05-16 09:59:22

站长搜索

http://www.adminso.com

Copyright @ 2007~2025 All Rights Reserved.

Powered By 站长搜索

打开手机扫描上面的二维码打开手机版


使用手机软件扫描微信二维码

关注我们可获取更多热点资讯

站长搜索目录系统技术支持