首页 > 资讯列表 >  本页面生成语音输入法专题报道,语音输入法滚动新闻,语音输入法业界评论等相关报道!
  • 奇富科技机器人团队语音论文入选INTERSPEECH2023

    奇富科技机器人团队语音论文入选INTERSPEECH2023

    6月1日消息,近日,奇富科技机器人团队论文《Eden-TTS:一种简单高效的非自回归“端到端可微分”神经网络的语音合成架构》(Eden-TTS: A Simple and Efficient Parallel Text-to-speech Architecture with Collaborative Duration-alignment Learning)被全球语音与声学顶级会议INTERSPEECH 2023接收。据悉,INTERSPEECH是由国际语音通讯协会(International Speech Communication Association, ISCA)创办的语音信号处理领域顶级旗舰国际会议,是全球最大的综合性语音信号处理盛会,在国际上享有盛誉并具有广泛的学术影响力。奇富科技的论文研究成果为需要文本转语音的应用场景提供了创新的解决方案,提出了一种端到端可微的非自回归神经网络语音合成模型架构。基于文本音素时长与alignment的密切关系,论文提出了一种简单高效的alignment学习方式:首先采用一种新的energy-modulated注意力机制得到guided alignment,然后利用guided alignment计算音素的时长信息,最后通过音素的时长信息构建monotonic alignment。本方法无需外部的alignment信息,无需引入额外的alignment损失函数。对业务提效而言,这种端到端可微的方法使得各个模块可以方便地替换为各种类型的神经网络模块,从而具有良好的扩展性和稳定性。相比于主流的自回归模型,推理速度提升了10倍以上,能够满足实时语音合成的需求。根据进行的多人MOS评测,该方法的MOS分值达到了4.32分(满分为5分),合成语音的自然流畅程度接近于目前最优的自回归模型,显著优于同类型的非自回归模型。此外,与同类型方法相比,该方法可以节约50%以上的训练时间,显著提升模型训练效率。奇富科技在对话机器人领域一直坚持投入、坚持自研。就在两个月前,奇富科技另一篇音频论文《基于多粒度Transformer的多模态情绪识别》(Multilevel Transformer for Multimodal Emotion Recognition)被第48届IEEE声学、语音与信号处理国际会议(IEEE International Conference on Acoustics, Speech and Signal Processing, ICASSP 2023)接收。“我们很高兴在理解用户、优化表达方面取得了关键性的成果。随着奇富GPT对于公司各业务层的重构,我们已经极大提升了对于用户在文本上的理解能力,从语音到文本,再从文本回到语音,更好的识别是为了更好的表达和输出,我们将持续投入,用前沿技术重塑用户体验。”奇富科技首席算法科学家费浩峻表示。(一橙) ...

    业界动态 2023-06-01 12:40:34
  • StableDiffusion动画版上线!支持文本图像视频多种输入方式

    StableDiffusion动画版上线!支持文本图像视频多种输入方式

    西风 发自 凹非寺量子位 | 公众号 QbitAIStable Diffusion也能生成视频了!你没听错,Stability AI推出了一款新的文本生成动画工具包Stable Animation SDK,可支持文本、文本+初始图像、文本+视频多种输入方式。使用者可以调用包括Stable Diffusion 2.0、Stable Diffusion XL在内的所有Stable Diffusion模型,来生成动画。Stable Animation SDK的强大功能一经展现,网友惊呼:哇哦,等不及想试试了!目前,Stability AI疑似还在对这个新工具进行技术优化,不久后将公开驱动动画API的组件源代码。3D漫画摄影风,不限时长自动生成Stable Animation SDK可支持三种创建动画的方式:1、文本转动画:用户输入文prompt并调整各种参数以生成动画(与Stable Diffusion相似)。2、文本输入+初始图像输入:用户提供一个初始图像,该图像作为动画的起点。图像与文本prompt结合,生成最终的输出动画。3、视频输入+文本输入:用户提供一个初始视频作为动画的基础。通过调整各种参数,根据文本prompt生成最终的输出动画。除此之外,Stable Animation SDK对生成视频的时长没有限制,但是长视频将需要更长的时间来生成。Stability AI发布了Stable Animation SDK后,有很多网友分享了自己测试效果,让我们一起看下吧:Stable Animation SDK可以设置许多参数,例如steps、sampler、scale、seed。还有下面这么多的预设风格可选择:3D模型、仿真胶片、动漫、电影、漫画书、数码艺术、增强幻想艺术、等距投影、线稿、低多边形、造型胶土、霓虹朋克、折纸、摄影、像素艺术。目前,动画功能API的使用是以积分计费的,10美元可抵1000积分。使用Stable Diffusion v1...

    智能设备 2023-05-19 11:52:26
  • 终于来了,OpenAI发布iOS版ChatGPT,支持语音提问

    终于来了,OpenAI发布iOS版ChatGPT,支持语音提问

    5月19日消息,当地时间周四,OpenAI发布iOS版ChatGPT应用,美国的iPhone用户可以通过苹果应用商店免费下载安装。OpenAI承诺,未来还计划将ChatGPT应用登陆Android设备...

    业界动态 2023-05-19 07:31:13
  • AI语音诈骗日益猖獗:实现95%模拟人声、77%接通者遭经济损失

    AI语音诈骗日益猖獗:实现95%模拟人声、77%接通者遭经济损失

    IT之家5月6日消息,根据McAfee公布的最新报告,基于人工智能(AI)的语音诈骗日益猖獗,在接到诈骗电话的群体中,77%的人会导致经济损失。报告中提及了两个真实案例,其中一个通过AI模拟受害者亲人,表示因某些事情急需要钱;另一个通过AI模拟女儿,向其母亲勒索赎金,但事实上她的女儿并未被绑架...

    智能设备 2023-05-07 12:43:16
  • 三星GalaxyS22Ultra手机创造历史:完成首个卫星语音通话

    三星GalaxyS22Ultra手机创造历史:完成首个卫星语音通话

    IT之家4月26日消息,三星GalaxyS22Ultra近日创造了新的历史:成为全球首款可拨打卫星语音电话的智能手机。美国电信运营商AT&T和ASTSpaceMobile公司合作,使用未经修改的标准手机,实现美国得克萨斯州和日本之间的卫星通话...

    手机互联 2023-04-27 14:56:05
  • 高德地图上线甄嬛导航语音包

    高德地图上线甄嬛导航语音包

    4月25日消息,近日,高德地图宣布与《甄嬛传》官方达成合作,共同推出了高德地图钮祜禄·甄嬛导航语音包。据高德方面介绍,即日起用户在高德地图APP中搜索“甄嬛”就能下载体验,出门导航的同时,还能够听到基于《甄嬛传》经典台词演绎而来的语音指引,梦回碎玉轩...

    互联网 2023-04-25 10:42:22
  • 三星OneUI5.1输入法遭遇严重BUG,致使手机电池耗电过快

    三星OneUI5.1输入法遭遇严重BUG,致使手机电池耗电过快

    最近,三星官方承认了SamsungKeyboard应用存在BUG的问题,这个问题会导致运行OneUI5.1的GalaxyS22系列和GalaxyS21系列机型出现耗电过快的现象。这个问题引起了用户的广泛关注和不满...

    手机互联 2023-04-20 21:03:44
  • 烦人!用户抱怨苹果设备出现大Bug:不断要求输入AppleID密码

    烦人!用户抱怨苹果设备出现大Bug:不断要求输入AppleID密码

    近日,苹果在线服务频频出现故障,用户反映出现了一个新问题——无法登录AppleID。多位用户表示,即使输入正确的密码,系统也会提示登录失败,甚至导致AppleID被注销...

    手机互联 2023-04-18 08:18:56
  • Android将支持超宽带语音,蓝牙通话更清晰

    Android将支持超宽带语音,蓝牙通话更清晰

    IT之家4月17日消息,Android的蓝牙通话即将迎来质的飞跃,超宽带语音技术将让你的声音更清晰、更真实。目前,即使你使用最好的无线耳机,你的声音在传输到对方耳朵时也只能达到一般水平,如果你在开车时打电话,效果就更差了...

    手机互联 2023-04-18 08:18:23
  • 装输入法就能和必应聊天!微软必应大举“进占”手机屏幕

    装输入法就能和必应聊天!微软必应大举“进占”手机屏幕

    微软率先将必应聊天机器人加入输入法,大举“进占”手机屏幕,先谷歌一步再下一城?4月5日,微软推出将ChatGPT背后的AI技术整合到SwiftKey输入法中的安卓试用版,试用SwiftKeyBeta版本的用户仅需“轻点一个按钮”,便可借助输入法,在任何应用程序或对话中访问并使用必应聊天机器人。用户可以利用输入法搜索信息,要求AI重新组织文本,并与其聊天生成特定内容...

    智能设备 2023-04-08 10:45:56
  • 微软发布Beta版SwiftKey输入法,支持和必应聊天

    微软发布Beta版SwiftKey输入法,支持和必应聊天

    IT之家4月7日消息,微软近日发布了Beta版SwiftKey输入法应用,最值得关注的改进就是可以和必应(NewBing)聊天了。用户在Beta版SwiftKey版本的左上角看到一个必应图标,点击之后会跳出提示,IT之家翻译如下:“欢迎在SwiftKey中使用Bing...

    智能设备 2023-04-07 10:21:11
  • 《辐射4》的语音AIMOD可以自己生成对白了

    《辐射4》的语音AIMOD可以自己生成对白了

    AI如今所展现的作用已经不可小觑,但如何更好利用AI来满足各领域的不同需求,暂时还需要依靠来自人类的想象力。比如,现在AI已经基本实现了与人类的流畅对话,但多数人能够想到的用法是利用它来生成文案、与人陪聊,以及处理其他的文字工作...

    游戏资讯 2023-03-30 00:45:09

站长搜索

http://www.adminso.com

Copyright @ 2007~2024 All Rights Reserved.

Powered By 站长搜索

打开手机扫描上面的二维码打开手机版


使用手机软件扫描微信二维码

关注我们可获取更多热点资讯

站长搜索目录系统技术支持