首页 > 资讯列表 >  本页面生成语音输入法专题报道,语音输入法滚动新闻,语音输入法业界评论等相关报道!

热门搜索

  •  魅族 FlymeOS 重磅更新:AI 灵动键及 AI 辅助输入全面推送

    魅族 FlymeOS 重磅更新:AI 灵动键及 AI 辅助输入全面推送

    魅族 FlymeOS 重磅更新:AI 灵动键及 AI 辅助输入全面推送 灵动键:传统 mBack 升级,集合 AI 功能 魅族 FlymeOS 系统日前宣布,其备受期待的 AI 灵动键现已向魅族 21 系列机型进行全量推送。该功能将经典 mBack 导航键升级为全面集成的 AI 助手,提供语音控制、智能识别等便捷体验...

    手机互联 2024-03-31 13:49:30
  • 喜马拉雅自研珠峰语音生成式大模型,实现5秒内“极速克隆”声音

    喜马拉雅自研珠峰语音生成式大模型,实现5秒内“极速克隆”声音

    10月31日消息,2023云栖大会上,喜马拉雅展示其最新的自研语音技术成果,包括喜马拉雅珠峰语音生成式大模型和第二代智能语音交互系统。据介绍,喜马拉雅珠峰语音生成式大模型,具备快速实现语音音色和风格定制的能力...

    业界动态 2023-10-31 17:38:18
  • 百川智能推大模型Baichuan2-192K:可一次输入35万字超越Claude2

    百川智能推大模型Baichuan2-192K:可一次输入35万字超越Claude2

    雷递网 乐天 10月30日百川智能今日发布Baichuan2-192K大模型。其上下文窗口长度高达192K,称这是目前全球最长的上下文窗口...

    智能设备 2023-10-30 14:20:23
  • 百川智能推出Baichuan2-192K大模型,一次可输入35万个汉字

    百川智能推出Baichuan2-192K大模型,一次可输入35万个汉字

    10月30日消息,百川智能发布Baichuan2-192K大模型。其上下文窗口长度高达192K,能够处理约35万个汉字,是目前支持长上下文窗口最优秀大模型Claude2(支持100K上下文窗口,实测约8万字)的4.4倍,更是GPT-4(支持32K上下文窗口,实测约2.5万字)的14倍...

    业界动态 2023-10-30 11:23:30
  • 小米澎湃OSAI内测开启报名,新增小爱输入助手、AI写真等

    小米澎湃OSAI内测开启报名,新增小爱输入助手、AI写真等

    IT之家 10 月 27 日消息,小米澎湃 OS 正式发布,国内机型最早今年 12 月开始推送正式版,国际版机型将于 2024 年第一季度推送正式版。发布会结束后,小米澎湃 OS 手机端 AI 内测正式开启报名,以系统开发版形式进行,审核通过后将分两期推送开发版...

    智能设备 2023-10-29 23:46:32
  • 《博德之门3》旁白语音有17种风格不同角色不同情绪

    《博德之门3》旁白语音有17种风格不同角色不同情绪

    近日《博德之门3》在EGX 2023中举行访谈节目,负责旁白语音的Amelia Tyler透露,《博德之门3》光是旁白就有17种不同风格台词。她和团队为旁白台词创造了不同的语调和变化,以适应所有可玩角色,更好地讲述他们特定故事的内心独白...

    游戏资讯 2023-10-19 02:35:58
  • 奇富科技机器人团队语音论文入选INTERSPEECH2023

    奇富科技机器人团队语音论文入选INTERSPEECH2023

    6月1日消息,近日,奇富科技机器人团队论文《Eden-TTS:一种简单高效的非自回归“端到端可微分”神经网络的语音合成架构》(Eden-TTS: A Simple and Efficient Parallel Text-to-speech Architecture with Collaborative Duration-alignment Learning)被全球语音与声学顶级会议INTERSPEECH 2023接收。据悉,INTERSPEECH是由国际语音通讯协会(International Speech Communication Association, ISCA)创办的语音信号处理领域顶级旗舰国际会议,是全球最大的综合性语音信号处理盛会,在国际上享有盛誉并具有广泛的学术影响力。奇富科技的论文研究成果为需要文本转语音的应用场景提供了创新的解决方案,提出了一种端到端可微的非自回归神经网络语音合成模型架构。基于文本音素时长与alignment的密切关系,论文提出了一种简单高效的alignment学习方式:首先采用一种新的energy-modulated注意力机制得到guided alignment,然后利用guided alignment计算音素的时长信息,最后通过音素的时长信息构建monotonic alignment。本方法无需外部的alignment信息,无需引入额外的alignment损失函数。对业务提效而言,这种端到端可微的方法使得各个模块可以方便地替换为各种类型的神经网络模块,从而具有良好的扩展性和稳定性。相比于主流的自回归模型,推理速度提升了10倍以上,能够满足实时语音合成的需求。根据进行的多人MOS评测,该方法的MOS分值达到了4.32分(满分为5分),合成语音的自然流畅程度接近于目前最优的自回归模型,显著优于同类型的非自回归模型。此外,与同类型方法相比,该方法可以节约50%以上的训练时间,显著提升模型训练效率。奇富科技在对话机器人领域一直坚持投入、坚持自研。就在两个月前,奇富科技另一篇音频论文《基于多粒度Transformer的多模态情绪识别》(Multilevel Transformer for Multimodal Emotion Recognition)被第48届IEEE声学、语音与信号处理国际会议(IEEE International Conference on Acoustics, Speech and Signal Processing, ICASSP 2023)接收。“我们很高兴在理解用户、优化表达方面取得了关键性的成果。随着奇富GPT对于公司各业务层的重构,我们已经极大提升了对于用户在文本上的理解能力,从语音到文本,再从文本回到语音,更好的识别是为了更好的表达和输出,我们将持续投入,用前沿技术重塑用户体验。”奇富科技首席算法科学家费浩峻表示。(一橙) ...

    业界动态 2023-06-01 12:40:34
  • StableDiffusion动画版上线!支持文本图像视频多种输入方式

    StableDiffusion动画版上线!支持文本图像视频多种输入方式

    西风 发自 凹非寺量子位 | 公众号 QbitAIStable Diffusion也能生成视频了!你没听错,Stability AI推出了一款新的文本生成动画工具包Stable Animation SDK,可支持文本、文本+初始图像、文本+视频多种输入方式。使用者可以调用包括Stable Diffusion 2.0、Stable Diffusion XL在内的所有Stable Diffusion模型,来生成动画。Stable Animation SDK的强大功能一经展现,网友惊呼:哇哦,等不及想试试了!目前,Stability AI疑似还在对这个新工具进行技术优化,不久后将公开驱动动画API的组件源代码。3D漫画摄影风,不限时长自动生成Stable Animation SDK可支持三种创建动画的方式:1、文本转动画:用户输入文prompt并调整各种参数以生成动画(与Stable Diffusion相似)。2、文本输入+初始图像输入:用户提供一个初始图像,该图像作为动画的起点。图像与文本prompt结合,生成最终的输出动画。3、视频输入+文本输入:用户提供一个初始视频作为动画的基础。通过调整各种参数,根据文本prompt生成最终的输出动画。除此之外,Stable Animation SDK对生成视频的时长没有限制,但是长视频将需要更长的时间来生成。Stability AI发布了Stable Animation SDK后,有很多网友分享了自己测试效果,让我们一起看下吧:Stable Animation SDK可以设置许多参数,例如steps、sampler、scale、seed。还有下面这么多的预设风格可选择:3D模型、仿真胶片、动漫、电影、漫画书、数码艺术、增强幻想艺术、等距投影、线稿、低多边形、造型胶土、霓虹朋克、折纸、摄影、像素艺术。目前,动画功能API的使用是以积分计费的,10美元可抵1000积分。使用Stable Diffusion v1...

    智能设备 2023-05-19 11:52:26
  • 终于来了,OpenAI发布iOS版ChatGPT,支持语音提问

    终于来了,OpenAI发布iOS版ChatGPT,支持语音提问

    5月19日消息,当地时间周四,OpenAI发布iOS版ChatGPT应用,美国的iPhone用户可以通过苹果应用商店免费下载安装。OpenAI承诺,未来还计划将ChatGPT应用登陆Android设备...

    业界动态 2023-05-19 07:31:13
  • AI语音诈骗日益猖獗:实现95%模拟人声、77%接通者遭经济损失

    AI语音诈骗日益猖獗:实现95%模拟人声、77%接通者遭经济损失

    IT之家5月6日消息,根据McAfee公布的最新报告,基于人工智能(AI)的语音诈骗日益猖獗,在接到诈骗电话的群体中,77%的人会导致经济损失。报告中提及了两个真实案例,其中一个通过AI模拟受害者亲人,表示因某些事情急需要钱;另一个通过AI模拟女儿,向其母亲勒索赎金,但事实上她的女儿并未被绑架...

    智能设备 2023-05-07 12:43:16
  • 三星GalaxyS22Ultra手机创造历史:完成首个卫星语音通话

    三星GalaxyS22Ultra手机创造历史:完成首个卫星语音通话

    IT之家4月26日消息,三星GalaxyS22Ultra近日创造了新的历史:成为全球首款可拨打卫星语音电话的智能手机。美国电信运营商AT&T和ASTSpaceMobile公司合作,使用未经修改的标准手机,实现美国得克萨斯州和日本之间的卫星通话...

    手机互联 2023-04-27 14:56:05
  • 高德地图上线甄嬛导航语音包

    高德地图上线甄嬛导航语音包

    4月25日消息,近日,高德地图宣布与《甄嬛传》官方达成合作,共同推出了高德地图钮祜禄·甄嬛导航语音包。据高德方面介绍,即日起用户在高德地图APP中搜索“甄嬛”就能下载体验,出门导航的同时,还能够听到基于《甄嬛传》经典台词演绎而来的语音指引,梦回碎玉轩...

    互联网 2023-04-25 10:42:22

站长搜索

http://www.adminso.com

Copyright @ 2007~2024 All Rights Reserved.

Powered By 站长搜索

打开手机扫描上面的二维码打开手机版


使用手机软件扫描微信二维码

关注我们可获取更多热点资讯

站长搜索目录系统技术支持