首页 > 资讯列表 >  本页面生成Cherry专题报道,Cherry滚动新闻,Cherry业界评论等相关报道!
  • 奇富科技机器人团队语音论文入选INTERSPEECH2023

    奇富科技机器人团队语音论文入选INTERSPEECH2023

    6月1日消息,近日,奇富科技机器人团队论文《Eden-TTS:一种简单高效的非自回归“端到端可微分”神经网络的语音合成架构》(Eden-TTS: A Simple and Efficient Parallel Text-to-speech Architecture with Collaborative Duration-alignment Learning)被全球语音与声学顶级会议INTERSPEECH 2023接收。据悉,INTERSPEECH是由国际语音通讯协会(International Speech Communication Association, ISCA)创办的语音信号处理领域顶级旗舰国际会议,是全球最大的综合性语音信号处理盛会,在国际上享有盛誉并具有广泛的学术影响力。奇富科技的论文研究成果为需要文本转语音的应用场景提供了创新的解决方案,提出了一种端到端可微的非自回归神经网络语音合成模型架构。基于文本音素时长与alignment的密切关系,论文提出了一种简单高效的alignment学习方式:首先采用一种新的energy-modulated注意力机制得到guided alignment,然后利用guided alignment计算音素的时长信息,最后通过音素的时长信息构建monotonic alignment。本方法无需外部的alignment信息,无需引入额外的alignment损失函数。对业务提效而言,这种端到端可微的方法使得各个模块可以方便地替换为各种类型的神经网络模块,从而具有良好的扩展性和稳定性。相比于主流的自回归模型,推理速度提升了10倍以上,能够满足实时语音合成的需求。根据进行的多人MOS评测,该方法的MOS分值达到了4.32分(满分为5分),合成语音的自然流畅程度接近于目前最优的自回归模型,显著优于同类型的非自回归模型。此外,与同类型方法相比,该方法可以节约50%以上的训练时间,显著提升模型训练效率。奇富科技在对话机器人领域一直坚持投入、坚持自研。就在两个月前,奇富科技另一篇音频论文《基于多粒度Transformer的多模态情绪识别》(Multilevel Transformer for Multimodal Emotion Recognition)被第48届IEEE声学、语音与信号处理国际会议(IEEE International Conference on Acoustics, Speech and Signal Processing, ICASSP 2023)接收。“我们很高兴在理解用户、优化表达方面取得了关键性的成果。随着奇富GPT对于公司各业务层的重构,我们已经极大提升了对于用户在文本上的理解能力,从语音到文本,再从文本回到语音,更好的识别是为了更好的表达和输出,我们将持续投入,用前沿技术重塑用户体验。”奇富科技首席算法科学家费浩峻表示。(一橙) ...

    业界动态 2023-06-01 12:40:34
  • 任天堂Switch模拟器YuzuEmulator登陆安卓平台

    任天堂Switch模拟器YuzuEmulator登陆安卓平台

    IT之家 5 月 31 日消息,近日 Yuzu 开发团队宣布,他们的任天堂 Switch 模拟器已经正式支持安卓平台。Yuzu 是目前 PC 上最受欢迎的 Switch 模拟器之一,能够让用户在更强大的硬件上玩自己喜爱的 Switch 游戏,现在其终于登陆了安卓平台...

    智能设备 2023-05-31 10:53:51
  • 不锈钢材质,苹果早期AppleWatch原型曝光

    不锈钢材质,苹果早期AppleWatch原型曝光

    IT之家 5 月 31 日消息,原型收藏家 Kosutami 在分享 MagSafe 磁吸充电器原型的时候,还分享了一款不锈钢材质的 Apple Watch 手表金属外壳。他在推文中表示,这款 Apple Watch 是早期“头脑风暴”开发过程中的产物,其尺寸并非 38mm 或者 42mm,而是介于两者之间...

    手机互联 2023-05-31 07:54:43
  • 骁龙778G+神U加持!vivoS17现身Geekbench网站

    骁龙778G+神U加持!vivoS17现身Geekbench网站

    vivo即将于5月31日发布S17系列手机,其中包括S17、S17 Pro两款机型。最新曝光的型号为V2283A的vivo S17已经跑上了Geekbench,并显示单核分数817,多核分数2607。预计该机搭载骁龙778G+芯片,内存容量为12GB,运行Android 13操作系统。此外,vivo S17系列手机将搭载智慧柔光环、超感知光谱传感器、前置5000万广角柔光、专业长焦人像镜头等多项高端配置。全系标配6.78英寸1...

    手机互联 2023-05-30 00:54:09
  • 摩托罗拉Razr40手机亮相Geekbench,确认搭载高通骁龙7Gen1

    摩托罗拉Razr40手机亮相Geekbench,确认搭载高通骁龙7Gen1

    IT之家 5 月 28 日消息,摩托罗拉新一代折叠屏手机将于 6 月 1 日正式面向全球发布,预计是摩托罗拉 Razr 2023 机型,预计将包括摩托罗拉 Razr 40 和 Razr 40 Ultra。IT之家发现,摩托罗拉 Razr 40 已经出现在了 Geekbench 跑分数据库中,并且还通过了国家 3C 质量认真...

    手机互联 2023-05-28 11:08:25
  • 这个比ChatGPT情商还高的AI,我可以和它聊三天三夜

    这个比ChatGPT情商还高的AI,我可以和它聊三天三夜

    狂拿考试高分让学生瑟瑟发抖,加入联网功能叫传统搜索战战兢兢,升级工作全家桶搞得打工人又悲又喜....

    智能设备 2023-05-27 16:02:52
  • 腾讯任天堂Switch推出延长保修计划限时优惠,售109元

    腾讯任天堂Switch推出延长保修计划限时优惠,售109元

    IT之家 5 月 27 日消息,腾讯发文宣布,自 6 月 1 日-30 日,腾讯任天堂 Switch 延长保修计划推出限时优惠,原价 159 元 / 年的延长保修服务计划只需 109 元。IT之家注:腾讯任天堂 Switch 延长保修计划首次发布于 2022 年 12 月下旬,该计划适用于新购机或目前仍然在保修期内的“任天堂 Switch”、“任天堂 Switch(OLED 版)”,用户可付费参与计划延长 1 年的保修时间...

    手机互联 2023-05-27 15:23:29
  • 已在40多个国家和地区上线,OpenAI在更多市场推出官方版ChatGPT

    已在40多个国家和地区上线,OpenAI在更多市场推出官方版ChatGPT

    IT之家 5 月 26 日消息,OpenAI 宣布已经在 40 多个国家和地区,推出了适用于 iPhone 和 iPad 的官方 ChatGPT 应用程序。官方版 ChatGPT 于上周率先在美国市场推出,OpenAI 承诺未来几周内会继续扩展到更多国家和地区...

    智能设备 2023-05-26 11:18:38
  • Mudra表带开启预订,一个响指手势搞定AppleWatch交互

    Mudra表带开启预订,一个响指手势搞定AppleWatch交互

    IT之家 5 月 26 日消息,Wearable Devices Ltd.(WLDS)今天宣布,适用于 Apple Watch 的 Mudra 表带开启预订,售价 249 美元,限时优惠售价为 199 美元(IT之家备注:当前约 1409 元人民币)。这款 Mudra 表带最大的亮点在于满足生活场景中,不利于双手操作 Apple Watch 的情况下,通过一个响指手势,实现切换曲目、调整音量、接听来电、关闭闹钟、拍照等各种操作。其工作原理是获得专利的 SNC(表面神经传导)传感器,通过将皮肤表面的离子电活动转换为电压(离子交换)来感知手腕发出的生物电势。当移动手指时,Mudra Band 中的电极会捕捉到从你的大脑发出的神经信号,通过手腕传给你的手指。实时准确地通过 SNC 传感器捕捉神经信号,以及深度学习 AI 算法破译信号模式,对正在移动的手指进行分类。 ...

    智能设备 2023-05-26 11:18:31
  • 百度何俊杰:全线拥抱AI,百度移动生态要为十亿用户打造“PersonalAI”

    百度何俊杰:全线拥抱AI,百度移动生态要为十亿用户打造“PersonalAI”

    5月25日消息,2023万象·百度移动生态大会上,百度集团资深副总裁、百度移动生态事业群组(MEG)总经理何俊杰提出,要以AI原生思维重构百度移动生态,全面“刷新”百度搜索、百度APP、百度文库、百度电商等产品与服务的用户体验,推动人机交互、内容生产、营销与商业三重变革。他表示,之前文心一言、ChatGPT等大语言模型是在让AI变“大”,移动生态的这次重构,就是要致力于让AI变“小”,变得更具体,变得人人可用。百度集团副总裁、搜索平台负责人肖阳提出基于“语义检索技术+大语言模型”的双重能力,引领搜索代际变革体验。百度搜索基于大模型创新打造的极致满足、“AI伙伴”、“AI BOT”等功能目前也正在内测中。搜索体验变革主要体现在三方面。在用户需求满足上,百度基于大语言模型和AI技术积累,让更多、更复杂的问题在第一条搜索结果中得到全面满足;在用户表达上,“AI伙伴”可以实现智能对话、多轮交互,极大降低了用户的输入表达门槛和成本;在信息边界的突破上,AI BOT为创作者、商家、机构、品牌等领域的内容、服务提供者们制作虚拟的AI分身,助力生态伙伴提升创作和服务效率。在过去一年,百度APP月活已达到6.57亿。百度信息分发平台总经理李小婉表示,百度APP今年将推出智能首页模式“一人一世界”,用户可以根据自己心意和习惯选择默认首页、大图首页、视频首页、小说首页等,满足更多元的个性化需求。 同时,她还首次展示了内测产品NEW APP,用新概念、新功能,以及一人一模型的未来远景。 目前产品的核心使用场景是对话,提问、聊天、发送指令等,用户还可指定不同“人设”的私人助理,了解用户的喜好和需求,随时对话交流,还可以给予有效建议,处理大小事务。此外,百度输入法也创新打造了AI“高情商沟通助手”,根据不同社交场景给出高情商聊天建议,为用户带来更加智能、高效的社交体验。2022年万象大会上,百度推出“创作者AI助理团”,至今已有45万创作者使用,产出超700万篇内容,累计分发量超过200亿。而在今年万象大会上,百度移动生态事业群组内容生态平台副总经理宋健介绍了全新升级的百度内容生态AIGC创作工具,AI笔记、AI成片、AI作画、AI BOT等功能将面向创作者开启内测体验,更多AI写作、AI数字人功能也即将上线,为创作者提供一站式AI创作方案,推动生产方式根本性变革。截止目前,超过600万创作者在百度创作与分享,创作者多元收入规模同比增长397%,商单收入、电商收入、付费订单量等多元业务均呈现高速增长态势。对创作者,百家号升级为“百度AI创作经营平台”,帮助创作者在AI提效、内容分发、多元变现、影响力建设等多个维度实现跨越性的突破。同时,百度推出创作者成长扶持计划“AI共创计划”,计划扶持10万创作者收入超30亿。“未来,谁拥有最佳的跟客户沟通的方式,谁就会拥有这个客户”,何俊杰指出。营销行业是AIGC的“先行示范区”,有机构预测,2022年,大型组织的营销信息2%由AI生成,到2025年,这一数据将上升到30%。据悉,百度从2014年开始,就在尝试“AIGC文本创意”。到目前,单条创意耗时从30分钟降到4分钟,AI辅助创作的文本创意每天生产14亿条,近七成企业都用到这个功能,近三分之一的创意展现都有AIGC参与。对于商家,百度副总裁、百度电商总经理平晓黎表示同步推出智能电商新品牌“百度优选”,发布了包含AI导购助手、电商AI主播制作平台、商家经营能力模型、商家成长体系、智能经营平台等一系列创新技术和智能商家经营方案。为助力商家和合作伙伴成长,平晓黎还发布百度电商超级生态计划,将助力1000个千万GMV爆款商品,100个年销售额过亿的商家,以及15个GMV过亿的服务商合作伙伴,与百度电商共同实现更大的生意机会。(一橙) ...

    业界动态 2023-05-25 13:06:05
  • 研究揭示ChatGPT美国用户人群画像:年轻、富裕、受过良好教育

    研究揭示ChatGPT美国用户人群画像:年轻、富裕、受过良好教育

    5月25日消息,美国皮尤研究中心(Pew Research Center)最近开展的一项调查发现,58%的美国成年人熟悉ChatGPT,那些年轻富裕、受过良好教育的美国人更了解ChatGPT。调查显示,拥有研究生学位的高收入人士更熟悉ChatGPT...

    业界动态 2023-05-25 08:08:16
  • 索尼发布新机Xperia1V,搭载双层晶体管像素堆叠式CMOS影像传感器

    索尼发布新机Xperia1V,搭载双层晶体管像素堆叠式CMOS影像传感器

    5月24日消息,在“Sony Expo 2023”展前媒体发布会上,索尼(中国)有限公司总裁吉田武司提出了索尼在华发展的愿景:“激发灵感与热情,与追梦者共创感动。”他表示,“中国有很多对未来充满热情和憧憬的追梦者,他们虽来自不同年龄层,不同领域,但他们都拥有勇于创新,不断突破极限的可贵的精神,这同样是索尼创业以来,传承至今的精神...

    业界动态 2023-05-24 18:49:55

站长搜索

http://www.adminso.com

Copyright @ 2007~2024 All Rights Reserved.

Powered By 站长搜索

打开手机扫描上面的二维码打开手机版


使用手机软件扫描微信二维码

关注我们可获取更多热点资讯

站长搜索目录系统技术支持