-
奇富科技机器人团队语音论文入选INTERSPEECH2023
6月1日消息,近日,奇富科技机器人团队论文《Eden-TTS:一种简单高效的非自回归“端到端可微分”神经网络的语音合成架构》(Eden-TTS: A Simple and Efficient Parallel Text-to-speech Architecture with Collaborative Duration-alignment Learning)被全球语音与声学顶级会议INTERSPEECH 2023接收。据悉,INTERSPEECH是由国际语音通讯协会(International Speech Communication Association, ISCA)创办的语音信号处理领域顶级旗舰国际会议,是全球最大的综合性语音信号处理盛会,在国际上享有盛誉并具有广泛的学术影响力。奇富科技的论文研究成果为需要文本转语音的应用场景提供了创新的解决方案,提出了一种端到端可微的非自回归神经网络语音合成模型架构。基于文本音素时长与alignment的密切关系,论文提出了一种简单高效的alignment学习方式:首先采用一种新的energy-modulated注意力机制得到guided alignment,然后利用guided alignment计算音素的时长信息,最后通过音素的时长信息构建monotonic alignment。本方法无需外部的alignment信息,无需引入额外的alignment损失函数。对业务提效而言,这种端到端可微的方法使得各个模块可以方便地替换为各种类型的神经网络模块,从而具有良好的扩展性和稳定性。相比于主流的自回归模型,推理速度提升了10倍以上,能够满足实时语音合成的需求。根据进行的多人MOS评测,该方法的MOS分值达到了4.32分(满分为5分),合成语音的自然流畅程度接近于目前最优的自回归模型,显著优于同类型的非自回归模型。此外,与同类型方法相比,该方法可以节约50%以上的训练时间,显著提升模型训练效率。奇富科技在对话机器人领域一直坚持投入、坚持自研。就在两个月前,奇富科技另一篇音频论文《基于多粒度Transformer的多模态情绪识别》(Multilevel Transformer for Multimodal Emotion Recognition)被第48届IEEE声学、语音与信号处理国际会议(IEEE International Conference on Acoustics, Speech and Signal Processing, ICASSP 2023)接收。“我们很高兴在理解用户、优化表达方面取得了关键性的成果。随着奇富GPT对于公司各业务层的重构,我们已经极大提升了对于用户在文本上的理解能力,从语音到文本,再从文本回到语音,更好的识别是为了更好的表达和输出,我们将持续投入,用前沿技术重塑用户体验。”奇富科技首席算法科学家费浩峻表示。(一橙) ...
业界动态 2023-06-01 12:40:34 -
报告称三星GalaxyS23Ultra手机物料成本469美元,占比售价39%
IT之家 6 月 1 日消息,根据市场调查机构 Counterpoint Research 分享的最新物料清单(BoM)报告,认为三星生产一台 8GB 内存、256GB 存储、支持 Sub-6GHz 的 Galaxy S23 Ultra 手机,成本约为 469 美元(IT之家备注:当前约 3335 元人民币)。IT之家查询三星美国官网,相同配置的无锁版 Galaxy S23 Ultra 手机售价为 1199.99 美元(当前约 8532 元人民币),占比为 39%,相同配置在国内售价为 9499 元。占据 Galaxy S23 Ultra 手机物料成本大头的是高通处理器,占比为 35%,其次是屏幕(18%)和摄像头(14%)。由于 Galaxy S23 Ultra 手机使用了高通的指纹传感器 IC,关键电源管理 IC,音频编解码器,RF 功率放大器,Wi-Fi + 蓝牙,GPS 和 Sub-6GHz 收发器,让高通在元件供应商中的占比刷新历史,达到 34%。在相机方面,由三星(SEMCO)和索尼共同提供。三星提供 200MP 广角相机 (S5KHP2) 和 12MP 自拍相机 (S5K3LU),而索尼提供 12MP 超广角 (IMX564)、10MP 长焦和潜望镜长焦 (IMX754) 传感器。 ...
智能设备 2023-06-01 10:45:41 -
Win10极限精简版Tiny10x6423H1更新,支持64位系统
IT之家 6 月 1 日消息,今日 NTDEV(@NTDEV_)发布了轻量级 Windows 10 系统 Tiny10 的新版本,名为 tiny10 23H1 x64,支持 64 位系统,占用空间小,更新速度快,适合低端硬件运行。据悉,tiny10 23H1 x64 是在今年年初发布的 tiny10 2303 x86 的基础上开发的,后者只支持 32 位系统。tiny10 23H1 x64 基于 Windows 10 LTSC 21H2(版本号 19044.3031),保留了组件存储和远程桌面等功能,可以进行在线更新和语言安装。该版本还支持从旧版 tiny10 升级,无需重新安装。NTDEV 表示,tiny10 23H1 x64 是为那些想要体验核心 Windows 功能,同时具有必要功能又注重安全性的用户而设计的。他还指出,“23H1”只是一个命名惯例,表示该版本是在 2023 年上半年发布的,并不代表微软官方的 Windows 10 版本。目前,微软官方最新的 Windows 10 版本是 22H2,预计将于 2025 年 10 月停止支持。有兴趣的IT之家小伙伴可以从 Internet Archive 。不过需要注意的是,这类非官方的 Windows 修改版本仍然需要使用正版 Windows 密钥(7、8、8...
智能设备 2023-06-01 10:45:31 -
阿里影业发布2022/2023业绩:营收35.2亿,经调整EBITA盈利2.95亿
5月31日消息,阿里影业(01060)发布2022/23财年业绩,阿里影业实现营收人民币35.20亿元,经调整EBITA录得盈利人民币2...
互联网 2023-05-31 21:40:52 -
360发布视觉大模型周鸿祎:多模态大模型与物联网结合是新风口
【网易科技5月31日报道】“原来的AIoT只是垂直AI,不是通用AI,经过大模型赋能的AIoT才是‘真AI’”,5月31日,三六零(601360.SH,下称“360”)智慧生活集团举办视觉大模型及AI硬件新品发布会,360集团创始人周鸿祎参会并发表演讲——大模型开启AIoT新时代。会上,周鸿祎宣布发布“360智脑-视觉大模型”。他表示,大语言模型是构建视觉大模型的基础,多模态能力增强的核心是借助了大语言模型的认知、推理、决策能力。同时,视觉大模型也是“360智脑”的重要能力组成,让“360智脑“能够看懂图片,未来还能看懂视频、听懂声音。周鸿祎表示,过去的人工智能是弱人工智能,在此基础上打造的智能硬件不具有真正的智能。大模型出现后,计算机第一次真正的理解这个世界,并能够赋予AIoT真正的智能。他表示,大模型的出现标志着通用人工智能到来,AI完成了从感知层到认知层的进化。“大模型将带来一场新工业革命”,周鸿祎认为,所有软件、APP、网站,所有行业都值得用大模型进行重塑,而智能硬件是硬件化的APP。从大模型的发展趋势来看,多模态是大模型发展的必经之路,GPT-4最重要的变化是拥有了多模态的处理能力。因此,周鸿祎预言,多模态大模型与物联网的结合将会成为下一个风口。他表示,多模态技术与智能硬件结合是大势所趋,未来大模型将成为物联网的大脑,物联网设备则相当于大模型的感知端,让大模型进化出“眼睛和耳朵”,大模型还有可能操控物联网设备,进化出嘴巴、手和脚,从而拥有行动力,最终实现从感知到认知,从理解到执行。据悉,360在视觉感知能力基础上,融合千亿参数“360智脑”大模型,基于十亿级互联网图文数据进行清洗训练,并针对安防场景百万级行业数据进行微调,最终打造出了专业的视觉及多模态大模型——360智脑-视觉大模型。“目前,大模型的能力主要体现在软件层,当大模型接入智能硬件,会让大模型的能力从数字世界走向物理世界。”周鸿祎说。(袁宁) ...
智能设备 2023-05-31 21:02:01 -
比亚迪2023款元Pro发布售价9.58万元-11.38万
【网易科技5月31日报道】今日,比亚迪2023款元Pro正式上市,官方指导价9.58万元—11...
智能设备 2023-05-31 17:52:58 -
脉脉发布《2023年春招人才迁徙报告》:仅15%人员主动跳槽,约45%人员考虑降级就业
5月30日消息,脉脉高聘发布《2023年春招人才迁徙报告》(以下简称《报告》)。脉脉副总裁定胜斌表示,人才供需比连续三年上升,就业市场进入饱和周期。人才竞争加剧、学历通胀就业降级、主动离职减少成为人才饱和周期的三大特征。2023春招期间职场人求稳心态明显,仅有不到15%的职场人主动跳槽,约45%的求职者考虑过降级就业。《报告》显示,近3年春招中,人才供需比连续上升,人才竞争加剧。2021年春招,人才供需比为0.45,2022年上升为1...
互联网 2023-05-31 17:24:31 -
摩托罗拉MotoGStylus5G(2023)发布,搭载骁龙6Gen1芯片
IT之家 5 月 31 日消息,摩托罗拉推出了其第三代 Moto G Stylus 5G 手机,是首批采用高通骁龙 6 Gen 1 芯片组的设备之一。该设备保留了位于充电端口旁边的标志性手写笔,但不支持三星 Galaxy S23 Ultra 的 S Pen 那样的蓝牙或压感功能。Moto G Stylus 5G (2023) 采用 6.6 英寸 FHD + 分辨率的 IPS LCD 屏幕,刷新率为 120Hz。屏幕上有一个小小的孔洞,用于放置 1600 万像素的前置摄像头。今年的 Moto G Stylus 在后面增加了一颗 5000 万像素的主摄像头(f / 1...
手机互联 2023-05-31 07:54:45 -
618苹果14价格跳水?别急,三星S23Ultra跳的更狠!
最近的手机真是一个塞一个的离谱,苹果14p跌到7000,三星S23 Ultra也坐不住,直接降价1900!这时候真的是想入手这两款机型的用户的最好时机了,就是让首发用户显得有点大怨种但如果你是因为拍照而关注这两款手机的话,我觉得其实同级别还有其他不错的选择,比如华为P60啊,或者是OPPO Find X6 Pro,都是拍照性能很不错的旗舰手机尤其是Find X6 Pro,毕竟绿厂的影像能力一直以来都不弱的,加上这次Find X6 Pro还有5000万像素的三主摄,拒绝凑数,加上哈苏影像的调校,在人像和夜景方面的拍摄都妥妥的行业内数一数二的,加上算法的帮助,可以让不会拍照的普通人也能随手一拍拍出大片。并且还有光子矩阵技术,能够让相册里拍摄的图片更加还原当时的明暗影调,记录最真实的感动,这影像体验真的拉满了并且我跑去京东看了一下,618期间Find X6 Pro有24期免息还有影像礼盒送,真的很值得入手一波啊~ ...
手机互联 2023-05-31 07:54:37 -
北航36岁博导上太空?没错,就刚刚,坐神舟十六号上去的!
北京时间5月30日9时31分13.480秒,搭载着航天员景海鹏、朱杨柱、桂海潮的神舟十六号载人飞船,在酒泉卫星发射中心90工位,由长征二号F改进型遥十六运载火箭发射升空。飞船准确进入预定轨道,发射任务取得圆满成功!神舟十六号载人飞船升空瞬间 | 央视新闻随后,神舟十六号飞船的“6...
智能设备 2023-05-30 10:53:05 -
Exynos2200加持!三星GalaxyS23FE规格曝光
消息源@Tech_Reve透露,三星将于今年年底推出 Galaxy S23 FE 手机,不会推出高通骁龙版本,而是搭载自家的 Exynos 2200 处理器。对此,外媒SamMyFans认为,主要原因是为了降低成本和维持利润。但考虑到 Galaxy S22 系列的不畅销,选择 Exynos 2200 处理器可能会影响到 Galaxy S23 FE 的销量。同时,Galaxy S23 FE 的其它规格信息也被曝光,包括6.4Gbps LPDDR5 6/8GB内存、UFS 3...
手机互联 2023-05-29 07:31:35