关闭广告

IDEA研究院发布LEMAS:首个15万小时多语言语音数据集

科技行者29人阅读


科技发展到今天,人工智能已经能够模仿人类的声音说话了。然而,如果你曾经尝试过让AI说其他语言,比如让一个英语AI说中文,你可能会发现它的口音怪异,发音不准,甚至完全听不懂在说什么。这就像是一个只会说英语的人硬要说中文,结果说得让人啼笑皆非。这背后的根本问题是什么呢?缺乏高质量的多语言语音数据。

由国际数字经济研究院(IDEA)主导的研究团队最近发表了一项突破性成果,这项研究发表于2025年1月的arXiv预印本服务器上,论文编号为arXiv:2601.04233v1。感兴趣的读者可以通过这个编号查询完整论文。研究团队构建了一个名为LEMAS的庞大语音数据集,包含超过15万小时的多语言语音数据,覆盖10种主要语言,并且每个词都有精确的时间戳标注。基于这个数据集,他们还开发了两个强大的AI模型:LEMAS-TTS和LEMAS-Edit,前者专门负责语音合成,后者专门负责语音编辑。

为了理解这项研究的重要性,我们可以把语音AI比作一位多语言播音员。传统的播音员要想掌握多种语言,需要大量的训练素材和精确的指导。同样,AI要想说好多种语言,也需要海量的高质量语音数据作为"教材"。但现有的多语言语音数据存在许多问题:要么

上一页 下一页
版权与免责声明:本文内容转载自其他媒体,目的在于传递更多信息,不代表本网观点或立场,不承担此类作品侵权行为的自己责任及连带责任。
猜你喜欢
精彩推荐

也算是开眼了!英国新能源车起不来,媒体将责任“划”给了小偷

小李车评李建红 浏览 56

银河基金规模拉锯战:险守千亿大关 “迷你”基金扎堆

中访网 浏览 3557

广东110-105深圳4利好!陈家政焦泊乔证明价值,萨林杰统治关键球

篮球资讯达人 浏览 23

赵文卓才是真·人间清醒吧

小光侃娱乐 浏览 79

男子花22天从北京跑700公里到郑州:每天跑五六个小时

潇湘晨报 浏览 96

政策引路、车企竞速,辅助驾驶告别“野蛮生长”

北京商报 浏览 70

西北交通格局,将有大变化!

国是直通车 浏览 76

支持老东家,阿什利-扬晒自己现场观战曼联客战阿森纳照片

懂球帝 浏览 26

库里为重庆偏远学校赠送篮球装备,并联合姚基金启动公益计划

懂球帝 浏览 93

国内独家,光刻胶小巨人,又一个“片仔癀”!

飞鲸投研 浏览 82

看完《蜜语纪》里的“穷人”生活,对不起我给穷人拖后腿了

娱乐圈笔娱君 浏览 13

高市早苗:若执政党阵营在选举中未过半数 将即刻辞职

界面新闻 浏览 23

护肤品牌菲洛嘉宣布关闭天猫旗舰店,公司经营策略调整,化妆品市场正快速变化

红星资本局 浏览 24

骨科医生遇袭 行凶者持刀乘网约车从地下车库进门诊

第一财经资讯 浏览 66

郑爽在美国越混越差!打官司诉讼费都掏不起,前夫张恒比她还沦落

萌神木木 浏览 38

航拍画面披露:日本被指昼夜赶建军事基地

环球网资讯 浏览 28

伊朗:三处遭袭核设施未发现污染迹象

界面新闻 浏览 85

苹果 Apple Watch Ultra 2 智能手表心率监测与睡眠追踪实测

IT之家 浏览 93

陈晓离婚不到半年就又曝新欢?

深析古今 浏览 84

男子精神分裂砍死同学的弟弟 第二次精神鉴定结果变了

红星新闻 浏览 25

ChatGPT跟进阿福,AI健康按下快进键

海克财经 浏览 48
本站所有信息收集于互联网,如本站收集信息侵权,请联系我们及时删除
沪ICP备20017958号-12