关闭广告

小米开源语音大模型Xiaomi-MiMo-Audio,对话自然度达拟人水准

IT之家79人阅读

IT之家 9 月 19 日消息,小米今天宣布开源首个原生端到端语音大模型 Xiaomi-MiMo-Audio,首次在语音领域实现基于 ICL 的少样本泛化

据小米介绍,五年前 GPT-3 首次展示了通过自回归语言模型 + 大规模无标注数据训练,获得 In-Context Learning(ICL,上下文学习)能力,而在语音领域,现有的大模型仍严重依赖大规模标注数据难以适应新任务达到类人智能

而 Xiaomi-MiMo-Audio 模型打破了这种瓶颈,它基于创新预训练架构和上亿小时训练数据,在智商、情商、表现力与安全性在内的跨模态对齐能力均有提升,在自然度、情感表达和交互适配方面呈现出拟人化水准

这款模型的具体创新点如下:

  • 首次证明把语音无损压缩预训练 Scaling 至 1 亿小时可以“涌现”出跨任务的泛化性,表现为 Few-Shot Learning 能力。

上一页 下一页
版权与免责声明:本文内容转载自其他媒体,目的在于传递更多信息,不代表本网观点或立场,不承担此类作品侵权行为的自己责任及连带责任。
猜你喜欢
精彩推荐

感觉生活停滞不前的时候,试试这5个小方法获得能量

黎贝卡的异想世界 浏览 90

预计一季度上市 尚界高颜值轿跑Z7预告图发布

网易汽车 浏览 25

鸿蒙智行尊界S800“时代旗舰”轿车第1万台下线

IT之家 浏览 23

港台影视圈已经没有“小花”了

仙女事件簿 浏览 59

詹姆斯:湖人的投篮困境终会过去;这周对我来说有点像训练营

懂球帝 浏览 29

状态火热!足球报:阿奇姆彭赛季14球有7个头球,还制造了7个点球

直播吧 浏览 89

一边收监管“黄牌”,一边夺A股成交额冠军!北方稀土股价新高背后,关联交易存隐忧

时代周报 浏览 77

辛巴退圈,直播行业的“震中时刻” 他退播了?

陈意小可爱 浏览 106

成毅助理打人上热搜又反转!网友质疑是被公司黑

FancyMusic 浏览 29

埃弗顿vs富勒姆:格拉利什、皮克福德首发,劳尔-希门尼斯、莱诺出战

懂球帝 浏览 37

“全球坚韧船队”成员控诉遭辱:以色列虐待所有人

看看新闻Knews 浏览 79

伊姐周日热推:电视剧《狙击蝴蝶》;电视剧《天书黎明》......

伊周潮流 浏览 33

从LF-ZC到量产,解析雷克萨斯全新一代ES电动豪华哲学

Nice好车 浏览 82

梅西:作为朋友我当然希望内马尔踢世界杯,但我无法客观评价

懂球帝 浏览 7

美国市场 Model Y 需求激增,特斯拉称考虑涨价

IT之家 浏览 81

苹果欲推首款低价Mac,定价远低于1000美元,挑战微软与Chromebook

华尔街见闻官方 浏览 47

广汽功臣肖勇让位,埃安、杨龙能否相互成全?

车友观察 浏览 85

剑南春|国米2-1客胜维罗纳,泽林斯基破门,皮奥造乌龙绝杀

懂球帝 浏览 38

凑齐“56789”!问界独占鸿蒙智行7成销量,“5界”如何共扛百万辆目标?

时代周报 浏览 23

身高190+神颜男主竟失业?胡一天近况曝光引热议!

Yuki女人故事 浏览 92

“塌房失败”的李雪琴给所有人上了一课

乡野小珥 浏览 147
本站所有信息收集于互联网,如本站收集信息侵权,请联系我们及时删除
沪ICP备20017958号-12