关闭广告

小米开源语音大模型Xiaomi-MiMo-Audio,对话自然度达拟人水准

IT之家73人阅读

IT之家 9 月 19 日消息,小米今天宣布开源首个原生端到端语音大模型 Xiaomi-MiMo-Audio,首次在语音领域实现基于 ICL 的少样本泛化

据小米介绍,五年前 GPT-3 首次展示了通过自回归语言模型 + 大规模无标注数据训练,获得 In-Context Learning(ICL,上下文学习)能力,而在语音领域,现有的大模型仍严重依赖大规模标注数据难以适应新任务达到类人智能

而 Xiaomi-MiMo-Audio 模型打破了这种瓶颈,它基于创新预训练架构和上亿小时训练数据,在智商、情商、表现力与安全性在内的跨模态对齐能力均有提升,在自然度、情感表达和交互适配方面呈现出拟人化水准

这款模型的具体创新点如下:

  • 首次证明把语音无损压缩预训练 Scaling 至 1 亿小时可以“涌现”出跨任务的泛化性,表现为 Few-Shot Learning 能力。

上一页 下一页
版权与免责声明:本文内容转载自其他媒体,目的在于传递更多信息,不代表本网观点或立场,不承担此类作品侵权行为的自己责任及连带责任。
猜你喜欢
精彩推荐

已减重10公斤的泫雅澳门演出晕倒后公开致歉

封面新闻 浏览 836

最高预增超32倍 283只医药股“剧透”业绩

北京商报 浏览 23

小鹏旗下又一公司秘密提交IPO

电动知家 浏览 19

这些都是普通人适合的穿搭!多穿卫衣和半身裙,舒适又耐看

静儿时尚达人 浏览 25

宇树180芭蕾机器人,究竟啥水平?

量子位 浏览 89

小库科技何宛余:未来五年是中国AI闯中东的黄金窗口期

经济观察报 浏览 94

从“百模大战”到“百镜大战”,AI眼镜成新焦点丨一克商评

封面新闻 浏览 42

车辆占道违停小车逆行超车撞车 险企欲让占道车担责

红星新闻 浏览 77

初秋美拉德风炸街!这样搭配也太绝了吧!

Yuki女人故事 浏览 75

“青云租”爆雷员工揭内幕:每个员工每月需投资30台手机,11万台集中流向两个村庄

封面新闻 浏览 25

荣耀MagicOS产品经理:YOYO建议绑定12306预计不晚于10月全量支持

IT之家 浏览 78

预售权益价10.69万元起 东风日产N6将上市

网易汽车 浏览 26

耗资3000万,正面对决吴京,我感慨:41岁谢苗终于迈出了这一步

靠谱电影君 浏览 24

“复古运动风”今年秋天太流行了,这样穿减龄又好看!

LinkFashion 浏览 78

莱比锡4-2桑德豪森晋级,奥尔班传射,班祖齐、西蒙斯破门

懂球帝 浏览 84

菲律宾看上了日本二手护卫舰 日媒:加强应对中国

枢密院十号 浏览 74

美媒:苏-57与F-22或在阿拉斯加空域首次正面相遇

环球网资讯 浏览 101

日系车为何都不赚钱了:本田净利润腰斩,日产巨亏,丰田增收不增利

21世纪经济报道 浏览 86

停办吧!《奔跑吧》首播差评一片,请一大堆明星没一个能拿得出手

娱乐圈笔娱君 浏览 53

俄副外长警告:北约敌对行为可能导致核大国间直接冲突

环球网资讯 浏览 49

埃及成立危机委员会应对以伊冲突影响

国际在线 浏览 74
本站所有信息收集于互联网,如本站收集信息侵权,请联系我们及时删除
沪ICP备20017958号-12