关闭广告

10倍压缩率,97%解码精度!DeepSeek开源新模型,为何赢得海内外关注

澎湃新闻63人阅读

DeepSeek开源新模型:用视觉模式实现上下文压缩。

10月20日,DeepSeek宣布开源最新大模型DeepSeek-OCR。所谓的OCR,据DeepSeek在论文中解释称,是通过光学2D映射压缩长上下文可行性的初步研究。DeepSeek-OCR由两部分组成:DeepEncoder和作为解码器的DeepSeek3B-MoE-A570M。DeepEncoder作为核心引擎,设计为在高分辨率输入下保持低激活,同时实现高压缩比,以确保视觉tokens数量优化且可管理。

通俗而言,这是一种视觉-文本压缩范式,通过用少量的视觉token来表示原本需要大量文本token的内容,以此降低大模型的计算开销。

据公布的论文名单显示,该项目由DeepSeek三位研究员Haoran Wei、Yaofeng Sun、Yukun Li共同完成,但这三位核心作者都颇为低调,其中一作作者Haoran Wei曾在阶跃星辰工作过,曾主导开发旨在实现“第二代 OCR”的GOT-OCR2.0系统。


DeepSeek-OCR的架构分为两部分。一是DeepEnco

上一页 下一页
版权与免责声明:本文内容转载自其他媒体,目的在于传递更多信息,不代表本网观点或立场,不承担此类作品侵权行为的自己责任及连带责任。
猜你喜欢
精彩推荐

伊朗外长:伊朗给美国人"准备了许多惊喜"

界面新闻 浏览 8

影翎Antigravity A1全景无人机开启公测 明年1月发售

网易科技报道 浏览 92

官方:利物浦签下15岁曼城青训门将阿尔菲-杜利

懂球帝 浏览 71

奔四奔五的女人,冬日掌握了这些穿搭宝典,才能优雅不冻人

静儿时尚达人 浏览 23

白宫附近国民警卫队员遭枪击:500名士兵将增派华盛顿

澎湃新闻 浏览 19

妙佑医疗国际官方指导,曜影医疗启动长寿门诊,以多学科与数字化平台开创医学级长寿管理

投中网 浏览 85

证监会9问巴奴火锅,IPO还有戏吗?

节点财经 浏览 91

官方:贝西克塔斯租借亚特兰大23岁前锋E-图雷,含买断选项

直播吧 浏览 70

刚刚 | “死了么”APP征名!

天津广播 浏览 17

杨笠突然清空社媒!自曝生病睡眠差,长期遭攻击疑似萌生退意

萌神木木 浏览 1130

中国留学生在德国遭袭反击致对方受伤 警方认定"防卫"

红星新闻 浏览 19

24架F-35A隐身战机集结西太平洋

极目新闻 浏览 85

特朗普发B-2轰炸机飞行投弹视频 配乐恶搞"轰炸伊朗"

环球网资讯 浏览 73

女生胸部最标准的5个形状(男生禁入!)

Yuki女人故事 浏览 85

暑假作业是“拔草”?可为研究人类迁徙行为提供关键证据

封面新闻 浏览 97

哥伦比亚总统硬刚特朗普:不要用军事行动惊扰“美洲豹”

红星新闻 浏览 26

女子车祸大难不死被指事先不该下车"看热闹" 本人回应

潇湘晨报 浏览 78

古井贡酒2025上半年营收超138亿元,稳健增长与“悦己”革新,1800多年的老名酒迸发活力

时代周报 浏览 88

“瓜子大王” 洽洽净利暴跌73.68%

国际金融报 浏览 94

罗马诺:沃特福德将签下自由球员南帕里斯-门迪,周三完成体检

直播吧 浏览 78

博阿斯:没考虑过让穆里尼奥回归;不会祝福他在本菲卡好运

懂球帝 浏览 84
本站所有信息收集于互联网,如本站收集信息侵权,请联系我们及时删除
沪ICP备20017958号-12