关闭广告

10倍压缩率,97%解码精度!DeepSeek开源新模型,为何赢得海内外关注

澎湃新闻67人阅读

DeepSeek开源新模型:用视觉模式实现上下文压缩。

10月20日,DeepSeek宣布开源最新大模型DeepSeek-OCR。所谓的OCR,据DeepSeek在论文中解释称,是通过光学2D映射压缩长上下文可行性的初步研究。DeepSeek-OCR由两部分组成:DeepEncoder和作为解码器的DeepSeek3B-MoE-A570M。DeepEncoder作为核心引擎,设计为在高分辨率输入下保持低激活,同时实现高压缩比,以确保视觉tokens数量优化且可管理。

通俗而言,这是一种视觉-文本压缩范式,通过用少量的视觉token来表示原本需要大量文本token的内容,以此降低大模型的计算开销。

据公布的论文名单显示,该项目由DeepSeek三位研究员Haoran Wei、Yaofeng Sun、Yukun Li共同完成,但这三位核心作者都颇为低调,其中一作作者Haoran Wei曾在阶跃星辰工作过,曾主导开发旨在实现“第二代 OCR”的GOT-OCR2.0系统。


DeepSeek-OCR的架构分为两部分。一是DeepEnco

上一页 下一页
版权与免责声明:本文内容转载自其他媒体,目的在于传递更多信息,不代表本网观点或立场,不承担此类作品侵权行为的自己责任及连带责任。
猜你喜欢
精彩推荐

让AI给人类发工资 28岁小伙用AI创业拿下3000万元投资协议

封面新闻 浏览 14

森保一:若球迷都穿巴西球衣来看球,那我们恐怕很难赢

懂球帝 浏览 71

普通女孩夏天怎么穿衣才好看?多穿裙子和T恤,大方舒适又得体

静儿时尚达人 浏览 79

欧盟一些成员国欲"另起炉灶" 绕开欧盟跟美国直接谈

澎湃新闻 浏览 26

特朗普"闯祸"泄露军事机密:美军要重返阿富汗对付中国

文雅笔墨 浏览 102

12306汽车托运服务订单火爆 客服:目前有9条线路可选

极目新闻 浏览 30

小米米家前置过滤器 Pro 开售:可拦截水中泥沙等杂质,799 元

IT之家 浏览 101

日最上级护卫舰出口“破冰” 成功拿下澳海军订单

看看新闻Knews 浏览 88

中方是否计划承认阿富汗临时政府 外交部回应

澎湃新闻 浏览 98

新型发电领域的“超级跑车”来了!发电效率提升的秘密藏在这里

上观新闻 浏览 27

HWG!罗马诺:AC米兰签药厂前锋博尼法斯,租借费+买断共2900万欧

直播吧 浏览 84

观众齐刷退钱,跟赵文卓打擂台,樊少皇新片差评一片,票房仅57万

靠谱电影君 浏览 93

心绞痛到心梗,冠心病已成首要死亡原因!北大第一医院副院长李建平:中年是防治关键期

时代周报 浏览 80

诺和诺德董事长携6名董事集体辞职,董事会“大换血”,年薪5000万CEO此前离任

红星资本局 浏览 63

亚马逊AWS将部署英伟达Groq LPU与超百万块GPU

IT之家 浏览 17

最新“施工图”预示,真正的风口藏在这5个“强国”中

BT财经 浏览 14

4999元起!荣耀三箭齐发:Air旗舰要从小屏卷向超轻薄赛道?

雷科技 浏览 26

拖欠2000万投资款,知名影视公司紫骏影视被判“以房抵债”,实控人曹哲连带担责

红星资本局 浏览 20

媒体:国际贸易格局变了 美国影响力正在逐渐减弱

极目新闻 浏览 157

一周双赛,麦麦提江执法完苏超72小时内执法足协杯半决赛

懂球帝 浏览 77

保时捷4S店暴雷背后 两记“暴击”都是新势力给的

小李车评李建红 浏览 34
本站所有信息收集于互联网,如本站收集信息侵权,请联系我们及时删除
沪ICP备20017958号-12