关闭广告

上海交大突破:单一AI模型实现全视觉创作任务

科技行者33人阅读


这项由上海交通大学的陈俊逸、何通等研究者与快手科技Kling团队、南洋理工大学合作完成的研究发表于2026年1月,论文编号为arXiv:2601.02358v1。对于想要深入了解技术细节的读者,可以通过这个编号在学术数据库中查询完整论文。

在当今的AI时代,我们见证了各种令人惊叹的视觉生成工具。有些能根据文字描述生成精美图片,有些能制作流畅的视频片段,还有些专门用来编辑和修改现有的视觉内容。然而,这些工具就像一个个各有专长的工匠,每个都只能完成特定的任务。如果你想要完成一个复杂的视觉项目,往往需要在多个不同的工具间来回切换,就像在不同的工作台之间搬运材料一样麻烦。

现在,研究团队带来了一个革命性的解决方案——VINO(VInO: A Unified Visual Generator with Interleaved OmniModal Context),这就像是打造了一个万能工作台,能够同时处理所有类型的视觉创作任务。这个系统最令人兴奋的地方在于,它可以同时理解和处理文字、图片和视频等多种信息,并且能在一个统一的框架内完成图像生成、视频制作和内容编辑等各种任务。

VI

上一页 下一页
版权与免责声明:本文内容转载自其他媒体,目的在于传递更多信息,不代表本网观点或立场,不承担此类作品侵权行为的自己责任及连带责任。
猜你喜欢
精彩推荐

霍里:申京因为KD来了才这么说勇士 换我也会这么做

直播吧 浏览 75

北京大学联合多所知名高校突破机器人视角转换技术

科技行者 浏览 39

内塔尼亚胡批准接管加沙城计划 重启与哈马斯谈判

环球网资讯 浏览 93

智己汽车将推更多增程式车型,LS6预售20.99万元起

贝壳财经 浏览 85

发球都不会的球员混进ITF职业比赛!引国外网友和专家愤怒

网球之家 浏览 22

应届生拿到北京户口不满1年就离职 被判赔公司16.5万

鲁中晨报 浏览 658

重大资产重组!刚刚公告,明日复牌!

券商中国 浏览 56

全红婵遭群聊辱骂再升级!国家一锤定音

大鱼简科 浏览 18

小米预热REDMI Note 15 Pro+:通过2米50次花岗岩反复跌落测试

IT之家 浏览 95

小米涨价,远超iPhone

36氪财经 浏览 83

达利欧警告:美伊在霍尔木兹海峡的"决战"将改变世界

财联社 浏览 17

国安部:有间谍入住海景民宿偷拍军港 被老板识破

央视新闻客户端 浏览 70

八年生4胎,稳坐豪门阔太宝座,“千亿儿媳”徐子淇真不简单!

娱乐白名单 浏览 322

年味拉满,好笑戳心,春节档还得看他们!

吐槽电影院 浏览 29

美网资格赛首轮:老将张帅横扫晋级,中国选手6人出战5人过关

全景体育V 浏览 74

AI虚拟细胞面世,无需等待实验,可预警药物疗效与机制

DeepTech深科技 浏览 22

打破波音数十年纪录,空客 A320 即将超越 737 成为最畅销客机

IT之家 浏览 92

美媒称特朗普否决刺杀哈梅内伊计划

财联社 浏览 85

同意支付3600万澳元 谷歌澳大利亚反垄断案达成和解

环球网资讯 浏览 100

AMD 锐龙 9000F / PRO 9045 处理器接近发售,已上线海外电商

IT之家 浏览 81

火箭惨败雷霆!3首发全铁+2替补狂铁,切特压制申京,乌度卡遭批

篮球资讯达人 浏览 26
本站所有信息收集于互联网,如本站收集信息侵权,请联系我们及时删除
沪ICP备20017958号-12