关闭广告

上海AI实验室团队首创视频驱动交互网页重建基准

科技行者62人阅读


这项由上海AI实验室、浙江大学、中国科学技术大学深圳分校等机构联合完成的突破性研究发表于2025年9月,论文编号为arXiv:2509.24709。研究团队包括陈阳、刘明浩、沈雨帆等多位来自不同院校的研究者,项目由上海AI实验室的沈雨帆教授领导。有兴趣深入了解的读者可以通过该论文编号查询完整论文内容。

当我们浏览网页时,看到精美的界面、流畅的动画效果和各种交互功能,很少有人会想到这背后需要大量的代码来支撑。传统上,要让AI学会制作网页,研究者们通常只给它看静态的截图,然后让它生成对应的代码。这就像让一个人仅凭一张照片就要画出整幅画作一样,缺少了很多重要信息。

然而,真实的网页远比静态截图复杂得多。当用户点击按钮时页面会发生变化,当鼠标悬停在某个区域时会出现新的内容,当用户填写表单时系统会给出相应反馈。这些动态的交互过程包含了网页运作的核心逻辑,但在传统的AI训练方法中却被完全忽略了。

正是在这样的背景下,研究团队提出了一个革命性的想法:为什么不让AI观看完整的用户操作视频,就像人类学习使用软件一样,通过观察整个交互过程来理解网页的工作原理呢?

上一页 下一页
版权与免责声明:本文内容转载自其他媒体,目的在于传递更多信息,不代表本网观点或立场,不承担此类作品侵权行为的自己责任及连带责任。
猜你喜欢
精彩推荐

《一路繁花2》出圈理由

娱乐圈笔娱君 浏览 851

博时基金换帅,张东能否打好权益“翻身仗”?

节点财经 浏览 88

智驾研发迎分水岭?小鹏第二代VLA直奔L4, 何小鹏:完全自动驾驶将在未来1-3年内完全到来

时代财经 浏览 18

即时零售“爆发”,百果园“失算”

伯虎财经 浏览 83

IPO倒计时,解码希迪智驾“攻守道”

第一财经资讯 浏览 30

上半年营收18亿元同比增长12.3% 美图公司透露与阿里巴巴合作进展

经济观察报 浏览 106

DeepSeek一句话让国产芯片集体暴涨!背后的UE8M0 FP8到底是个啥

量子位 浏览 84

何炅51岁无妻无子,且不再隐瞒身体状况了?

艳儿说电影 浏览 1025

飞天茅台4年下跌近50%,白酒寒冬结束的信号是什么?

郭施亮 浏览 50

新款狮铂拓界暂定明年3月份上市!若12万能火吗?

汽车网评 浏览 36

乌方将向美国出售无人机 俄新型战略核潜艇入役

每日经济新闻 浏览 75

捐款超1500万,嫣然医院欠租问题有望解决,但更麻烦的事在后面

数字财经智库 浏览 23

牛弹琴:欧洲大怒 多支军队兵发格陵兰抗衡美国吞并

现代快报 浏览 22

窦骁发文辟谣婚变传闻

柠檬有娱乐 浏览 701

林俊杰女友报警反击谣言,获男友极力维护,果然是奔着结婚去的

萌神木木 浏览 27

媒体:在九三阅兵前访美 李在明对美说硬话未必办硬事

新民晚报 浏览 86

当奥迪走上“对抗路”,特斯拉开始疲于招架

车市雷达 浏览 65

黄蜂24记三分133-126老鹰,鲍尔28+13,杰伦约翰逊43+11+9,特雷杨复出8+10

懂球帝 浏览 34

冬天就要和金靖一样穿得暖呼呼的

时尚COSMO 浏览 50

异军突起!周四与特朗普会面顺利,贝莱德的里德尔竞选美联储主席呼声渐起

华尔街见闻官方 浏览 29

为什么说本田这个“内燃机之王”,在国内被严重低估了

少数派报告Report 浏览 31
本站所有信息收集于互联网,如本站收集信息侵权,请联系我们及时删除
沪ICP备20017958号-12