关闭广告

GUI自动化的新突破:ServiceNow让AI更准确定位屏幕界面元素

科技行者45人阅读


这项由ServiceNow、魁北克人工智能研究院、蒙特利尔大学、约克大学、蒙特利尔理工学院和麦吉尔大学联合进行的研究发表于2025年10月,论文编号为arXiv:2510.03230v1。研究团队由王苏宇辰、张天宇、Ahmed Masry、Christopher Pal、Spandana Gella、刘邦和Perouz Taslakian等学者组成,他们致力于解决人工智能在GUI(图形用户界面)自动化中面临的核心难题。有兴趣深入了解的读者可以通过论文编号arXiv:2510.03230v1查询完整论文。

现代生活中,我们每天都要与各种软件界面打交道——从手机应用到电脑程序,从网页浏览到办公软件。如果能让人工智能像人类一样准确地识别和操作这些界面元素,将会极大提升工作效率。然而,要让AI准确找到屏幕上的按钮、文本框或菜单项,就像要求一个从未见过地图的人在陌生城市中找到特定建筑物一样困难。

这项研究的核心贡献在于解决了当前视觉语言模型在GUI定位任务中的一个根本性问题:如何将自然语言指令准确转换为屏幕上的像素坐标。研究团队发现,现有方法就像让一个盲人通过触摸来画地图一样效率低下,因为AI模型需要在没有明确参照物的

上一页 下一页
版权与免责声明:本文内容转载自其他媒体,目的在于传递更多信息,不代表本网观点或立场,不承担此类作品侵权行为的自己责任及连带责任。
猜你喜欢
精彩推荐

可折叠手机在美国市场卖爆了,三星苹果硬刚卷土重来!

财联社 浏览 93

杰克逊霍尔开幕:鲍威尔讲话在即,地区联储主席忙打“预防针”?

第一财经资讯 浏览 96

美国要求乌单方面撤军 泽连斯基回应

每日经济新闻 浏览 29

鲁比奥谈"特普会":特朗普总统"想看着普京的眼睛"

红星新闻 浏览 102

以政府证实:已批准占领加沙城计划

央视新闻客户端 浏览 110

或2026年发布 全新大众T-ROC R渲染图曝光

车质网 浏览 30

特斯拉Model S/X在美涨价 1 万美元,但附赠含FSD的“豪华套餐”

IT之家 浏览 106

夸梅:吹杨的数据确实亮眼 但我宁愿选择费舍尔 他总能为队友补位

直播吧 浏览 105

货车高速漏油被扣车罚11万才能开走 司机:车才值几万

北青网-北京青年报 浏览 72

加长加高加座 六座特斯拉Model Y L来了

网易汽车 浏览 100

泽连斯基时隔半年再次造访白宫 这回穿正装了

每日经济新闻 浏览 99

男子市区骑车遭横空绳索割喉 医生几乎为他"重造"喉部

红星新闻 浏览 84

起底Plaud不融资却卖100万台的秘密

虎嗅APP 浏览 34

疑徐萌出轨范曾继子两人罕见合影流出 双方早就相识了

古希腊掌管松饼的神 浏览 88

拜仁官方:世界队中国之旅结束,期待更多中国青年才俊加入

懂球帝 浏览 183

法兰克福左后卫布朗:我们依靠整体防守萨拉赫,而不是我单防

懂球帝 浏览 48

俄称打击乌兵员中心 乌称袭击俄边疆炼油厂

北青网-北京青年报 浏览 92

baby相隔17年同角度怼脸拍!全脸变化肉眼可见

萌神木木 浏览 27

中国电池助力欧洲车企崛起!

电动知家 浏览 87

荣耀亲选耳夹式耳机2 Pro曝光:金线充电盒加持,支持空间音频

IT之家 浏览 60

百亿资产转让频现 银行加速甩包袱

北京商报 浏览 60
本站所有信息收集于互联网,如本站收集信息侵权,请联系我们及时删除
沪ICP备20017958号-12