爱奇百科 手机版
您的位置: 首页 > 实时讯息 >

苹果最新AI研究,避免执行未经授权的高风险行为

0次浏览     发布时间:2025-06-29 00:01:00    

6 月 27 日消息,随着 AI 智能体越来越聪明,甚至能够主动帮助用户在手机上完成各种任务(例如修改某项设置、打开导航),但 AI 本身并不理解 UI 结构对应的具体运行机制,仅仅是按照预设程序执行操作。

苹果与华盛顿大学的研究人员现在联合发表了一篇论文,探讨如何让 AI 学会判断各种操作所产生的后果,避免执行用户未批准的高风险动作。

AI 智能体的自主行为是 2026 年苹果系统升级的核心功能之一。苹果在 2024 年 WWDC 上就曾展示过 Siri 的未来发展方向 —— 帮用户代做诸如在线购物、订票等任务,但这种自动化看似便捷,却引发了关键问题:如果 AI 误点“删除账户”而非“注销”,会发生什么?

手机作为个人设备,存储着银行金融数据、健康记录、照片和私人信息。当 AI 智能体代行任务时,必须区分哪些动作无害、哪些可能造成持久或危险后果,更需知道何时停止并请求用户确认。

然而,多数 AI 开发商只是停留在让 AI“会操作”(如识别按钮、找到对应的页面、按指令执行程序),却甚少关注这些操作对用户的后续影响。

苹果 AI 研究人员指出,并不是所有动作都安全无风险:点击“刷新”按钮是低风险行为,但点击“转账”则是高风险行为。

这项研究从 AI 安全与 UI 设计专家参与的研讨会开始,目标是创建一个“分类法”(结构化列表),用于定义 UI 动作的不同影响类型。团队围绕以下问题展开:

动作是否可撤销?

影响仅涉及机主还是包括更多人?

是否改变隐私设置或产生费用?

论文显示,研究人员建立了一种多维度标注手机 App 动作的方法。例如,删除消息可能在 2 分钟内可撤销,但超过时间则无法恢复;转账通常需协助才能撤销。

这种分类法的重要性在于,它为 AI 提供了推理人类意图的框架 —— 相当于一份“风险检查”程序,帮助 AI 判断“哪些动作可能出错”或“为何需要额外确认”。

为训练 AI 区分动作风险,研究人员让参与者在模拟移动环境中记录高风险动作(IT之家注:如修改账户密码、发送消息、更新支付详情),而非浏览、搜索等低风险任务。

团队将新数据与现有覆盖安全、常规交互的数据集结合,用分类法标注所有数据,随后测试了包括 OpenAI GPT-4 在内的五大 AI 模型,评估其预测动作影响水平或分类属性的能力。

结果显示,在提示中加入分类法有助于提高风险判断准确率,但即使表现最佳的“GPT-4 多模态”模型,正确率也仅约 58%。

研究发现,AI 模型常会高估风险 —— 比如将“清除空计算器历史记录”这类无害动作标记为高风险。这种“谨慎偏见”看似更安全,却可能因频繁请求确认而让 AI 助手变得烦人或无用。而更严重的问题在于,模型难以完成判断 —— 无法确定动作是否可撤销,或如何影响他人。

苹果研究人员认为,用户需要的是“有用且安全”的自动化功能:误删账户的 AI 是灾难,但要是连调整音量这种操作都要请示用户的话还不如不做。

研究人员认为,他们的分类法可帮助设计更好的 AI 政策 —— 例如,用户可自定义何时需要请求批准。这种方法支持透明化与个性化,帮助 AI 设计者识别当前模型的薄弱点(尤其在处理真实世界高风险任务时)。

研究表明,教 AI“识别按钮”还不够,它必须理解“点击背后的意义”—— 这对 AI 而言是项艰巨任务。人类可以通过上下文提示和历史经验来进行判断,但机器却很难完美地解决这种复杂性操作。

【来源:IT之家】

相关文章

  • 腾讯游戏的内部赛马要回来了?

    文 | 鹏有WeHave上周(8月13日)腾讯发布了2025年二季度的业绩报告,在这份被市场一致看好的财报中,其实最大的惊喜不是主流叙事关注的AI和微信生态,而是游戏板块的《三角洲行动》(以下或简称“三角洲”)。它上线于去年9月底,一经推出便展现出现象级游戏的潜力,用户和收入规模节节攀升,目前已经进

    2025-08-18 17:36:00
  • 鸿蒙不怕远征难

    文 观察者网 吕栋 “我们很希望能把努力,用在自己的操作系统上,把论文写在祖国大地上”、“鸿蒙对中国开发者是全新机会,为什么中国不能有自己的Photoshop?”、“整个淘天集团,包括淘宝、天猫、闲鱼、1688等APP,到9月30日前做到100%适配,这是我们的决心”、“12306作为出行领域的国家

    2025-08-17 16:41:00
  • 在“2025年度AI人物”看见中国AI的星辰大海

    8月14日,总台人工智能产业发展大型主题活动《2025中国·AI盛典》重磅揭晓“2025年度AI人物”“2025年度AI创新应用”。10位“2025年度AI人物”分别是王兴兴、陈宁、陈维良、张鹏、周靖人、姜大昕、夏立雪、韩璧丞、彭志辉、戴文渊(按姓氏笔画排序)。他们聚是一团火——在创新沃野形成燎原之

    2025-08-16 18:53:00
  • 目前我国在售汽车均未实现自动驾驶!公安部加强智驾管理:杜绝车企夸大、虚假宣传

    快科技7月24日消息,据国内媒体报道称,公安部交通管理局局长王强接受采访时表示,将进一步加强智驾规范管理。公安机关将会同有关部门从以下三方面开展工作:首先,加强车企管理。积极配合工业和信息化部等行业主管部门,督促车企落实主体责任,充分开展组合驾驶辅助测试验证,明确系统功能的边界和安全响应措施,严格遵

    2025-07-24 12:00:00
  • 海丰城东镇:全力筑牢防风防汛“安全堤”

    今年第6号台风“韦帕”步步紧逼,为进一步做好台风防御工作,海丰县城东镇基层党组织和广大党员干部闻“风”而动、逆“风”而上,充分发挥基层党组织战斗堡垒作用和党员先锋模范作用,用实际行动全力守护人民群众生命财产安全。先“风”而行,挺立组织部署“主心骨”为提前做好防御台风“韦帕”各项准备工作,城东镇先“风

    2025-07-20 22:06:00

热门文章

最新文章