
24 天前
2026年3月的北京街头,有人对着手机说一句“帮我订明天去上海的高铁和外滩附近的酒店”,手机屏幕就自动在购票APP和订房软件里跳转操作,全程不用手动点一下。这不是科幻场景——两会政府工作报告刚把“智能体”写入国家战略,豆包手机助手、三星Galaxy S26这类能“替人干活”的产品就已落地。当AI不再只陪聊,而是真的能操作你的手机APP,一场技术路线的暗战已经打响,更棘手的法律和规则问题也随之而来:AI替你操作第三方APP,到底谁说了算?
你可以把AI智能体理解成给云端大模型接上了“手和脚”——过去它只会动嘴聊天,现在能动手帮你完成任务。而手机作为AI落地的核心载体,已经成了各大厂商的必争之地,其中最核心的技术分歧,就是AI怎么“操作”手机里的APP。

目前主流有两条路线:一条是GUI(图形用户界面)路线,就像给AI安了一双“眼睛”,让它像人一样识别屏幕上的图标、按钮,模拟点击和滑动操作——这相当于一把万能钥匙,不管有没有开放接口的APP,它都能试着打开,但缺点是速度慢,还可能因为界面更新“认错”按钮。另一条是API路线,相当于APP给AI开了专用通道,AI通过标准化接口直接调用功能,速度快又稳定,但前提是APP愿意开放接口,大量中小应用根本没动力做这件事。

香港科技大学副教授王帅的判断很直接:这两条路线不是对手,而是互补。有API的时候走专用通道,没接口的时候用万能钥匙兜底。豆包手机助手的实践已经验证了这种协同——它既支持通过GUI操作无接口的老应用,也在逐步对接开放的API提升效率,背后的UI-TARS模型还能通过沙盒自进化,不断优化对界面的识别能力。

技术路线的争议还没平息,法律层面的问题已经迫在眉睫:当AI替你操作第三方APP,到底需要谁授权?是只要你点一下“同意”就行,还是必须经过APP开发商点头?
过去的“双重授权”原则,是既要用户同意,也要第三方APP许可,但在智能体时代,这显然会拖慢效率——总不能每操作一个APP都要找开发商要授权。北京师范大学教授吴沈括提出,“概括授权”或许是新的方向:用户一次性授权智能体代表自己操作,就像给了AI一张“全权委托书”,只要在授权范围内,AI的操作就视为用户自己的行为。但这也有边界——涉及大额转账、身份信息修改这类高敏感操作,必须要用户二次确认。
更关键的是AI的法律定位:它到底是用户的“工具”,还是能独立承担责任的“代理人”?中国法学会常务副秘书长周辉的观点是,目前更倾向于把智能体视为用户意志的延伸,它的所有操作责任最终都由用户或智能体服务商承担,而非AI本身。但这也意味着,用户必须能随时监控和终止AI的操作,服务商要建立“事前授权、事中感知、事后审计”的全流程机制——豆包手机助手的实践就是如此,用户能随时查看AI的操作记录,也能一键暂停所有权限。
当全球都进入智能体时代,中国该怎么在技术和规则上抢占先机?中科院科技战略咨询研究院所长眭纪刚的建议是,先别急着定路线,要鼓励多元化探索。回顾技术史,QWERTY键盘因为过早锁定成标准,导致更高效的键盘布局被埋没;交流电能战胜直流电,也是因为没有过早被限制。智能体的发展也是如此,GUI、API甚至未来可能出现的新路线,都应该给足试错空间。
在规则层面,中国的优势在于能把技术创新和监管同步推进。欧盟的AI法案虽然严格,但偏向事后监管;美国的监管则相对分散,各州规则不一。而中国已经在通过“分类分级”的方式,给不同风险的智能体制定不同规则:低风险的聊天类智能体可以快速落地,高风险的金融、医疗类智能体则需要严格的安全评估。中国政法大学教授陶乾强调,反不正当竞争法的核心是保护公平竞争,而不是保护现有利益——智能体作为新的竞争模式,只要没有侵害他人合法权益,就应该给它成长的空间。
更重要的是构建生态。智能体不是某一家公司的事,需要手机厂商、APP开发商、AI服务商甚至用户一起参与。比如通过开源的智能体框架,让中小开发者也能快速搭建自己的智能体;通过统一的技术标准,让不同厂商的智能体能互相协作。
当你对着手机说出需求,AI就默默帮你完成所有操作的那天,其实已经不远了。这场智能体革命,本质上是把用户从繁琐的APP操作里解放出来,让技术真正围绕人的需求转。
在变革中立规,在创新中共生。这不仅是智能体发展的原则,也是所有新技术走向成熟的必经之路。我们不需要害怕AI“越界”,只要把规则的篱笆扎好,把控制权牢牢握在用户手里,智能体就能成为每个人最得力的助手。毕竟,技术的终极目标,从来都是服务于人。
点击充电,成为大圆镜下一个视频选题!