两会刚刚落下帷幕,人工智能怎样进入家门、怎样进入工厂就业而成了老百姓最为关心的事情,政府工作报告当中“人工智能+”的这种提法,直接点明了今年的发展方向,那就是不要再去炒作概念了,必须要让人工智能真正地发挥作用,要让普通民众能够使用得上、能够消费得起。
智能终端迎来爆发前夜
两会通道上,工信部部长李乐成的发言,给市场吃下了定心丸,为2026年全力推动那AI与制造业的“双向奔赴”做出了明确表示,这就充分说明了,那种种AI电脑、AI手机,已然不再仅仅只是于那孤零零实验室中的样品,此而是即将大规模地走进那千家万户成为商品了,依据工信部内部相关人士所透露的情况,在今年,将会相继有起码15款AI手机新品上市,并且其价格会下探至2000元这么一个档位呢。
在家居智能化范畴之内同样行动十分密集,像海尔、美的这类家电行业的大型企业已经开展项目着手研发人工智能管家系统。这些系统能够借助手机协助工具来实现全屋各类设备之间的相互响应连接,举例来讲,当你朝着手机发出“我感觉热了”这样的指令时,它会自行对空调的温度进行降低设置,将窗帘给拉开,呈现出温水的准备状态。这种跨越不同设备之间的且丝毫察觉不出隙缝的体验感受,确切是“人工智能与行业领域相结合”在日常生活当中得以实现落地的一种具体表现情形。
GUI路线破解生态壁垒
目前手机AI助手在技术路线方面存在的争论,究其实质而言,乃是开放与封闭之间所展开的博弈。API路线表面上看似较为规范,然而其要求每个App都得开放接口,在当下商业竞争如此激烈的情形下,这几乎是不太可能达成的。依据第三方所做的统计,在国内排名前100的App当中,愿意开放标准接口的占比不到15%,并且大量的中小应用根本就没有能力去开发接口。
采用GUI的此种路线,是找寻旁的路径,使得AI能够如同常人那般“观看”屏幕来做操作。类似字节跳动所推出的豆包手机助手,这便是典型的例子,它借助同vivo与OPPO等生产厂商于系统层面进行合作,进而获取到操作的权限。当用户浏览到有关旅游攻略的视频,讲出一句“记下这个地方”时,豆包便能够自行去截图、展开备忘录、填入信息并且设置提醒,整个流程并不需要App予以配合。
行业困局迎来破局样本
有一位北京航空航天大学人工智能研究院的教授沙磊,在两会访谈中表明,API路线受商业博弈的限制,落地的节奏实在是太慢了。举例来说,要是想达成“一键比价”,那就得调用京东、淘宝以及拼多多的所有接口,然而这三家彼此之间是竞品关系,根本就不可能开放。最终导致的结果是,AI能力被禁锢在单一的应用之中对跨平台痛点无法解决。
去年豆包手机助手的那实测数据极具说服力,在没有接入任何电商API的情形下,借助GUI操作达成了超过90%的跨应用比价任务。这样的一种能力使得行业察觉到了新方向,也就是与其去求着大厂开放接口,倒不如让AI学会好比人像这样操作手机。当下小米、荣耀等厂商已经组建了团队去跟进GUI路线。
被低估的价值正在重估

香港科技大学的王帅副教授,以一种直言不讳的态度表示,那遵循 GUI 路线所具备的价值,在市场当中遭到了极为严重的低估。有相当多的人持有这样一种看法,觉得它不过仅仅只是“屏幕录制 + 自动点击”这种形式的升级版而已,然而在实际情况里,当它与大模型相互结合之后,便能够对复杂场景予以理解。就好比说啊,当你在这个当中收到了一个有关餐厅的定位信息,然后说了一句“看看附近评价”,此时它就能够以一种自动的方式,去打开地图这个应用程序,接着切换到点评应用上面,随后截取评分页面,最后再返回给你。
国际巨头同样在对这个方向予以印证,微软于去年底所发布的Windows Agent项目,其本质实际上就是端的GUI操作,谷歌的Project Astra演示当中,AI能够借助手机摄像头来识别设备并且指导维修,这些案例表明,GUI并非是过渡方案,而是AI用来理解物理世界的关键路径,两会提出的“规模化应用”恰恰正需要这种低门槛技术。
隐私安全无需过度担忧
就用户所顾虑的隐私问题而言,北京师范大学的网络法治专家吴沈括作出了明确的解释,GUI路线自身不会窃取隐私,存在风险的地方在于权限有没有被规范地使用,当下我国已经有《个人信息保护法》以及《数据安全法》进行双重监管,手机厂商在系统层面能够对AI的权限加以控制,比如说读取屏幕的时候需要用户实时进行授权。
以北京理工大学尹西明担任副职称的这位副教授,又进一步作出明确指出,提出让每个App都进行“双重授权”这样的要求,一方面是不符合实际情况的,另一方面也是毫无必要可言的。用户针对手机系统执行操作给予授权这种行为,其性质便如同你给予你的助理为你去处理文件的授权一样,并不需要针对每一个文件都找来第三方进行签字。当前像豆包这类助手所采取的做法呈现出这样的情形:对于诸如支付、删除等属于敏感类别的操作,必然是需要用户进行第二次确认的 而对于普通类别的操作,则是在后台以静默的方式予以完成的。
多元探索才是发展正道
两会代表委员达成这样的共识:AI在实际应用中不能仅仅寄希望于单一的技术路线来实现落地。GUI所起到的作用是解决“能不能做”这样的问题,API所起到的作用则是解决“做得好不好”这样的问题。就拿查询航班这个例子来说,GUI能够实现打开航司的App进行相关操作,然而要是航司开放了相应的接口,那么通过API进行查询,在速度方面会更快,在信息方面会更准确。只有将两者进行结合,才能够成为最佳的解决办法。
工信部已然明确,在2026年的时候,将会去支持最少5条技术路线的并行进行探索。除去GUI以及API之外,A2A(也就是智能体协同)同样是处于规划之中的。在未来,你手上的手机助手极有可能会同时去调用多种能力,用GUI这般去操作那些没有接口的老应用,借助API连接开放平台,依靠A2A协调家中的智能设备。像这种处于安全前提之下的多元探索,才能够使得AI真正地普惠大众。
你认为能够像人那般进行屏幕操作的手机AI助手,还是等待所有App都开放接口的情况?哪一种方式会让你使用起来更加感觉放心没问题?在评论区域留言去展开讨论,点赞并且分享以便让更多的人参与到这个跟每个个体生活有关联、有联系的话题之中。