GitHub · Agent
阿里开源纯前端 JavaScript GUI Agent Page Agent
阿里开源的 Page Agent 是一个纯前端 JavaScript GUI Agent,用户通过自然语言指令即可操控页面,无需浏览器插件或后端改动。它基于文本的 DOM 操作,不依赖截图或多模态模型,安装 Chrome 扩展后能跨多页面连续执行任务,并支持人机协同确认。对 SaaS 厂商和 ERP、CRM 用户来说,可大幅简化操作流程,降低 AI 化改造门槛。
- 域名
github.com- 评分
- 4 · 重要更新
- 发布
- 2026-03-19
导读
这条暂时没有深度导读,点上方「访问项目本体」直接到源页面查看。
原文摘要
标签 老系统转AI应用 产品名 Page Agent 分类 开源 摘要 阿里开源的Page Agent是一个纯前端JavaScript GUI Agent,允许用户通过自然语言指令进行页面操作,无需浏览器插件或后端改动。该工具适用于SaaS厂商和ERP、CRM用户,能显著简化操作流程。安装Chrome扩展后,可以执行跨多页面的任务,支持人机协同操作 收录时间 2026/03/19 网址 github.com/ali…-agent 岗位辅助 通用 行业 通用 2 more properties 阿里开源的一个纯前端JavaScript GUI Agent:Page Agent,给自然语言指令,AI即会辅助操作页面 无需浏览器插件、Python或无头浏览器,一行代码网站变身AI原生应用 对于SaaS厂商来说,无需改后端即可给产品加上AI操作能力;对经常用ERP、CRM的用户,一句话代替几十次点击 其基于文本的DOM操作无需截图,无需多模态模型或特殊权限 人机协同,AI操作前需确认 安装Chrome扩展,可以执行跨多页面/多标签页连续执行任务 github:https://github.com/alibaba/page-agent