AI 驱动的 Android 手机自动化操控
基于 Open-AutoGLM 的 Android 原生客户端,通过 Shizuku 实现完全本地化的 AI 手机操控,无需电脑连接。
写在前头,此项目受 Open-AutoGLM 项目启发,项目代码完全由Claude编写,但方案设计百分百原创,我在事先除了参考过Open-AutoGLM、scrcpy、shizuku-api的代码外,没有看过其他开发者的代码。shizuku方案是因为我日常用的多才采用,绝不是因为无障碍太容易被app检测到导致被ban号
- 📱 纯手机端运行 - 无需电脑连接 ADB,通过 Shizuku 直接获取 shell 权限
- 🎨 Material Design 3 - 现代化 UI,支持动态取色 (Material You)
- 🤖 多模型兼容 - 支持任何具有图像输入能力的 AI 模型
- ⚡ 流式响应 - 实时显示 AI 思考过程
- 🔒 敏感操作确认 - 支付、删除等操作需用户确认
- 🛠️ 人工接管 - 登录、验证码等场景支持人工介入
| 主页 | 设置页 |
|---|---|
![]() |
![]() |
| 对话中 | 通知栏显示进度 |
![]() |
![]() |
| 用户对话编辑 | ai对话编辑 |
![]() |
![]() |
感谢Tech_sky的友情支持
- Android 8.0+ (API 26+)
- Shizuku 已安装并运行
- (可选) ADB Keyboard 用于中文输入
前往 Releases 下载最新版本 APK
git clone https://github.com/butlanys/Open-AutoGLM-Android.git
cd Open-AutoGLM-Android
./gradlew assembleDebug- 下载并安装 Shizuku
- 按照 Shizuku 说明启动服务(无线调试或 Root)
- 打开本应用,授予 Shizuku 权限
在应用设置页面配置 API 信息:
| 配置项 | 值 |
|---|---|
| API 地址 | https://open.bigmodel.cn/api/paas/v4 |
| 模型名称 | autoglm-phone |
| API Key | 在 智谱开放平台 申请 |
| 配置项 | 值 |
|---|---|
| API 地址 | https://api-inference.modelscope.cn/v1 |
| 模型名称 | ZhipuAI/AutoGLM-Phone-9B |
| API Key | 在 ModelScope 申请 |
本应用支持任何具有图像输入能力且兼容 OpenAI API 格式的模型。
如果你想使用其他模型(如 Claude、Gemini、通义千问等),可以使用 CLIProxyAPI 进行 API 格式转换:
# 使用 CLIProxyAPI 将其他模型 API 转换为 OpenAI 兼容格式
# 然后将转换后的地址填入本应用的 API 设置中兼容的模型要求:
- ✅ 支持图像输入(Vision 能力)
- ✅ 支持 OpenAI Chat Completions API 格式
- ✅ 支持流式响应 (SSE)
- 确保 Shizuku 运行且已授权
- 在设置页配置 API
- 在主页输入任务,例如:
- "打开微信搜索附近美食"
- "打开淘宝搜索无线耳机"
- "打开设置调整屏幕亮度"
- "帮我发一条朋友圈"
- 点击开始执行
| 操作 | 说明 |
|---|---|
Launch |
启动应用 |
Tap |
点击屏幕坐标 |
Type |
输入文本 |
Swipe |
滑动手势 |
Back |
返回键 |
Home |
回到桌面 |
Long Press |
长按 |
Double Tap |
双击 |
Wait |
等待指定时间 |
Take_over |
请求人工接管 |
app/src/main/java/com/autoglm/android/
├── action/ # Action 解析与执行
├── agent/ # Agent 核心逻辑 (PhoneAgent)
├── config/ # 配置 (系统提示词、应用包名等)
├── data/ # 数据持久化 (DataStore)
├── device/ # 设备控制 (截图、点击、滑动等)
├── model/ # AI 模型客户端
├── service/ # 前台服务
├── shizuku/ # Shizuku 集成 (UserService)
└── ui/ # Jetpack Compose UI
- 所有敏感操作(支付、删除等)需要用户手动确认
- 本应用不会上传任何个人数据
- 截图仅用于 AI 分析,不会存储或传输到第三方
- API Key 仅存储在本地设备
本项目仅供学习研究使用。
- Open-AutoGLM - 原始项目
- Shizuku - Shell 权限框架
- scrcpy - 屏幕捕获技术参考 (Apache License 2.0)
- CLIProxyAPI - API 转换工具





