# Coding Agent打通了桌面、iPhone 和 Pixel

*当一个coding agent把我的桌面、iPhone 和 Pixel 连成一个工作闭环时，移动开发第一次变得无比丝滑。*

- 作者: Feitong Yang (https://www.feitong.phd/about)
- 发布日期: 2026-05-16
- 原文链接: https://www.feitong.phd/zh/essays/the-power-of-multi-device-connection-zh
- 主题: ai

---
<Figure size="wide">
  <FigureImage src="/images/mobile-desktop-agent.jpg" alt="mobile-desktop-agent-connection" />
</Figure>


过去两年里，从Cursor，到Claude Code，到Codex，我每天都在用coding agents，我甚至还亲手参与做过一个桌面端的通用 AI agent。<Marginnote>总有一天，我会把这个故事写得更详细一些</Marginnote> 我毫不怀疑它们会改变软件工程，但即便它们有了这么强的能力，我还是一直觉得哪里不对。

问题不在于智能本身，而在于交互体验上。我依然只能在桌面端的IDE或终端里和这些AI交互。对我来说这当然能用，但我始终觉得少了点什么。

今天下午，我对这个交互问题有了新的认识。

下午我正在桌面上用 Zed 和 Claude Code 开发一个移动应用，但整个开发流程非常繁重。我一直在反复经历两个痛点。第一，如果我想让 Claude Code 看一眼我 iPhone 上的某个界面，我得先截图，再把截图弄回桌面，然后喂给当前 session。第二，对着手机跑 `flutter run` 会把我的电脑拖得很卡。CPU 飙升，内存上涨，整台机器都变得迟钝起来。我以为这些都是“必要的移动开发的代价”。

然后我一转头，看到坐在旁边的Q姐正在用 Codex 开发她自己的移动app。

我问她：“开发移动app是不是很麻烦？”

“不会啊，”她说，“我的 Codex 会直接丢给我一个文件让我安装，然后我就能看到新版本了。”

“什么？”

“其实现在连安装文件都不用了，”过一会儿她说，“我让 Codex 在 app 里加了一个按钮，所以它做完之后我只要点一下 update，就能拿到新版本。”

我当时完全没听懂，于是站起来，走过去，想看看她到底在说什么。

结果新版本就在那里。她的app已经更新了，屏幕上还多了一个新的数据可视化界面。很漂亮。她不知道什么是 `flutter run`。她不懂 Flutter，也不懂 Kotlin 或 Swift。她根本不用去想 build system、package manager，或者设备部署这些事情。她只是在手机上截了一张别的 app 的图，发给 Codex，描述了一下自己想把数据呈现成什么样，然后按下回车。几分钟之后，Codex 告诉她按一下 update，新的界面就已经在那里了。

这对我来说，简直像魔法一样。

Q姐完全不懂技术，可她迭代一个移动 app 的速度却比我还快，而且几乎绕开了我过去两天一直在忍受的所以痛点。虽然她一行代码都不理解，但说到底，我自己也一行代码都不理解，因为我也没学过flutter。

我突然意识到，把手机连接Coding Agent不仅仅是一个便利的功能，这可能是交互体验上根本的巨大的改变。

于是我决定自己也体验一下，结果发现的确一旦桌面和手机被连进同一个工作 session 里，整个开发闭环的形状就变了。

我在桌面上开着一个 session，同时连上了两台手机：一台 iPhone，一台 Pixel。我可以从任意一台手机上发消息，这个 session 会在我的桌面上执行代码。更重要的是，同一个 session 还可以同时把最新版的 iPhone 版本和Android 版本同时送到两台手机上。

每一轮迭代结束时，我只需要直接看着两个屏幕上的 app。如果我不喜欢某个地方，我可以直接在手机上截图，然后告诉 agent 到底哪里不对。如果我想检查代码，或者更仔细地看日志，我就转回桌面。如果我离开键盘之后还想继续这段对话，我也可以直接用手机。上下文始终都在：同一个 session，同一条线程，同一个智能体，和我一起在不同设备之间流动。现在开发过程中的限制只有我的想象力、我的审美、我表达需求的能力，以及很现实的，token 用量。整个闭环顺滑到像呼吸一样。

对我来说，这才是那种跨多个设备运作的智能真正强大的地方。

手机上能聊天早就不新鲜了。但一台手机可以控制我的桌面，而通过桌面，它还可以进一步协同另一台手机，这就很有意思了。截图、构建、界面反馈、运行时行为，以及编码上下文，都在同一个流里移动。我不需要再手动把东西从一个地方搬到另一个地方。我也不需要每次切换设备时都重新建立上下文。这个智能本身已经替我把这些都带着走了。

我所有的设备都连在了一起，被同一个智能体协调着。这才是让我觉得新鲜的地方。

我觉得这指向了 AI agents 的一个更大未来。不只是更好的聊天界面，也不只是更好的代码生成，而是一种更好的跨终端体验：智能可以自然地在我们已经在使用的设备之间流动，让它们真的像一个系统那样工作。

