“人类的带宽太低、算力也低”，agent 可以替人去工作

“不是没需求，是你的产品没有把需求释放出来。”

文丨祝颖丽

编辑丨赵磊

谭少卿曾是一家新三板上市公司的创始合伙人。在那家公司，他做了十年安卓 OS 生态的产品交互与商业化，累计服务超过六亿用户。

2025 年 7 月，他离开了这家公司，以一折的价格清掉了绝大部分股权——“约等于净身出户”。

走的那天，所有朋友都说他的状态不一样了。谭少卿的描述是，“我直接感觉自己回到了 20 岁。” 他是 80 后，王小波说很多人过了 20 岁觉得世界都在捶你；他说，20 岁的感觉是可以爆锤这个世界。

去年 10 月，他正式创立了 Floatboat——一个 all in one 的 agent Workspace 客户端产品。目前，这个 7 人团队拿到了红杉中国 200 万美元的 Safe 投资，即将开启新一轮融资。

区别于目前 AI 应用市场上主流的网页产品，客户端非常少见，常被认为是一种过时的形态。谭少卿的判断是，AI 时代的办公环境，不应该是一个网页聊天框，而应该是一个真正的、原生的操作系统级入口。而这个入口，是从原有的办公环境中自然生长出来的，所以他把日常办公最常用的文件管理器、浏览器和 AI 对话框集成在一起，agent 能在电脑办公的时候无感学习用户的工作模式。

很多用户使用 AI 产品的痛点是，面对一个简单的对话框，很难说清楚自己的需求。谭少卿认为，“产品设计决定用户需求。你产品做成什么样子，用户才会把需求释放成什么样。”Floatboat 的交互基于这个理念，“你的上下文管理就是文件夹的管理，就是浏览器标签页的管理。不需要想着写一个什么 prompt，不需要上传下载。”

在所有人都强调 AI 智能水平的当下，产品交互某种程度上被忽视了。正如微软曾改变了人机交互的模式，AI 时代也会有完全不同于互联网的交互范式，尤其对于应用创新，交互变得前所未有的重要。这就是谭少卿看到的差异化机会。

他甚至想在未来建立一个人机协同的 agent 网络，将人从有限的劳动时间中解放出来。但首先，他需要让自己的产品更好用，“你只有自己先做，并且要做大，之后人家才愿意去接入，去兼容”。

非共识的交互、记忆

打开 Floatboat，迎面而来的是一种熟悉感。左边是一个几乎和 MacOS Finder 一模一样的文件管理器，中间是内置的浏览器，默认打开 Google，最右边是现在普遍的像 ChatGPT 一样的 AI 对话框。三个页面拼接似的占满屏幕，三种功能就是每个白领的日常。

我试用了大约一周，在使用的便利性和产出的质量上，表现都很不错。你可以同时打开几十个文件夹，随意切换；可以选中三个文件直接拖进对话，让 agent 分析这三个文件的关联；可以在中间打开任意网页内容，把结果一拖就存到文件夹里，也可以直接在内置编辑器里改文档——改了哪一句，agent 也知道。

谭少卿解释这种设计最核心的原因是——Web 端的 agent 只能感知到你上传的东西和输入的 prompt，但感知不到其他环境。而每个人有很多隐性知识——沉淀在历史文件里、沉淀在操作行为里。“你在一张图上勾了一下，在编辑器里又改了几段话，或者你想要某个特别的风格，这些都很难用语言简单描述出来。只有桌面客户端才能感知到这些。”

他带着这些想法去找投资时，大家普遍表示不理解——多数的质疑是：软件的世界明明是从 Software 到 SaaS 再到 agent，你为什么又回去做客户端？你做垂直闭环到某一个具体职业的 agent 不好吗？隐私怎么办？

这也是他认为 Claude Code 能流行起来的一个重要原因——不仅编程能力本身够强，交互设计也很重要，“Claude Code 从 terminal 切入，是非侵入式的，不需要替换你原来的 IDE，我认为这是人机交互上的一个切入点”。

“等 Cowork 一发、OpenClaw 一发，你会发现一夜之间成赛道了。没一个人再问那些问题了。” 他说，“比起范式，我们首先关心的有哪些问题要解决，要如何解决。”

Floatboat 有一个叫 Combo Skills 的功能。当你和 agent 完成了一个满意的任务——比如按你的风格写了一篇文章，或者做了一份 PPT——可以点一下 “整理为 Combo Skill”，agent 就会把这次对话中沉淀的经验、风格偏好和流程凝练成一个可复用的技能包。下次你发起一个新任务时，系统会自动推荐相关的 Skill——你点一下就加载了，拖进来也行。

Combo Skills 可以自己创建，也可以在 Floatboat 的市场上下载别人做好的，不需要配置繁琐的 API，Floatboat 作为运行环境已经内置服务了。

这其中包含了谭少卿对 “记忆” 这件事的独特理解。“memory 这个词被用烂了。” 他说，“用户身份和偏好的存储与提取，用户审美的存储与提取，或者说某个模板的存储与提取——这些词才是更有表达力的。如果笼统地把一切都叫 memory，这个词就劣化掉了。”

更深层的问题出在严肃办公场景中。谭少卿发现，自动引入的 “记忆” 有时反而是干扰——明明在讨论一个很严肃的问题，但它有时候会莫名其妙把一个完全不相关的东西引入进来。

Floatboat 在做记忆上选择了另一种路，给记忆分层：先把显性可控的记忆做好——Combo Skills 就是可以主动调用、编辑和更新的结构化经验；至于更隐性的记忆能力，他们 “正在调整，调整完会放出来”，但前提是达到足够的可用度。

类似的 “非共识” 也体现在他对 agent 自主性的态度上。OpenCaw 定义的 “心跳机制”——agent 定期自动扫盘、主动执行任务——被很多人视为下一代 agent 的标志性能力，但谭少卿对此持警惕态度，他认为这种行为对用户的很多需求并不必要，也不安全，更重要的是 token 消耗量过大，往往没有太大的实际价值。

他认为，那种需要人提前定义规则、让 agent 按时执行的 “心跳”，不够友好。真正的自主性应该是 agent 学习到你的操作行为，洞察到你的重复性工作——“比如我每天要看一些新闻、搜索一些东西、然后做产品分析、启发创新点、Agent 写代码出 demo 等等，或者把某些人的 Twitter 转成播客发给我——它自己学到，而不是我教它怎么做。”

“小老虎不是猫”

谭少卿对 Floatboat 的规划，远不止于一款生产力工具。他将当前产品视为 1.0 版本，接下来要做的是一个 agent 协同办公网络。

在这个网络里，每个人的 agent 都可以 “出去干活”，agent 基于主人的本地上下文——历史文件、已有的 Skills 等——来工作，但隐私由主人控制。这个想法的前提是，agent 真的能学会主人的工作习惯、审美、know-how，并有一个 agent 原生的通信网络，能让大量的 Agent 以巨大的带宽互通。

更远处，谭少卿把这个网络视为 “agentOS 的雏形”。他认为，现有的 IM 产品不是为 agent 原生设计的，“你要考虑人，又要考虑 agent 本身的需求”。比如 agent 对上下文的需求、对管理的需求、对协同的需求，每一个都是巨大的课题。

2023 年初，GPT-4 发布前后，谭少卿做了第一版多 agent 协作的 Demo，在即刻上，他也 mark 了自己当时的判断：“工具还是很拉胯。” 去年 4 月，他在公众号上发表了一篇名为《与万物对话》的文章，详细设计了一套 ChatOS 的概念——每个人都有自己的 ChatOS，不同的 agent 可以在群聊中协同完成任务。

“我发这些东西是为了今天用的。” 他笑着说，“证明我们不是炒热点，是有我们自己的持续思考和实践的。” 他形容 Floatboat 与其他 Cowork 产品的区别，“小老虎看起来跟小猫咪没什么区别，但几个月后就不一样了。老虎不是猫。”

不过当前他也面临一些抉择。作为一个生产力工具，Floatboat 是一个产出质量不错、但收费不算便宜的产品，优化成本、推广产品，可能是常规更有确定性的路径，但对谭少卿来说，他觉得更重要的是把精力放在更有颠覆性、更能 scale 的事情上——推高产品能力的上限是第一优先级，商业化放在次位，把 agent 协同办公网络搭建起来是最重要的事情。

这番话背后，是他对这件事量级的判断。客户端只是切入点，终局是 agentOS——一个为 agent 原生设计的操作系统级平台，“这件事情足够壮丽”。

为完整呈现创业者的思考和个人特点，以下为筛选编辑后的部分问答：

晚点：ClaudeCode 和 OpenClaw 的出现，对你来说验证了什么？

谭少卿：两件事。第一，AI 的编程能力确实足够强了。一切可编程的，都可以被编程解决。第二，更反常识的——它验证了人机交互的重要性。很多人认为 Claude Code 能起来是仅仅因为 agent 设计得好，模型编程能力强，但在我看来，对比 cursor，更重要的一面是它从 terminal 切入、非侵入式的设计。你的 IDE 不用换，在 terminal 里就能用——这是交互设计上的一次切入。

晚点：所以你说 “产品设计决定用户需求”，具体怎么理解？

谭少卿：举个例子，大家用 OpenClaw 的时候，几乎没人频繁用 skills，为什么？因为不好用，你得记住那个 skill 叫什么名字，然后在对话里敲字去调用。否则安装很多 skills 之后、上下文一长，触发就很不稳定。但在我们这里，你选中一个文件，下面就给你推荐了相关的 skill，你点一下就加载了，拖进来也行——当你把这个交互做得足够直观，用户自然就释放出这种需求了。如果你做的这个交互门槛很高，用户就不用。然后你还说 “没有需求”——不是没需求，是你的产品没有把需求释放出来。

晚点：那你的产品界面长现在这样——文件管理器、浏览器，背后对用户的需求洞察是什么？

谭少卿：做成对话框的问题是，适配的人和任务类型太窄了。工具类产品最好不要在用户已有的高速路上变道，但可以带着原地起飞，起飞就需要有衔接点。你们平时工作流转的是什么？是文件。你深度搜索完一个 PDF，还有新任务要干，还有录音要转，还要对比稿子，还有发布——这些任务之间流转的都是文件。我们把整个电脑的文件管理器和浏览器，作为 agent 的运行环境，意思就是：你管理文件夹就是在管理上下文，打开哪些标签页就是在管理任务线索，不需要再想着怎么给 agent 喂材料。

晚点：你做了一个独立客户端来模拟 Finder + 浏览器，但如果操作系统厂商自己做了这件事，你怎么应对？

谭少卿：这个问题很早也有人问过。首先，我们可以回顾一下，在软件时代和 SaaS 时代，我们是否能找到一款百亿美金以上的产品，跟巨头是完全没交集的？实际上你会发现巨头基本都有对应的产品。但为什么这些 “第三方” 的产品不仅存在，发展得还不错呢？其中一个关键点是 “开放中立生态位” 本身是成立的。原因很复杂，但我们能看到这个事实就够了。巨头做什么，对我们来说这并不是一个风险，这是一个客观事实。创业者需要做的第一步是找到自己的生态位。

晚点：你把文件管理器和浏览器的内容都作为 agent 的上下文，token 成本应该远高于普通聊天产品。现在定价方式是什么？用户觉得贵吗？

谭少卿：其实并不是每次都把所有上下文给 Agent，中间有大量精细化的优化，而且空间依旧很大。关键是判断哪些优化能放大未来模型能力，哪些短期有效但 ROI 不高。

定价上，我们一开始就想尝试 Costco 的模式，也在探索按结果付费。现在是按 credits 收费，因为我们包装了大量开箱即用的服务。同时我们发布了 “用户体验保障计划”——如果你对结果不满意，可以申请退换积分，类似电商的退换服务。这个设计也是给团队一个压力，强迫我们把动作聚焦在价值提升上。

晚点：你反复强调人机交互，为什么觉得它是现在最重要的事？

谭少卿：智能已经极大程度地涌现了，但我们人主要是通过这两只眼睛、一张嘴巴去跟它交互的——我们的带宽很低，算力也很低。你面对这些庞杂的信息和生产力的时候，怎么处理、怎么协同？这本质上就是人机交互的问题。所以我选的东西，一定是既要 agent 用得爽，人也要用得爽——agent-First，Human-Centered。

晚点：你不光想做生产力工具，还要做一个 agent 协作网络，为什么 agent 需要一个网络？

谭少卿：因为 agent 跟人不一样，人跟人之间的沟通带宽太小了……但是 agent 与 agent 之间带宽是极大的。你会发现现有并没有一个什么 agent 协同的东西出来。大家还停留在很初级的阶段——给你发个任务就觉得是协同了，在 IM 里发个消息就开心坏了。这个带宽依然是极低的。但在群里，这个人跟 agent，或者 agent 跟 agent，他就可以协同把这个事给办了，我们不需要实时在线去介入，就是我们要把人从自己的劳动时间有限这件事情里面解放出来。

晚点：你说每个人的 agent 可以 “出去干活”。具体怎么出去？agent 之间可以交换什么数据？隐私如何保障？

谭少卿：我们开源了为多 Agent、多人之间交换数据的 selfware 协议。它是一个自包含、数据自有、自进化的数据包。不像传统的文件格式比如 docx、ppt、pdf，交换的都是最终结果。在这个文件里边，你可以交换文件的最终数据，但也可以包含在迭代过程中的关键决策、版本信息、以及用到的 skills 和外部插件，甚至是文件本身只需要传递一次就能不断更新。更重要的，它不依赖某一个特定的软件。

而中间的隐私、权限，都是留给人自己可以做决策的，或者你交给自己的 Agent 做决策也可以。巨头要绑定自己的生态，并不是完全用户体验优先的，而我们只是跟众多的 OPC、消费者等用户以及创业者一起共建生态。换句话说，巨头的花园有自己的篱笆，而旷野的风景更为广阔。

晚点：那为什么第一步是先做这个客户端的生产力工具？

谭少卿：如果我们不自己构建一个足够强的执行能力的 agent，这个网络是不成立的。因为这个网络你完全去兼容其他第三方的东西，这个事是没谱的，几乎所有的网络效应的东西，都是你只有自己先做，并且要做大，之后人家才愿意去接入，去兼容。

题图来源：Floatbot 创始人谭少卿