“不是没需求,是你的产品没有把需求释放出来。”
文丨祝颖丽
编辑丨赵磊
谭少卿曾是一家新三板上市公司的创始合伙人。在那家公司,他做了十年安卓 OS 生态的产品交互与商业化,累计服务超过六亿用户。
2025 年 7 月,他离开了这家公司,以一折的价格清掉了绝大部分股权——“约等于净身出户”。
走的那天,所有朋友都说他的状态不一样了。谭少卿的描述是,“我直接感觉自己回到了 20 岁。” 他是 80 后,王小波说很多人过了 20 岁觉得世界都在捶你;他说,20 岁的感觉是可以爆锤这个世界。
去年 10 月,他正式创立了 Floatboat——一个 all in one 的 agent Workspace 客户端产品。目前,这个 7 人团队拿到了红杉中国 200 万美元的 Safe 投资,即将开启新一轮融资。
区别于目前 AI 应用市场上主流的网页产品,客户端非常少见,常被认为是一种过时的形态。谭少卿的判断是,AI 时代的办公环境,不应该是一个网页聊天框,而应该是一个真正的、原生的操作系统级入口。而这个入口,是从原有的办公环境中自然生长出来的,所以他把日常办公最常用的文件管理器、浏览器和 AI 对话框集成在一起,agent 能在电脑办公的时候无感学习用户的工作模式。
很多用户使用 AI 产品的痛点是,面对一个简单的对话框,很难说清楚自己的需求。谭少卿认为,“产品设计决定用户需求。你产品做成什么样子,用户才会把需求释放成什么样。”Floatboat 的交互基于这个理念,“你的上下文管理就是文件夹的管理,就是浏览器标签页的管理。不需要想着写一个什么 prompt,不需要上传下载。”
在所有人都强调 AI 智能水平的当下,产品交互某种程度上被忽视了。正如微软曾改变了人机交互的模式,AI 时代也会有完全不同于互联网的交互范式,尤其对于应用创新,交互变得前所未有的重要。这就是谭少卿看到的差异化机会。
他甚至想在未来建立一个人机协同的 agent 网络,将人从有限的劳动时间中解放出来。但首先,他需要让自己的产品更好用,“你只有自己先做,并且要做大,之后人家才愿意去接入,去兼容”。
非共识的交互、记忆
打开 Floatboat,迎面而来的是一种熟悉感。左边是一个几乎和 MacOS Finder 一模一样的文件管理器,中间是内置的浏览器,默认打开 Google,最右边是现在普遍的像 ChatGPT 一样的 AI 对话框。三个页面拼接似的占满屏幕,三种功能就是每个白领的日常。
我试用了大约一周,在使用的便利性和产出的质量上,表现都很不错。你可以同时打开几十个文件夹,随意切换;可以选中三个文件直接拖进对话,让 agent 分析这三个文件的关联;可以在中间打开任意网页内容,把结果一拖就存到文件夹里,也可以直接在内置编辑器里改文档——改了哪一句,agent 也知道。
谭少卿解释这种设计最核心的原因是——Web 端的 agent 只能感知到你上传的东西和输入的 prompt,但感知不到其他环境。而每个人有很多隐性知识——沉淀在历史文件里、沉淀在操作行为里。“你在一张图上勾了一下,在编辑器里又改了几段话,或者你想要某个特别的风格,这些都很难用语言简单描述出来。只有桌面客户端才能感知到这些。”
他带着这些想法去找投资时,大家普遍表示不理解——多数的质疑是:软件的世界明明是从 Software 到 SaaS 再到 agent,你为什么又回去做客户端?你做垂直闭环到某一个具体职业的 agent 不好吗?隐私怎么办?
这也是他认为 Claude Code 能流行起来的一个重要原因——不仅编程能力本身够强,交互设计也很重要,“Claude Code 从 terminal 切入,是非侵入式的,不需要替换你原来的 IDE,我认为这是人机交互上的一个切入点”。
“等 Cowork 一发、OpenClaw 一发,你会发现一夜之间成赛道了。没一个人再问那些问题了。” 他说,“比起范式,我们首先关心的有哪些问题要解决,要如何解决。”
Floatboat 有一个叫 Combo Skills 的功能。当你和 agent 完成了一个满意的任务——比如按你的风格写了一篇文章,或者做了一份 PPT——可以点一下 “整理为 Combo Skill”,agent 就会把这次对话中沉淀的经验、风格偏好和流程凝练成一个可复用的技能包。下次你发起一个新任务时,系统会自动推荐相关的 Skill——你点一下就加载了,拖进来也行。
Combo Skills 可以自己创建,也可以在 Floatboat 的市场上下载别人做好的,不需要配置繁琐的 API,Floatboat 作为运行环境已经内置服务了。
这其中包含了谭少卿对 “记忆” 这件事的独特理解。“memory 这个词被用烂了。” 他说,“用户身份和偏好的存储与提取,用户审美的存储与提取,或者说某个模板的存储与提取——这些词才是更有表达力的。如果笼统地把一切都叫 memory,这个词就劣化掉了。”
更深层的问题出在严肃办公场景中。谭少卿发现,自动引入的 “记忆” 有时反而是干扰——明明在讨论一个很严肃的问题,但它有时候会莫名其妙把一个完全不相关的东西引入进来。
Floatboat 在做记忆上选择了另一种路,给记忆分层:先把显性可控的记忆做好——Combo Skills 就是可以主动调用、编辑和更新的结构化经验;至于更隐性的记忆能力,他们 “正在调整,调整完会放出来”,但前提是达到足够的可用度。
类似的 “非共识” 也体现在他对 agent 自主性的态度上。OpenCaw 定义的 “心跳机制”——agent 定期自动扫盘、主动执行任务——被很多人视为下一代 agent 的标志性能力,但谭少卿对此持警惕态度,他认为这种行为对用户的很多需求并不必要,也不安全,更重要的是 token 消耗量过大,往往没有太大的实际价值。
他认为,那种需要人提前定义规则、让 agent 按时执行的 “心跳”,不够友好。真正的自主性应该是 agent 学习到你的操作行为,洞察到你的重复性工作——“比如我每天要看一些新闻、搜索一些东西、然后做产品分析、启发创新点、Agent 写代码出 demo 等等,或者把某些人的 Twitter 转成播客发给我——它自己学到,而不是我教它怎么做。”
“小老虎不是猫”
谭少卿对 Floatboat 的规划,远不止于一款生产力工具。他将当前产品视为 1.0 版本,接下来要做的是一个 agent 协同办公网络。
在这个网络里,每个人的 agent 都可以 “出去干活”,agent 基于主人的本地上下文——历史文件、已有的 Skills 等——来工作,但隐私由主人控制。这个想法的前提是,agent 真的能学会主人的工作习惯、审美、know-how,并有一个 agent 原生的通信网络,能让大量的 Agent 以巨大的带宽互通。
更远处,谭少卿把这个网络视为 “agentOS 的雏形”。他认为,现有的 IM 产品不是为 agent 原生设计的,“你要考虑人,又要考虑 agent 本身的需求”。比如 agent 对上下文的需求、对管理的需求、对协同的需求,每一个都是巨大的课题。
2023 年初,GPT-4 发布前后,谭少卿做了第一版多 agent 协作的 Demo,在即刻上,他也 mark 了自己当时的判断:“工具还是很拉胯。” 去年 4 月,他在公众号上发表了一篇名为《与万物对话》的文章,详细设计了一套 ChatOS 的概念——每个人都有自己的 ChatOS,不同的 agent 可以在群聊中协同完成任务。
“我发这些东西是为了今天用的。” 他笑着说,“证明我们不是炒热点,是有我们自己的持续思考和实践的。” 他形容 Floatboat 与其他 Cowork 产品的区别,“小老虎看起来跟小猫咪没什么区别,但几个月后就不一样了。老虎不是猫。”
不过当前他也面临一些抉择。作为一个生产力工具,Floatboat 是一个产出质量不错、但收费不算便宜的产品,优化成本、推广产品,可能是常规更有确定性的路径,但对谭少卿来说,他觉得更重要的是把精力放在更有颠覆性、更能 scale 的事情上——推高产品能力的上限是第一优先级,商业化放在次位,把 agent 协同办公网络搭建起来是最重要的事情。
这番话背后,是他对这件事量级的判断。客户端只是切入点,终局是 agentOS——一个为 agent 原生设计的操作系统级平台,“这件事情足够壮丽”。
为完整呈现创业者的思考和个人特点,以下为筛选编辑后的部分问答:
晚点:ClaudeCode 和 OpenClaw 的出现,对你来说验证了什么?
谭少卿:两件事。第一,AI 的编程能力确实足够强了。一切可编程的,都可以被编程解决。第二,更反常识的——它验证了人机交互的重要性。很多人认为 Claude Code 能起来是仅仅因为 agent 设计得好,模型编程能力强,但在我看来,对比 cursor,更重要的一面是它从 terminal 切入、非侵入式的设计。你的 IDE 不用换,在 terminal 里就能用——这是交互设计上的一次切入。
晚点:所以你说 “产品设计决定用户需求”,具体怎么理解?
谭少卿:举个例子,大家用 OpenClaw 的时候,几乎没人频繁用 skills,为什么?因为不好用,你得记住那个 skill 叫什么名字,然后在对话里敲字去调用。否则安装很多 skills 之后、上下文一长,触发就很不稳定。但在我们这里,你选中一个文件,下面就给你推荐了相关的 skill,你点一下就加载了,拖进来也行——当你把这个交互做得足够直观,用户自然就释放出这种需求了。如果你做的这个交互门槛很高,用户就不用。然后你还说 “没有需求”——不是没需求,是你的产品没有把需求释放出来。
晚点:那你的产品界面长现在这样——文件管理器、浏览器,背后对用户的需求洞察是什么?
谭少卿:做成对话框的问题是,适配的人和任务类型太窄了。工具类产品最好不要在用户已有的高速路上变道,但可以带着原地起飞,起飞就需要有衔接点。你们平时工作流转的是什么?是文件。你深度搜索完一个 PDF,还有新任务要干,还有录音要转,还要对比稿子,还有发布——这些任务之间流转的都是文件。我们把整个电脑的文件管理器和浏览器,作为 agent 的运行环境,意思就是:你管理文件夹就是在管理上下文,打开哪些标签页就是在管理任务线索,不需要再想着怎么给 agent 喂材料。
晚点:你做了一个独立客户端来模拟 Finder + 浏览器,但如果操作系统厂商自己做了这件事,你怎么应对?
谭少卿:这个问题很早也有人问过。首先,我们可以回顾一下,在软件时代和 SaaS 时代,我们是否能找到一款百亿美金以上的产品,跟巨头是完全没交集的?实际上你会发现巨头基本都有对应的产品。但为什么这些 “第三方” 的产品不仅存在,发展得还不错呢?其中一个关键点是 “开放中立生态位” 本身是成立的。原因很复杂,但我们能看到这个事实就够了。巨头做什么,对我们来说这并不是一个风险,这是一个客观事实。创业者需要做的第一步是找到自己的生态位。
晚点:你把文件管理器和浏览器的内容都作为 agent 的上下文,token 成本应该远高于普通聊天产品。现在定价方式是什么?用户觉得贵吗?
谭少卿:其实并不是每次都把所有上下文给 Agent,中间有大量精细化的优化,而且空间依旧很大。关键是判断哪些优化能放大未来模型能力,哪些短期有效但 ROI 不高。
定价上,我们一开始就想尝试 Costco 的模式,也在探索按结果付费。现在是按 credits 收费,因为我们包装了大量开箱即用的服务。同时我们发布了 “用户体验保障计划”——如果你对结果不满意,可以申请退换积分,类似电商的退换服务。这个设计也是给团队一个压力,强迫我们把动作聚焦在价值提升上。
晚点:你反复强调人机交互,为什么觉得它是现在最重要的事?
谭少卿:智能已经极大程度地涌现了,但我们人主要是通过这两只眼睛、一张嘴巴去跟它交互的——我们的带宽很低,算力也很低。你面对这些庞杂的信息和生产力的时候,怎么处理、怎么协同?这本质上就是人机交互的问题。所以我选的东西,一定是既要 agent 用得爽,人也要用得爽——agent-First,Human-Centered。
晚点:你不光想做生产力工具,还要做一个 agent 协作网络,为什么 agent 需要一个网络?
谭少卿:因为 agent 跟人不一样,人跟人之间的沟通带宽太小了……但是 agent 与 agent 之间带宽是极大的。你会发现现有并没有一个什么 agent 协同的东西出来。大家还停留在很初级的阶段——给你发个任务就觉得是协同了,在 IM 里发个消息就开心坏了。这个带宽依然是极低的。但在群里,这个人跟 agent, 或者 agent 跟 agent, 他就可以协同把这个事给办了,我们不需要实时在线去介入,就是我们要把人从自己的劳动时间有限这件事情里面解放出来。
晚点:你说每个人的 agent 可以 “出去干活”。具体怎么出去?agent 之间可以交换什么数据?隐私如何保障?
谭少卿:我们开源了为多 Agent、多人之间交换数据的 selfware 协议。它是一个自包含、数据自有、自进化的数据包。不像传统的文件格式比如 docx、ppt、pdf,交换的都是最终结果。在这个文件里边,你可以交换文件的最终数据,但也可以包含在迭代过程中的关键决策、版本信息、以及用到的 skills 和外部插件,甚至是文件本身只需要传递一次就能不断更新。更重要的,它不依赖某一个特定的软件。
而中间的隐私、权限,都是留给人自己可以做决策的,或者你交给自己的 Agent 做决策也可以。巨头要绑定自己的生态,并不是完全用户体验优先的,而我们只是跟众多的 OPC、消费者等用户以及创业者一起共建生态。换句话说,巨头的花园有自己的篱笆,而旷野的风景更为广阔。
晚点:那为什么第一步是先做这个客户端的生产力工具?
谭少卿:如果我们不自己构建一个足够强的执行能力的 agent, 这个网络是不成立的。因为这个网络你完全去兼容其他第三方的东西,这个事是没谱的,几乎所有的网络效应的东西,都是你只有自己先做,并且要做大,之后人家才愿意去接入,去兼容。
题图来源:Floatbot 创始人谭少卿