AI 原生产品和普通加了大模型的产品，核心差别是什么？

核心差别在于是否围绕真实任务、结构化记忆和可执行动作重构产品，而不是只把模型嵌到原有输入输出界面里。

产品经理定义 AI 需求时最容易犯什么错？

最常见的错是把模型能力清单当成需求清单，只关注“模型会什么”，却没有提前定义答案形态、可执行边界和状态变化结果。

AI 原生产品的需求该怎么定义？

李想在《罗永浩的十字路口》第 27 期里，用了一个词批评市面上大多数车机的 AI 记忆功能：「Markdown 熵增」。意思是：系统把用户说过的话、聊过的天，原样存成一段段文本，越积越多，越用越乱。表面上 AI "记住了你"，实际上它只是在维护一个没有结构的垃圾堆。用户真正的偏好，比如「我老婆怕冷」「我家孩子晕车」，被淹在几千条聊天历史里，下次照样要重新交代。

这不只是汽车的问题。打开市面上大多数号称有"AI 能力"的产品，你会发现它们在做同一件事：把语言模型的输入输出界面嵌进去，叫它 AI 摘要、AI 续写、AI 助手，然后在参数表上打勾。能力清单越来越长，用户实际记得用的功能越来越少。这是 AI 原生产品的一个普遍病——把"模型能做"当成"用户要"，把功能上线当成需求满足。

李想在播客里给出了他对车机 AI 的五个真实需求定义：泛化任务、泛化信息获取、精确控制、信息记录、个性化。这个分类不是在说车，是在说一个 AI 原生产品应该解决什么问题。把它从车机场景脱钩，抽象成框架，正好能用来检验 PM 自己负责的 AI 功能到底做没做到位。下面逐条拆，并且每条附上自检问题。

一、泛化任务

李想的语境是：让 AI 帮用户完成一件具体的事，比如订餐厅、规划行程、发一条消息。不是聊天，是办事。

这条听起来简单，但它划出了一条 PM 经常视而不见的线：chatbot 和 agent 的边界。

Chatbot 的终态是"给了一个回答"，agent 的终态是"世界上多了一个被改变的状态"——一条订单、一份文件、一个被修改的日历事件。用户说「帮我约一下周五的会」，chatbot 会告诉你怎么操作，agent 会直接发出去。

PM 在做 AI 功能时最容易停在 chatbot 这一层，因为它开发成本低、风险可控（AI 给错了顶多用户自己改），而 agent 要接系统权限、处理异常、做确认机制，整个链路复杂得多。但用户真正愿意高频使用的，是真的帮他「完成了一件事」的功能，不是「提供了一段建议」的功能。

自检问题： 用户用完你的 AI 功能之后，有没有一个状态被改变了？如果答案是"没有，用户还需要自己再操作一步"，你做的是 chatbot 包装，不是泛化任务。

二、泛化信息获取

李想举的例子是查天气、查路况。从开放信息空间拿一个具体答案。他还特别提到，这类任务用本地算力处理、秒级响应，效果比调云端大模型更好，也省 token。

这条需求的陷阱，和第一条相反。第一条是 PM 不敢做太多，第二条是 PM 做过头了。

用户问"现在几度"，他要的是一个数字。大多数 AI 产品给的是：「当前北京气温为 18°C，体感温度约 16°C，建议穿薄外套，今日紫外线指数为 3，属于中等强度……」这不是回答，这是让用户再次阅读负担。

问题出在 RAG 和搜索的召回结果被原样喂给语言模型生成回复，没有人在中间定义「答案的形态应该长什么样」。信息获取类需求，答案形态要匹配用户的认知带宽。一个数字、一句话、一张表，三种形态，PM 要提前定义好，而不是让模型自由发挥。

自检问题： 你的 AI 给出的答案，格式是写死的还是由模型决定的？如果是模型决定的，用户有没有可能在拿到答案之前要先看完三段话？

三、精确控制

这条在车机场景里的例子是：用语音把温度调到 23 度、关上右后车窗。听起来是很小的操作，但李想强调的重点在于：AI 在这里要比传统 UI 更精确，不是更模糊。

自然语言输入本质上是模糊的。PM 做语音或对话式操作时，经常犯的错误是：用户说「开暖一点」，系统不知道开多少，就随机调个值，或者反问「您要调到多少度」——这比直接戳一下屏幕按钮还烦。

精确控制这条需求，技术上的解法是 Function Calling 和 Tool Use。把用户的自然语言输入映射到一个有明确参数的函数调用，让模糊输入对应确定动作。做到的前提，是 PM 把「用户可能要控制的所有实体和参数」提前穷举出来，定义成工具集，模型才有东西可以调用。这件事不能交给模型自己猜，PM 要主动设计。

自检问题： 同一句话说十次，AI 给出的操作结果是否一致？如果不一致，你的精确控制没有做完。

四、信息记录

李想的原话大意是：车主真正想让系统记住的，是「我老婆怕冷、我孩子晕车」这类结构化偏好，而不是完整的对话历史。把聊天记录直接装进数据库，不是记忆，是懒。这也戳到了大量 AI 产品的要害。

现在很多产品的"AI 记忆"实现方式，是把上下文窗口撑大，或者把历史对话存进向量数据库做检索。这两个技术方案本质上都是「存文本、查文本」，没有提取结构。用户三个月前说过「我不喜欢发会议纪要给全组，只发给相关人」，下次他还得重新说，因为系统记住的是那句话，不是那个偏好。

真正的信息记录，是在对话过程中主动识别和抽取用户的偏好、习惯、背景，写入结构化存储，而不是把原始对话堆起来。这需要 PM 定义：什么信息值得被记、以什么结构存、什么时候触发提取、存错了怎么让用户纠正。

这四个子问题，任何一个没想清楚，记忆功能就是「Markdown 熵增」的另一种实现。

自检问题： 用户三个月后回来，你的系统能说出他三件具体的偏好吗？如果不能，你存的是历史，不是记忆。

五、个性化

个性化排在最后，因为它是前一条「信息记录」的输出端。没有结构化记录，个性化就是空话。

李想的表述是：基于记录下来的偏好，主动调整服务，不要每次都让用户重新交代。

目前市面上"个性化"最常见的实现是：用户头像 + 名字 + 历史购买记录驱动的推荐算法。这是移动互联网时代的个性化，不是 AI 原生产品的个性化。

AI 原生产品的个性化应该体现在交互层面：同一个问题，系统根据这个用户的背景给出不同深度的回答；同一个任务，系统根据这个用户的操作习惯选择不同的执行路径。把这个功能给另一个用户用，体验应该明显不同。如果换个人用感觉一模一样，个性化是假的。

自检问题： 把你的 AI 功能交给两个截然不同的用户，三个月后，他们的使用体验会有显著差异吗？如果没有，个性化没有真正发生。

结尾：一张自检表

李想那句「Markdown 熵增」批评的不是 AI 技术本身，是产品定义的懒惰。把模型能力直接暴露给用户，让用户自己想怎么用，叫它 AI 功能——这是最省力的做法，也是最没有价值的做法。

五条需求是有依赖关系的。个性化依赖信息记录，信息记录依赖精确控制，精确控制依赖任务和信息获取的边界定义清楚。如果个性化做不起来，大概率是信息记录没做；如果信息记录做不起来，大概率是没有人定义过「什么信息值得记、以什么结构存」。拿出你负责的 AI 功能，对着下面这张表打勾：

五条全部打到"已做"，是真正意义上的 AI 原生产品。大多数产品现在能打到两三条就不错了。

找出第一个"未做"的位置，它就是下一个迭代最值得投入的地方。

AI 原生产品的需求该怎么定义？

核心摘要

一、泛化任务

二、泛化信息获取

三、精确控制

四、信息记录

五、个性化

结尾：一张自检表

常见问题

AI 原生产品和普通加了大模型的产品，核心差别是什么？

产品经理定义 AI 需求时最容易犯什么错？

继续阅读

AI 时代 PM 如何不被替代？

OpenClaw 小龙虾真的要凉了吗？

别盲目跟风，用好OpenClaw 的底层逻辑

产品方法论专题