李想在《罗永浩的十字路口》第 27 期里,用了一个词批评市面上大多数车机的 AI 记忆功能:「Markdown 熵增」。意思是:系统把用户说过的话、聊过的天,原样存成一段段文本,越积越多,越用越乱。表面上 AI "记住了你",实际上它只是在维护一个没有结构的垃圾堆。用户真正的偏好,比如「我老婆怕冷」「我家孩子晕车」,被淹在几千条聊天历史里,下次照样要重新交代。
这不只是汽车的问题。打开市面上大多数号称有"AI 能力"的产品,你会发现它们在做同一件事:把语言模型的输入输出界面嵌进去,叫它 AI 摘要、AI 续写、AI 助手,然后在参数表上打勾。能力清单越来越长,用户实际记得用的功能越来越少。这是 AI 原生产品的一个普遍病——把"模型能做"当成"用户要",把功能上线当成需求满足。
李想在播客里给出了他对车机 AI 的五个真实需求定义:泛化任务、泛化信息获取、精确控制、信息记录、个性化。这个分类不是在说车,是在说一个 AI 原生产品应该解决什么问题。把它从车机场景脱钩,抽象成框架,正好能用来检验 PM 自己负责的 AI 功能到底做没做到位。下面逐条拆,并且每条附上自检问题。
一、泛化任务
李想的语境是:让 AI 帮用户完成一件具体的事,比如订餐厅、规划行程、发一条消息。不是聊天,是办事。
这条听起来简单,但它划出了一条 PM 经常视而不见的线:chatbot 和 agent 的边界。
Chatbot 的终态是"给了一个回答",agent 的终态是"世界上多了一个被改变的状态"——一条订单、一份文件、一个被修改的日历事件。用户说「帮我约一下周五的会」,chatbot 会告诉你怎么操作,agent 会直接发出去。
PM 在做 AI 功能时最容易停在 chatbot 这一层,因为它开发成本低、风险可控(AI 给错了顶多用户自己改),而 agent 要接系统权限、处理异常、做确认机制,整个链路复杂得多。但用户真正愿意高频使用的,是真的帮他「完成了一件事」的功能,不是「提供了一段建议」的功能。
自检问题: 用户用完你的 AI 功能之后,有没有一个状态被改变了?如果答案是"没有,用户还需要自己再操作一步",你做的是 chatbot 包装,不是泛化任务。
二、泛化信息获取
李想举的例子是查天气、查路况。从开放信息空间拿一个具体答案。他还特别提到,这类任务用本地算力处理、秒级响应,效果比调云端大模型更好,也省 token。
这条需求的陷阱,和第一条相反。第一条是 PM 不敢做太多,第二条是 PM 做过头了。
用户问"现在几度",他要的是一个数字。大多数 AI 产品给的是:「当前北京气温为 18°C,体感温度约 16°C,建议穿薄外套,今日紫外线指数为 3,属于中等强度……」这不是回答,这是让用户再次阅读负担。
问题出在 RAG 和搜索的召回结果被原样喂给语言模型生成回复,没有人在中间定义「答案的形态应该长什么样」。信息获取类需求,答案形态要匹配用户的认知带宽。一个数字、一句话、一张表,三种形态,PM 要提前定义好,而不是让模型自由发挥。
自检问题: 你的 AI 给出的答案,格式是写死的还是由模型决定的?如果是模型决定的,用户有没有可能在拿到答案之前要先看完三段话?
三、精确控制
这条在车机场景里的例子是:用语音把温度调到 23 度、关上右后车窗。听起来是很小的操作,但李想强调的重点在于:AI 在这里要比传统 UI 更精确,不是更模糊。
自然语言输入本质上是模糊的。PM 做语音或对话式操作时,经常犯的错误是:用户说「开暖一点」,系统不知道开多少,就随机调个值,或者反问「您要调到多少度」——这比直接戳一下屏幕按钮还烦。
精确控制这条需求,技术上的解法是 Function Calling 和 Tool Use。把用户的自然语言输入映射到一个有明确参数的函数调用,让模糊输入对应确定动作。做到的前提,是 PM 把「用户可能要控制的所有实体和参数」提前穷举出来,定义成工具集,模型才有东西可以调用。这件事不能交给模型自己猜,PM 要主动设计。
自检问题: 同一句话说十次,AI 给出的操作结果是否一致?如果不一致,你的精确控制没有做完。
四、信息记录
李想的原话大意是:车主真正想让系统记住的,是「我老婆怕冷、我孩子晕车」这类结构化偏好,而不是完整的对话历史。把聊天记录直接装进数据库,不是记忆,是懒。这也戳到了大量 AI 产品的要害。
现在很多产品的"AI 记忆"实现方式,是把上下文窗口撑大,或者把历史对话存进向量数据库做检索。这两个技术方案本质上都是「存文本、查文本」,没有提取结构。用户三个月前说过「我不喜欢发会议纪要给全组,只发给相关人」,下次他还得重新说,因为系统记住的是那句话,不是那个偏好。
真正的信息记录,是在对话过程中主动识别和抽取用户的偏好、习惯、背景,写入结构化存储,而不是把原始对话堆起来。这需要 PM 定义:什么信息值得被记、以什么结构存、什么时候触发提取、存错了怎么让用户纠正。
这四个子问题,任何一个没想清楚,记忆功能就是「Markdown 熵增」的另一种实现。
自检问题: 用户三个月后回来,你的系统能说出他三件具体的偏好吗?如果不能,你存的是历史,不是记忆。
五、个性化
个性化排在最后,因为它是前一条「信息记录」的输出端。没有结构化记录,个性化就是空话。
李想的表述是:基于记录下来的偏好,主动调整服务,不要每次都让用户重新交代。
目前市面上"个性化"最常见的实现是:用户头像 + 名字 + 历史购买记录驱动的推荐算法。这是移动互联网时代的个性化,不是 AI 原生产品的个性化。
AI 原生产品的个性化应该体现在交互层面:同一个问题,系统根据这个用户的背景给出不同深度的回答;同一个任务,系统根据这个用户的操作习惯选择不同的执行路径。把这个功能给另一个用户用,体验应该明显不同。如果换个人用感觉一模一样,个性化是假的。
自检问题: 把你的 AI 功能交给两个截然不同的用户,三个月后,他们的使用体验会有显著差异吗?如果没有,个性化没有真正发生。
结尾:一张自检表
李想那句「Markdown 熵增」批评的不是 AI 技术本身,是产品定义的懒惰。把模型能力直接暴露给用户,让用户自己想怎么用,叫它 AI 功能——这是最省力的做法,也是最没有价值的做法。
五条需求是有依赖关系的。个性化依赖信息记录,信息记录依赖精确控制,精确控制依赖任务和信息获取的边界定义清楚。如果个性化做不起来,大概率是信息记录没做;如果信息记录做不起来,大概率是没有人定义过「什么信息值得记、以什么结构存」。拿出你负责的 AI 功能,对着下面这张表打勾:
五条全部打到"已做",是真正意义上的 AI 原生产品。大多数产品现在能打到两三条就不错了。
找出第一个"未做"的位置,它就是下一个迭代最值得投入的地方。