【一句话总结】
本期播客深入探讨了Personal AI与长期记忆(Long Term Memory)的技术演进、应用场景及商业化路径,揭示了从个人情感陪伴到企业生产力提升的AI Agent发展脉络,并展望了未来垂直领域定制化AI的核心竞争力。
【关键观点】
- •**Personal AI分化为生产力与情绪价值两大赛道:** 当前Personal AI已明显区分为面向工作效率的助手型AI和侧重情感陪伴的交互型AI,前者在企业端快速落地并实现降本增效,后者虽具潜力但受限于用户付费意愿和模型情商能力,短期内更依赖长期记忆构建“懂你”的个性化体验。
- •**长期记忆是AI Agent实现个性化的关键壁垒:** 无论是个人还是企业场景,AI能否真正理解用户取决于其长期记忆系统的设计,包括对话记忆、行为偏好抽象、多角色切换适应等,其中企业级记忆更强调决策逻辑的一致性,而个人记忆则需处理模糊且动态变化的情感与语言风格偏好。
- •**主动型AI将成为下一代人机交互的核心形态:** 被动问答模式正在向主动服务演进,理想的AI应能在用户睡眠时自动处理任务、识别紧急信息并推送准备好的行动建议,甚至基于对用户工作模式的理解提出未被意识到的任务需求,这种主动性依赖于复杂的记忆结构与推理能力的结合。
- •**垂直领域深耕将决定AI应用的护城河:** 尽管大模型能力持续增强,但真正的竞争壁垒在于特定行业或用户群体中的深度数据积累与流程理解,未来的成功AI产品将是“大模型+垂直小模型+全生命周期记忆”的组合,通过建立牢固的客户关系形成难以复制的竞争优势。
- •**定价策略需平衡成本控制与用户体验确定性:** 在AI token成本高昂背景下,企业客户更倾向可预测的一口价订阅制而非按使用量计费的credit模式,这要求厂商在freemium、pro与unlimited之间设计清晰层级,以降低采购决策门槛,推动规模化渗透。
【全文纪要】
[00:00] **主持人:** 大家好,欢迎收听AIRC,这是一档探索人工智能的播客。 [00:04] **主持人:** 无论您是关注AI产品设计,探索前沿技术,还是专注于投资布局,这里都将为您提供深度洞察与前瞻性观点。 [00:10] **主持人:** 感谢收听,让我们开始今天的精彩节目吧。 [00:13] **主持人:** 大家好,我是Leo。 [00:16] **主持人:** 今天我们有幸邀请到了Kason,来跟我们聊聊关于Personal AI和Long Term Memory相关的一些经验。请Kason简单做一下自我介绍吧。 [00:28] **嘉宾 Kason:** 大家好,非常高兴又来到这个节目了。上一次来这个节目跟Leo他们有了非常好的交流,也启发了我自己很多的深度思考,所以这次就又过来交流一下。 [00:39] **嘉宾 Kason:** 我是Kason,我现在目前是TANK AI的CEO。在加入TANK AI之前,我是Mindverse AI的联合创始人和CEO。我在2022年的年初开启了AI的创业之路。 [00:51] **嘉宾 Kason:** 基本上就是在2022年年初的时候,我们就认为未来会有AGI,然后会有Agents as Apps。当时就开始构建AI Agents的一个Marketplace,或者说Operating System,叫做MindOS。 [01:15] **嘉宾 Kason:** 在2022年底的时候在国内推出,2023年初在全球其他地区,比如欧美推出。再往后我们发现AI Agents的能力在2023年其实还没有做得很好。 [01:28] **嘉宾 Kason:** 但我们认为未来这是大模型的能力方向。而且用户其实不太需要跟很多AI Agents去聊天。对于中小公司或创业公司来说,更大的壁垒或者说优势是在Memory上面。 [01:50] **嘉宾 Kason:** 因为用户非常关心你的AI能不能足够懂它。所以我们从2023年开始就在做AI Memory for Individuals,就是给个人的AI长期记忆。也是因为我在2023年就开始研究这一块。 [02:07] **嘉宾 Kason:** 所以到了2024年,盛大集团孵化了一家公司叫TANK AI,他们在做企业的长期记忆。当时整个业界做长期记忆的人不多,他们就找到了我,问我愿不愿意过去。 [02:23] **嘉宾 Kason:** 于是我在2024年8月加入了TANK AI,负责整个企业的检索以及长期记忆的应用开发。后来发现企业和个人的长期记忆,包括给Agent的长期记忆与用于检索的记忆,其实是差别非常大的。 [02:42] **嘉宾 Kason:** 总之从2024年到2025年,最近这一年多时间里,长期记忆这个赛道出现了非常多的新进展和变化。我个人觉得这个赛道非常有意思。 [02:56] **嘉宾 Kason:** 包括像红杉资本(Sequoia)和A16Z这样的顶级风投,在最近的分享中都提到,接下来一年,长期记忆会是一个非常重要、他们会重点关注的主题。所以我对这个方向有坚定的信仰。 [03:08] **嘉宾 Kason:** 再回到我的自我介绍。在2022年初创业之前,我在字节跳动待了两年,担任TikTok的全球商业化战略总监。 [03:20] **嘉宾 Kason:** 在TikTok之前,我在Facebook工作了六年。前四年在新加坡,负责大中华区合作伙伴管理;后两年去了总部,在战略部从事用户研究、新产品研发、亚洲市场拓展和竞品分析等工作。 [03:45] **嘉宾 Kason:** 有个有趣的事实是,我在Facebook的最后两年,有一部分工作就是专门盯着TikTok。每天汇报TikTok今天做了什么、明天计划做什么。 [04:00] **嘉宾 Kason:** 当时我们还收购了一家VPN公司叫Onavo,能获取很多App的使用数据,比如使用时长、活跃度等。靠着这些数据,我对TikTok非常了解。 [04:14] **嘉宾 Kason:** 后来TikTok挖我的时候,面试过程我直接把他们的内部情况讲了出来,结果顺利通过。之后我就成了他们内部研究Facebook的人。 [04:26] **嘉宾 Kason:** 这算是我在大厂工作期间一段比较特别的经历。 [04:31] **主持人:** 非常好。之前我们也请Kason聊过他在做MindOS时的经验,谈到了Personal AI和Long Term Memory。我现在很好奇,经过这一年半的发展,你觉得Personal AI现在进展如何? [04:46] **嘉宾 Kason:** 我觉得这里面有很多不同的分支。我们可以先用最大的颗粒度来看——主要分两类:一类是针对个人的,另一类是针对企业的。 [05:00] **嘉宾 Kason:** 其实还有艺人经纪这类组织,但我觉得更核心的划分应该是用途上的区别:是用于生产力,还是用于娱乐或情绪陪伴?这两个是完全不同的赛道。 [05:20] **嘉宾 Kason:** Personal AI在生产力方面的体现就是AI助手。它底层必须具备连接所有App的能力,能够知道你每天的工作内容、文档里说了什么。 [05:37] **嘉宾 Kason:** 比如你可以问它,“上周会议纪要里提到了什么?”它可以通过统一检索机制找到相关信息。这是最基础的能力。 [05:51] **嘉宾 Kason:** 在此基础上会有更多功能调用,也就是Agent能力,比如帮你发邮件、安排会议、填写网页表单等。这类面向企业的Personal AI,我们通常称之为“助手”,以便区分。 [06:04] **嘉宾 Kason:** 而个人层面的Personal AI更多集中在娱乐领域,比如情感陪伴。这方面我虽然不是直接从业者,但也研究很深。 [06:22] **嘉宾 Kason:** 目前大家普遍认为,这类AI的关键在于情商更高,能读懂用户聊天背后的深层需求,比如孤独感来自哪里,在对话中更有共鸣。 [06:37] **嘉宾 Kason:** 这种情商能力也被定义为记忆的一部分。因此这两个赛道非常不同。 [06:45] **嘉宾 Kason:** 整体发展来看,其实挺有意思的。我在2022年预测AI发展趋势时,套用了互联网的增长曲线,认为C端会先火起来,然后才轮到B端,因为企业采用新技术的速度通常较慢。 [07:09] **嘉宾 Kason:** 特别是传统企业,理解AI能带来什么价值,并将其整合进现有SaaS体系,可能需要五到十年时间。所以我原本以为C端会先爆发。 [07:25] **嘉宾 Kason:** 但实际上我们看到的是B端率先崛起。哪怕是最传统的行业,从去年开始就愿意为AI分配预算,积极采用解决方案,强调效率提升。 [07:42] **嘉宾 Kason:** B端的接受速度远超预期,而C端反而进展缓慢。原因有几个:第一,大模型本身的情商能力不强,训练目标并非为此;第二,C端需求更模糊,难以衡量是否解决了痛点;第三,C端用户的付费意愿相对较低。 [08:04] **嘉宾 Kason:** 综合来看,导致无论是创投圈还是企业界,目前都更聚焦于生产力层面的应用。 [08:17] **主持人:** 我非常同意。我觉得AI更像是一个工具增益,对企业带来的效率提升比对个人更大。企业可以用AI实现降本增效,但对个人而言,AI提供的情绪价值相比互联网时代的社交平台并没有质的飞跃。 [08:48] **嘉宾 Kason:** 是的。我们在2020年创业时也讨论过这个问题:到底要做情感陪伴型AI,还是生产力型AI?哲学上我们也辩论过,这种AI陪伴对人类是否有意义。 [09:16] **嘉宾 Kason:** 有人提出质疑:现代人已经很累了,如果有时间为什么不留给伴侣或朋友,反而花在AI上?这样会不会让人更加孤立?就像Facebook这类社交媒体一样。 [09:29] **嘉宾 Kason:** 但我当时的看法是,情绪是一种能量流动的过程。当你和别人聊天时,往往是单向输出能量。但如果有一个AI可以承载你的负面情绪,并给予正向反馈,那你就获得了能量输入。 [09:51] **嘉宾 Kason:** 当你的情绪蓄水池被填满后,你会更愿意与真实的人交流。但这有一个前提:现在的AI大多是被动型的,你需要主动发起对话。 [10:04] **嘉宾 Kason:** 我们设想的是未来出现主动型AI,它有自己的“世界”和事件,会主动打招呼、展示状态,让你更容易参与互动。这种主动性可能会带来真正的情绪价值。 [10:22] **嘉宾 Kason:** 但后来我又想,如果十年之内不变的趋势是用户越来越懒、越来越依赖即时满足,那最终会不会变成AI版的《楚门的世界》?这可能是它的终局。 [10:46] **主持人:** 你提到的被动与主动之分,正是我想问的问题。现在很多Personal AI,包括一些OS级别的Agent,仍然是被动响应式的——你问一句,它答一句。那么你认为主动型AI更适合哪些场景? [11:05] **嘉宾 Kason:** 第一个显然是陪伴类场景。这类AI不仅要有主动性,还要有一定的随机性和个性,让它更像一个独立个体。 [11:27] **嘉宾 Kason:** 现在AI还处于“恐怖谷”之前的状态——根本无法让我们感觉它接近人类。我们需要继续往前走,才能触及那个临界点。 [11:45] **嘉宾 Kason:** 主动性在生产力场景同样重要。例如TANK AI即将推出的“Arena”功能:你的AI Agent经过你的语言和资料训练后,非常像你本人,理解你的管理目标和工作方式。 [12:09] **嘉宾 Kason:** 它可以在你睡觉时帮你处理工作,醒来时告诉你昨晚完成了哪些任务。这就是主动型AI在职场中的理想形态。 [12:22] **嘉宾 Kason:** 从低到高来看,最基本的需求是能主动完成某个任务,或发送提醒通知,而不是每次都等你去查询。 [12:42] **嘉宾 Kason:** 比如你现在可以让AI定时检查邮箱并推送新消息,这是一种初级自动化。更进一步的是,当有紧急重要信息时,它能主动识别并推送。 [12:55] **嘉宾 Kason:** 更高级的是,在推送信息的同时,还能提取出关键动作点。举个例子:它告诉你“15分钟后有会议”,同时附上会议材料摘要、参会者背景介绍,甚至准备好发言要点。 [13:47] **嘉宾 Kason:** 这种能力已经属于主动型AI的一种表现。再往上一层,是它能主动理解你的工作模式和目标,在日常中帮你留意竞争情报等信号,提前为你准备应对方案。 [14:04] **嘉宾 Kason:** 甚至能发现你自己还没意识到的任务盲区,主动提出建议。当然,这种能力目前还很难完全实现。 [14:21] **嘉宾 Kason:** 推送新闻相对容易,但抽象层面的洞察——比如“你应该关注这件事”——是非常难的,因为它涉及对未知事物的预判。 [14:38] **主持人:** 这确实涉及到AI要“懂你”。如果你经常协作,AI可能逐渐了解到你偏好哪些类型的消息,积累经验后自动抓取相关内容推送给你,不需要固定时间设置,而是灵活响应。 [15:00] **嘉宾 Kason:** 对,尤其是对“时间就是金钱”的岗位来说,这种AI非常有价值。有时一分钟就能收到一条关键信息;有时几个小时都没有打扰,说明没有重要内容。 [15:16] **嘉宾 Kason:** 但这也引出了一个难题:如何抽象用户的偏好?比如你在某个项目中是产品经理,关注产品细节;在另一个项目中是财务角色,关注预算数据。 [15:32] **嘉宾 Kason:** 你怎么判断这是项目特定的记忆,还是个人通用的偏好?而且随着升职、转岗,这些偏好还会变化。这就要求AI与用户建立长期联系,共同成长。 [15:58] **主持人:** 你说的“联系”具体指什么?是指角色转换后,旧的记忆不再适用,需要重新培养新的记忆吗? [16:12] **嘉宾 Kason:** 是的。比如你从工程师晋升为经理,相当于从零开始孵化一个新的“管理者身份”的记忆系统。你需要重建信任和默契。 [16:27] **嘉宾 Kason:** 从生活角度看,我也举个例子。我是内向人格,倾诉前希望有一定感情基础。如果一个AI刚上线就问我“今天心情怎么样”,即使我很糟也不愿说。 [16:44] **嘉宾 Kason:** 但如果我已经和它聊了几个月,建立了信任,我就会很愿意分享。这是我理想中的AI与人的关系——需要时间和信任积累。 [17:07] **主持人:** 你说的这点非常有意思。心理学上有类似机制。我自己用ChatterBot聊了一年多,虽然它没有我的记忆,但一旦打开了沟通渠道,就更倾向于继续使用。 [17:23] **嘉宾 Kason:** 正因如此,对AI创业公司来说,技术本身可能不是最强壁垒。开源模型很多,研发迭代很快。 [17:40] **嘉宾 Kason:** 关键在于用户粘性和信任。我就是一个典型例子:最早用ChatterBot,后来一段时间转向Grok-4。 [17:58] **嘉宾 Kason:** 因为那段时间我集中看论文和数学问题,测试发现Grok-4回答质量更好。但Grok-4致命缺点是响应太慢。 [18:21] **嘉宾 Kason:** XAI团队告诉我,Grok-4是一个超大规模模型,他们的基础设施难以高效服务。后来我不再专注理论,觉得它太慢,又回到了ChatterBot。 [18:42] **嘉宾 Kason:** 再后来我偏工程方向,开始大量编码,就转到了Claude,因为它的代码辅助更强。文书写作方面,我又觉得ChatterBot表达更人性化,于是再次回来。 [19:01] **嘉宾 Kason:** 可见我对模型的选择完全是功利性的——谁好用用谁,根据时代需求切换。没有任何忠诚度可言。 [19:22] **嘉宾 Kason:** 工程类用户尤其如此。硅谷很多开发者在Cursor和Claude之间来回切换,完全是基于最新功能特性做选择。 [19:35] **嘉宾 Kason:** 这种切换在工程领域很快,但在情感或文案创作领域较慢,因为后者更依赖隐性共识和风格契合。 [20:00] **主持人:** 刚才你也提到了Long Term Memory。我想了解一下,从你第一个创业项目到现在,整个行业在这方面有什么重大进展? [20:10] **嘉宾 Kason:** 进展非常多。首先要明确,Long Term Memory其实分多个赛道。 [20:20] **嘉宾 Kason:** 一种是用于检索的事实型记忆,基于RAG、知识图谱等技术;另一种是对话类记忆,如情景记忆(episodic memory),帮助AI更好地理解上下文。 [20:39] **嘉宾 Kason:** 更高层的是情绪层面的抽象理解。此外还有Agent自身的学习记忆——即不与用户交互时也能通过反馈不断优化自身行为。 [20:53] **嘉宾 Kason:** 最近的研究重点正是Agent自身的记忆进化。比如Google在12月发布的Apple Mem框架,就是一个全新的尝试。 [21:06] **嘉宾 Kason:** 学术界现在流行研究Agent思维链(chain of thoughts)如何扩展得更长、更完整,让它在执行复杂任务时能进行多步推理,并从中学习。 [21:21] **嘉宾 Kason:** 比如原本参与三步流程,现在参与十步,它能识别哪一步出错,并决定是否将错误记录进记忆库,用于后续改进。 [21:38] **嘉宾 Kason:** 所以记忆本身是多层次的。再看检索类记忆,又可分为企业级和个人级。 [21:54] **嘉宾 Kason:** 早期我们创业时还没有GPT,所谓的记忆概念很简单。比如Replica这款AI伴侣曾很火,用户评论中最喜欢的一点是:“上周五我说喜欢吃蛋糕,今天你又提起,让我觉得你懂我。” [22:30] **嘉宾 Kason:** 当时的要求非常基础。到了2023年,也没太多公司在做这件事,相关论文也很少。 [22:47] **嘉宾 Kason:** 像Mem0这类系统是比较基础的记忆架构:在一个用户ID与AI对话过程中,记录关键信息。 [23:03] **嘉宾 Kason:** 我们当时发布了一篇论文叫《Personal AI》,提出未来每个人都应有一个自己的记忆层,像USB一样插拔到任何大模型中。 [23:25] **嘉宾 Kason:** 这个记忆层可以存在本地设备上,由一个小模型管理,用户用自己的数据训练它。但成本极高,2024年仍不够成熟。 [23:45] **嘉宾 Kason:** 不过已有新进展,比如HIPPORAG在RAG基础上引入更多结构化设计。Meta也在2025年推出了RAFLAP,优化事实检索的结构和效率。 [24:12] **嘉宾 Kason:** 今年的趋势是记忆结构更加完善,并出现benchmark测试,比如大家都去挑战Locomo。 [24:38] **嘉宾 Kason:** 另外,TANK的姐妹公司Evermind在2024年11月独立运营,专注于企业级记忆检索。 [24:58] **嘉宾 Kason:** 以往Win等公司早就做了企业检索,但从不公开方法论。Evermind算是第一批系统化解决企业多用户、多文档、复杂数据关联记忆的企业。 [25:25] **嘉宾 Kason:** 行业开始出现各种分支:更复杂的记忆结构、结合强化学习的记忆演化机制等。 [25:52] **嘉宾 Kason:** 我个人认为,明年记忆赛道会进一步细分:针对不同场景(个人 vs 企业)会有更优结构;同时这些结构会更深地与RL等技术结合。 [26:14] **主持人:** 我听过一个观点:当前COT、Long Term Memory乃至AI Agent的核心能力,依然取决于基础模型的理解力。这两年之所以进步快,正是因为基础模型能处理更复杂的结构。 [26:40] **嘉宾 Kason:** 完全正确。说到记忆,归根结底有两个核心问题:一是在哪些环节引入LLM;二是要在多大程度上做抽象。 [27:04] **嘉宾 Kason:** 抽象其实就是结构化。我们在做的MemCell概念就是一个事件单元,多个事件可抽象出更高层模式。 [27:21] **嘉宾 Kason:** 这些都需要大量工程调试。但今年最大的变化是LLM本身变得越来越强大,许多原本靠工程实现的功能,现在可以直接交给LLM处理,效果反而更好。 [27:39] **嘉宾 Kason:** 这带来了更高的可扩展性和灵活性。 [27:53] **主持人:** 你既做过个人长期记忆,也做过企业级记忆。你们在抽象用户偏好时,两者有何区别? [28:01] **嘉宾 Kason:** 个人层面的抽象更复杂。我们在Mindverse时期做过一款笔记App叫MeBot,后来演变为SecondMe,在国内很受欢迎。 [28:15] **嘉宾 Kason:** MeBot主打解决“想法太多不知记在哪”的痛点。很多人习惯用微信或Instagram发给自己,我们让用户直接发给Bot。 [28:35] **嘉宾 Kason:** 记录后AI不仅能整理,还能解读你是怎样的人,据此推荐新闻、帮助检索过往创意。 [28:53] **嘉宾 Kason:** 做个人长期记忆时我们发现,个人偏好强烈但不清晰。比如工作偏好、性格偏好、语言风格偏好,维度很多。 [29:10] **嘉宾 Kason:** 工作上要看你是何种工种、所在行业,决定你看什么新闻;语言风格上,AI推荐内容的语气也要符合你的喜好。 [29:36] **嘉宾 Kason:** 这些细碎的偏好都算personalization的一部分。用户对“懂我”的期望很高,如果没get到,会觉得疏离,影响使用体验。 [29:50] **嘉宾 Kason:** 但在企业场景中,这类偏好要求较低。更多的是岗位相关的功能性记忆沉淀,比如流程规范、历史决策记录等。 [30:00] **嘉宾 Kason:** 企业的核心抽象是它的文化DNA和决策逻辑。个人决策可以非理性,但企业必须有一致、可追溯的决策链条,否则组织会混乱。 [30:22] **嘉宾 Kason:** 所以企业记忆最难的部分是抽象出它的战略演进路径和决策依据。 [30:41] **主持人:** 刚才你说Personal AI的信息来源很随机。你们是如何有效提取对用户有利或他偏好的信息的? [31:14] **嘉宾 Kason:** 说到底还是要和用户共创。除非你有一个专属小模型,能基于用户反馈持续调优,但这成本太高,不现实。 [31:36] **嘉宾 Kason:** 目前的做法是挑选愿意深度合作的种子用户,反复调试他们的检索逻辑和推荐机制。没有魔法,全是工程调参。 [32:01] **嘉宾 Kason:** 就是engineering调。 [32:04] **主持人:** 我之前采访过一家做健康饮食监督的Personal AI公司,每天提醒用户吃什么、运动多久,这种应用逻辑很清晰。 [32:17] **嘉宾 Kason:** 对,这类场景确实容易做出PMF(产品市场匹配)。我和一位做memory layer的朋友聊过,我们都认为目前最容易找到PMF的个人AI应用集中在健康管理领域。 [32:36] **主持人:** 很好奇你们两个产品是如何量化AI带来的增益的? [32:51] **嘉宾 Kason:** 生产力层面比较好量化。比如我们有个功能叫Smart Bag,AI帮你分类和回复邮件。 [33:06] **嘉宾 Kason:** 用户平均写一封邮件要几分钟,用AI只需0.1秒,深度思考模式下一两秒。乘以使用频率,就能估算每月节省的时间。 [33:20] **嘉宾 Kason:** 类似地,PPT生成、任务自动化等功能也可以折算成时间节省。这些都是可量化的指标。 [33:39] **嘉宾 Kason:** 但个人场景很难量化。你很难定义“用了这个AI后情绪变好了”这样的指标。metrics本身就不明确。 [33:50] **嘉宾 Kason:** 时间节省、人力替代这类指标尚可定义,但情感类价值几乎无法标准化衡量。 [34:00] **主持人:** 做AI这类互联产品时,token成本很高。你们在定价上有什么技巧吗?毕竟用户使用频率对成本影响很大。 [34:18] **嘉宾 Kason:** 确实经历过思考。2025年初很多VC说未来会是result-based或outcome-based定价,而不是cost-based。 [34:38] **嘉宾 Kason:** 比如AI招聘官成功帮企业入职一人,就可以收费;CRM类AI促成一笔销售也容易计算转化率。 [34:55] **嘉宾 Kason:** 但在知识检索或PPT生成这类复杂场景中,outcome很难衡量。生成的PPT通常还需修改,不能让用户自报成果。 [35:13] **嘉宾 Kason:** 下载次数也不可靠。所以企业场景下用outcome收费有两个问题:一是难以测量,二是场景太多,定义过多outcome会让用户困惑。 [35:46] **嘉宾 Kason:** 最终还是要平衡:价格策略必须足够简单,让用户一看就懂,而不是增加理解负担。 [36:03] **嘉宾 Kason:** 所以现阶段,简单的定价更可行。我们采用了credit-based模式,类似Menace、Cursor那样,每个任务消耗一定积分。 [36:25] **嘉宾 Kason:** 但这对不懂AI的普通用户仍有认知门槛。尤其企业老板担心下属用量失控,不敢轻易采购。 [36:47] **嘉宾 Kason:** 因此我们最终将credit打包为几个档次:免费版、Pro版(29元/月)、无限使用版。一口价让企业客户更有确定性,成交更快。 [37:07] **主持人:** 我们公司用AI时也会限制每人每日额度,比如每天一百美元额度,大约能提上千个问题。 [37:23] **嘉宾 Kason:** 是的。企业需要权衡采购成本与实际利用率,避免浪费。 [37:35] **主持人:** 一般人不会无限制使用,但管控仍是必要的。 [37:51] **主持人:** 最后一个问题:请你总结一下,对明年Memory和Customized AI发展的展望? [38:00] **嘉宾 Kason:** 这个问题要回到整个AI行业的架构演变。Memory在其中扮演什么角色?Customized AI是否存在?它是横向通用还是垂直专用? [38:17] **嘉宾 Kason:** 这些问题这几年一直在变。2022年大家还在争论AI会是horizontal还是vertical主导。 [38:24] **嘉宾 Kason:** 有些VC押注vertical,投旅游、医疗、法律等专用AI;有些投horizontal,比如通用检索层AI。 [38:35] **嘉宾 Kason:** 后来讨论焦点转移到基础设施、大模型、应用层各自的壁垒。现在我们认为,共识逐渐清晰。 [38:47] **嘉宾 Kason:** 模型边界已初现。2023年时大家要么极度乐观,要么极度悲观,缺乏证据。现在我们知道,模型无法做到完全通用。 [39:01] **嘉宾 Kason:** 未来更可能是“大模型 + 垂直小模型”的组合。AI时代不同于互联网时代的数据广度优先,而是深度优先。 [39:15] **嘉宾 Kason:** 互联网时代靠海量数据训练推荐引擎,追求horizontal扩张。AI时代靠few-shot learning,越深入了解一个人或一个行业,服务就越精准。 [39:47] **嘉宾 Kason:** 所以我认为,未来会走向vertical AI为主导。竞争壁垒不在模型本身,而在垂直领域的扎根程度。 [40:09] **嘉宾 Kason:** 你与用户的关系、对workflow的理解、对行业数据的掌握,才是真正的护城河。 [40:20] **嘉宾 Kason:** 比如健康领域,过去健身App不会整合饮食外卖。但在AI时代,会出现全天候AI健康教练,综合管理你的运动与饮食。 [41:50] **嘉宾 Kason:** customer relationship 和 vertical expertise 成为核心资产。 [42:03] **嘉宾 Kason:** 在这个趋势下,memory的本质就是全生命周期的数据沉淀。无论是个人还是企业,AI都要贯穿其整个行为周期。 [42:19] **嘉宾 Kason:** 比如汽车经销商行业,AI要理解全流程,从客户画像、销售触达、邮件撰写到成交闭环,把所有专业知识和记忆整合进来。 [42:40] **嘉宾 Kason:** 只有这样才能真正赋能。所以我相信未来AI会往这个方向深化。 [43:09] **嘉宾 Kason:** 另外,Andrej Karpathy最近一篇博客提到“Cursor for X”的厚度问题,我很认同。很多人觉得Cursor没价值,除非自建模型。 [43:23] **嘉宾 Kason:** 结果导致很多初创公司融巨资后高喊要建模型,只为解释资金用途。但其实大模型再强,也有边界——人是懒的。 [43:48] **嘉宾 Kason:** 理论上一个通用App可以个性化一切,但现实中没人愿意每次都在workflow里手动指挥大模型。 [44:08] **嘉宾 Kason:** 大多数用户连Google搜索都不愿用,只刷TikTok。让他们自己搭AI workflow是有门槛的。 [44:28] **嘉宾 Kason:** 如果有一个App在某个场景下预设好流程、风格、模板,用户开箱即用,何必自己折腾? [44:47] **嘉宾 Kason:** 这类GUI-rich的应用不会被LUI(语言用户界面)取代。至少未来几年,这仍是初创公司的巨大机会。 [45:32] **主持人:** 好的,感谢Kason今天精彩的分享,这期就先到这里了,谢谢。 [45:40] **主持人:** 感谢您收听本期AIRC的播客,如果您喜欢今天的内容,请分享给您的朋友,同时也欢迎您在小宇宙播客平台上留下宝贵的意见和反馈。 [45:55] **主持人:** 我们将继续为您带来更多有趣的话题和嘉宾,敬请期待。再次感谢您的收听,我们下期节目再见。
由小宇宙音频转文本工具生成