每一家大模型公司都是一家搜索公司:LLM检索系统的未来
本文强调了大型语言模型(LLM)公司在技术上面临的搜索挑战,并预测了检索系统的未来发展趋势。
在计算机科学中,搜索被认为是最困难的技术问题之一,仅有少数产品如Google、Amazon和Instagram能够实现良好的搜索功能。随着大型语言模型(LLM)和支持它们的检索系统的爆炸性增长,每家LLM公司都需要内置世界级搜索功能,以确保其产品的正常运作。检索增强生成(RAG)系统通过向LLM提供相关信息来帮助其回应查询,这使得LLM的回答更加基于现实和相关的信息。即使新的LLM具有更长的上下文窗口,允许一次处理更大的输入,但检索系统在大多数应用中仍然不可或缺,因为它们能够处理多个文档版本、实现基于角色和上下文的访问控制,以及避免不必要的计算成本和延迟。
文章指出,语义相似性搜索虽然简单易于构建,但结果普遍中等,因为它可能会遗漏与查询语义不同但实际有用的内容,对嵌入模型敏感,对输入数据的处理方式敏感,并且计算成本高昂。优秀的搜索系统不仅仅是返回与查询最相似的结果,而是要返回最佳的结果,这可能包括视频推荐、历史购买记录等多种因素。
未来的检索系统将更加复杂,类似于当前的生产搜索或推荐系统,它们将对LLM应用的有效内存、响应质量、可靠性和性能/延迟产生显著影响。大多数公司将内部构建这些检索系统作为核心竞争力,并依赖新的基础设施来构建特定于应用的检索系统。这些系统将需要更好的工具来创建、操作和使用不同类型的向量,以及更有效地处理不同类型的输入数据,并在近实时的时间内执行检索系统。
尽管大多数公司将自行构建检索系统,但基础设施提供商可能会扩展其服务范围,覆盖更广泛的基础设施堆栈,或者可能会出现针对特定应用或模态的产品化“检索即服务”(Retrieval as a Service)解决方案。
要点
- 检索是LLM系统的关键组成部分,不会消失:即使LLM的上下文窗口变长,检索系统仍然是确保LLM提供准确和相关回答的重要部分。
- 语义相似性搜索是不足的:虽然语义相似性搜索是一个起点,但它不能解决所有的搜索问题,因为它可能会错过一些有用的内容,并且对嵌入模型和输入数据处理方式非常敏感。
- 搜索的未来是复杂的:未来的检索系统将更加复杂,需要结合多种信号(如推荐或行为向量),并且能够处理多种类型的输入数据。
- 大多数公司将自行构建检索系统:作为核心竞争力,大多数公司将选择自行构建检索系统,而不是依赖外部解决方案。
- 检索系统的基础设施需要发展:为了支持这些新的检索系统,需要开发新的基础设施工具,以便更有效地处理和监控检索过程。
- 检索系统将对LLM应用产生深远影响:检索系统的性能将对LLM应用的有效性、质量和可靠性产生显著影响。
- 可能出现检索即服务的解决方案:尽管大多数公司可能会自行构建检索系统,但仍有可能出现针对特定应用或模态的检索即服务解决方案。