Weaviate 知识卡片
释放向量搜索的力量。我们的指南将帮助你掌握向量嵌入并构建更好的 AI 应用。
分类
向量数据库简介
专为存储和搜索使用向量嵌入的数据而设计的数据库,能够对文本和图像等非结构化数据进行高效的相似性搜索。向量数据库简介
非结构化数据对象
非结构化数据对象是没有预定义结构的数据对象,使其难以常规管理。示例包括文本文档、图像、音频和视频…向量数据库简介
向量
向量,或数据库中的向量嵌入,是具有大小和方向的量…向量数据库简介
向量嵌入
对对象(如单词或图像)在向量空间中的数值表示…搜索
一种将向量搜索与传统关键词搜索相结合的搜索方法,以提高检索准确性和相关性。搜索
稀疏向量
稀疏嵌入由 BM25 和 SPLADE 等算法生成…搜索
密集向量
与稀疏向量相反,密集向量主要包含非零值,由 GloVe 和 Transformers 等机器学习模型生成…搜索
BM25/BM25F
BM25 是一种由搜索引擎用于估计文档与给定搜索查询相关性的排名函数。它是概率信息检索模型家族的一部分…分层可导航小世界
一种用于向量数据库的索引算法,可实现快速高效的相似性搜索。分层可导航小世界
分层图结构
HNSW 利用多层图结构,其中每一层都是数据点的图。顶层包含较少的点,具有长程连接…分层可导航小世界
ANN - 近似最近邻
ANN 算法计算查询的近似最近邻,而 kNN 算法计算真实的最近邻…分层可导航小世界
分层导航
在搜索过程中,HNSW 从顶层开始,在图上进行“大跳跃”,以快速接近目标区域…多模态 RAG
一种结合检索相关的多模态数据(如图像、文本、音频或视频)与生成式大型语言模型的技术,以生成对查询的自然语言响应或内容。多模态 RAG
跨模态推理
跨模态推理是指通过整合来自不同模态或来源的信息(包括文本、图像、音频和视频)进行连接的能力…多模态 RAG
多模态嵌入模型
多模态嵌入模型为多模态数据生成一个联合嵌入空间,能够理解文本、图像、音频等…多模态 RAG
多模态对比微调
多模态嵌入模型为多模态数据生成一个联合嵌入空间,能够理解文本、图像、音频等…数据库
用于存储和存储、组织和检索结构化或非结构化数据的系统。数据库
图数据库
图数据库以节点和边存储数据,分别表示实体及其关系。它针对…进行了优化数据库
倒排索引
倒排索引是一种数据库索引结构,它将关键词映射到文档中的位置…数据库
分片
分片是将数据库拆分为更小、更快、更易于管理的部分,称为分片…大型语言模型
在海量数据集上训练的深度学习模型,用于理解和生成类似人类的文本,应用于聊天机器人和内容生成等领域。大型语言模型
大型语言模型 (LLM)
大型语言模型 (LLM) 是一种在海量文本数据上训练的机器学习模型,学习语言…大型语言模型
微调
微调是一个过程,其中预训练的机器学习模型在特定数据集上进行进一步训练…大型语言模型
多模态
多模态学习涉及整合各种数据类型,如图像、文本、音频和感官输入…信息检索/搜索
在大型数据集中查找相关信息的技术,例如文档、图像或视频。嵌入类型
用于向量数据库的不同类型的嵌入,例如文本嵌入、图像嵌入和多模态嵌入。分块技术
将大型数据分解为更小、更易于管理的数据块以进行处理和存储的技术。分块技术
语义分块
在此技术中,文本被划分为有意义的单元,例如句子或段落,然后进行向量化…分块技术
递归分块
文本首先使用主要分隔符(如段落)进行拆分。如果生成的块太大,则使用次要分隔符…分块技术
基于 LLM 的分块
这种高级技术使用语言模型 (LLM) 生成块。LLM 处理文本并生成语义隔离的句子…高级 RAG 技术
改进 RAG 模型性能和能力的技术,例如在自定义数据集上进行训练、微调以及针对特定任务进行优化。高级 RAG 技术
推理和行动 (ReAct)
ReAct 提示结合了 CoT 和代理,创建了一个系统,其中模型可以生成想法并将操作委托给与外部数据源交互的代理…高级 RAG 技术
思维树 (ToT)
思维树提示通过指示模型在问题解决过程的每个步骤中评估其响应,甚至生成针对问题的多个不同解决方案来构建在 CoT 之上…高级 RAG 技术