跳至主要内容

Weaviate 知识卡片

释放向量搜索的力量。我们的指南将帮助你掌握向量嵌入并构建更好的 AI 应用。

分类

向量数据库简介

专为存储和搜索使用向量嵌入的数据而设计的数据库,能够对文本和图像等非结构化数据进行高效的相似性搜索。
向量数据库简介
Unstructured Data Objects

非结构化数据对象

非结构化数据对象是没有预定义结构的数据对象,使其难以常规管理。示例包括文本文档、图像、音频和视频…
向量数据库简介
Vector

向量

向量,或数据库中的向量嵌入,是具有大小和方向的量…
向量数据库简介
Vector Embedding

向量嵌入

对对象(如单词或图像)在向量空间中的数值表示…

搜索

一种将向量搜索与传统关键词搜索相结合的搜索方法,以提高检索准确性和相关性。
搜索
Sparse Vectors

稀疏向量

稀疏嵌入由 BM25 和 SPLADE 等算法生成…
搜索
Dense Vectors

密集向量

与稀疏向量相反,密集向量主要包含非零值,由 GloVe 和 Transformers 等机器学习模型生成…
搜索
BM25/BM25F

BM25/BM25F

BM25 是一种由搜索引擎用于估计文档与给定搜索查询相关性的排名函数。它是概率信息检索模型家族的一部分…

分层可导航小世界

一种用于向量数据库的索引算法,可实现快速高效的相似性搜索。

多模态 RAG

一种结合检索相关的多模态数据(如图像、文本、音频或视频)与生成式大型语言模型的技术,以生成对查询的自然语言响应或内容。
多模态 RAG
Cross Modal Reasoning

跨模态推理

跨模态推理是指通过整合来自不同模态或来源的信息(包括文本、图像、音频和视频)进行连接的能力…
多模态 RAG
Multimodal Embeddings Models

多模态嵌入模型

多模态嵌入模型为多模态数据生成一个联合嵌入空间,能够理解文本、图像、音频等…
多模态 RAG
Multimodal Contrastive Finetuning

多模态对比微调

多模态嵌入模型为多模态数据生成一个联合嵌入空间,能够理解文本、图像、音频等…

数据库

用于存储和存储、组织和检索结构化或非结构化数据的系统。
数据库
Graph Database

图数据库

图数据库以节点和边存储数据,分别表示实体及其关系。它针对…进行了优化
数据库
Inverted Indexes

倒排索引

倒排索引是一种数据库索引结构,它将关键词映射到文档中的位置…
数据库
Sharding

分片

分片是将数据库拆分为更小、更快、更易于管理的部分,称为分片…

大型语言模型

在海量数据集上训练的深度学习模型,用于理解和生成类似人类的文本,应用于聊天机器人和内容生成等领域。
大型语言模型
Large Language Model (LLM)

大型语言模型 (LLM)

大型语言模型 (LLM) 是一种在海量文本数据上训练的机器学习模型,学习语言…
大型语言模型
Finetuning

微调

微调是一个过程,其中预训练的机器学习模型在特定数据集上进行进一步训练…
大型语言模型
Multi-modal

多模态

多模态学习涉及整合各种数据类型,如图像、文本、音频和感官输入…

信息检索/搜索

在大型数据集中查找相关信息的技术,例如文档、图像或视频。
信息检索/搜索
Reranking

重排序

重排序是在初始检索后调整搜索结果的得分。通常使用机器学习模型…
信息检索/搜索
Retrieval Augmented Generation (RAG)

检索增强生成 (RAG)

检索增强生成 (RAG) 是为大型语言模型情境化提示的过程…

嵌入类型

用于向量数据库的不同类型的嵌入,例如文本嵌入、图像嵌入和多模态嵌入。
嵌入类型
Variable Dimensions

可变维度

灵活的嵌入大小,如套娃嵌入。分层编码信息,允许适应…
嵌入类型
Sparse Embeddings

稀疏嵌入

稀疏向量通常是高维的,具有许多零值。它们由 BM25 和 SPLADE 等算法生成…
嵌入类型
Quantized Embeddings

量化嵌入

使用较低精度的数据类型(例如,float32 到 int8)压缩密集向量。减少内存使用并加快搜索速度…

分块技术

将大型数据分解为更小、更易于管理的数据块以进行处理和存储的技术。
分块技术
Semantic Chunking

语义分块

在此技术中,文本被划分为有意义的单元,例如句子或段落,然后进行向量化…
分块技术
Recursive Chunking

递归分块

文本首先使用主要分隔符(如段落)进行拆分。如果生成的块太大,则使用次要分隔符…
分块技术
LLM-Based Chunking

基于 LLM 的分块

这种高级技术使用语言模型 (LLM) 生成块。LLM 处理文本并生成语义隔离的句子…

高级 RAG 技术

改进 RAG 模型性能和能力的技术,例如在自定义数据集上进行训练、微调以及针对特定任务进行优化。
高级 RAG 技术
Reasoning and Acting (ReAct)

推理和行动 (ReAct)

ReAct 提示结合了 CoT 和代理,创建了一个系统,其中模型可以生成想法并将操作委托给与外部数据源交互的代理…
高级 RAG 技术
Tree of Thoughts (ToT)

思维树 (ToT)

思维树提示通过指示模型在问题解决过程的每个步骤中评估其响应,甚至生成针对问题的多个不同解决方案来构建在 CoT 之上…
高级 RAG 技术
Chain of Thought (CoT)

思维链 (CoT)

思维链 (CoT) 提示涉及要求模型“逐步思考”并将复杂的推理任务分解为一系列中间步骤…