跳到主要内容
Epsilla 是一个开源向量数据库,利用先进的并行图遍历技术进行向量索引。Epsilla 在 GPL-3.0 许可下发布。
要使用此集成,您需要安装 langchain-community,命令为 pip install -qU langchain-community 本笔记本演示了如何使用 Epsilla 向量数据库的相关功能。 作为先决条件,您需要运行一个 Epsilla 向量数据库(例如,通过我们的 docker 镜像),并安装 pyepsilla 包。查看完整文档请访问 docs
!pip/pip3 install pyepsilla
我们想使用 OpenAIEmbeddings,所以我们必须获取 OpenAI API 密钥。
import getpass
import os

if "OPENAI_API_KEY" not in os.environ:
    os.environ["OPENAI_API_KEY"] = getpass.getpass("OpenAI API Key:")
OpenAI API 密钥:········
from langchain_community.vectorstores import Epsilla
from langchain_openai import OpenAIEmbeddings
from langchain_community.document_loaders import TextLoader
from langchain_text_splitters import CharacterTextSplitter

loader = TextLoader("../../how_to/state_of_the_union.txt")
documents = loader.load()

documents = CharacterTextSplitter(chunk_size=1000, chunk_overlap=0).split_documents(
    documents
)

embeddings = OpenAIEmbeddings()
Epsilla 向量数据库正在以默认主机“localhost”和端口“8888”运行。我们使用自定义的数据库路径、数据库名称和集合名称,而不是默认值。
from pyepsilla import vectordb

client = vectordb.Client()
vector_store = Epsilla.from_documents(
    documents,
    embeddings,
    client,
    db_path="/tmp/mypath",
    db_name="MyDB",
    collection_name="MyCollection",
)
query = "What did the president say about Ketanji Brown Jackson"
docs = vector_store.similarity_search(query)
print(docs[0].page_content)
在一个州接一个州,新法律已经通过,不仅是为了压制投票,更是为了颠覆整个选举。 我们不能让这种事情发生。 今晚。我呼吁参议院:通过《投票自由法案》。通过《约翰·刘易斯投票权法案》。顺便说一句,通过《披露法案》,这样美国人就能知道是谁在为我们的选举提供资金。 今晚,我想向一位将毕生奉献给这个国家的人致敬:斯蒂芬·布雷耶大法官——一位陆军退伍军人、宪法学者,以及即将退休的美国最高法院大法官。布雷耶大法官,感谢您的服务。 总统最重要的宪法职责之一是提名人选担任美国最高法院大法官。 4天前,我就这样做了,我提名了巡回上诉法院法官凯坦吉·布朗·杰克逊。她是美国顶尖的法律人才之一,她将延续布雷耶大法官的卓越遗产。
以编程方式连接这些文档到 Claude、VSCode 等,通过 MCP 获取实时答案。
© . This site is unofficial and not affiliated with LangChain, Inc.