跳到主要内容
本页面介绍如何在 LangChain 中使用 MyScale 向量数据库。它分为两部分:安装和设置,然后是 MyScale 特定包装器的引用。 通过 MyScale,您可以管理结构化和非结构化(向量化)数据,并使用 SQL 对两种类型的数据执行联合查询和分析。此外,MyScale 基于 ClickHouse 构建的云原生 OLAP 架构即使在海量数据集上也能实现闪电般的数据处理速度。

介绍

MyScale 概述和高性能向量搜索 您现在可以在我们的 SaaS 上注册并立即启动一个集群! 如果您还对我们如何集成 SQL 和向量感兴趣,请参阅此文档以获取更多语法参考。 我们还在 Hugging Face 上提供实时演示!请查看我们的Hugging Face 空间!它们在眨眼间搜索数百万个向量!

安装和设置

  • 使用 pip install clickhouse-connect 安装 Python SDK

环境设置

设置 MyScale 索引参数有两种方法。
  1. 环境变量 在运行应用程序之前,请使用 export 设置环境变量:export MYSCALE_HOST='<your-endpoints-url>' MYSCALE_PORT=<your-endpoints-port> MYSCALE_USERNAME=<your-username> MYSCALE_PASSWORD=<your-password> ... 您可以在我们的 SaaS 上轻松找到您的帐户、密码和其他信息。有关详细信息,请参阅此文档 MyScaleSettings 下的所有属性都可以通过前缀 MYSCALE_ 设置,并且不区分大小写。
  2. 使用参数创建 MyScaleSettings 对象
    from langchain_community.vectorstores import MyScale, MyScaleSettings
    config = MyScaleSettings(host="<your-backend-url>", port=8443, ...)
    index = MyScale(embedding_function, config)
    index.add_documents(...)
    

包装器

支持的函数
  • add_texts
  • add_documents
  • from_texts
  • from_documents
  • similarity_search
  • asimilarity_search
  • similarity_search_by_vector
  • asimilarity_search_by_vector
  • similarity_search_with_relevance_scores
  • delete

向量存储

MyScale 数据库有一个包装器,允许您将其用作向量存储,无论是用于语义搜索还是类似的示例检索。 要导入此向量存储:
from langchain_community.vectorstores import MyScale
有关 MyScale 包装器的更详细演练,请参阅此笔记本
以编程方式连接这些文档到 Claude、VSCode 等,通过 MCP 获取实时答案。
© . This site is unofficial and not affiliated with LangChain, Inc.