Athena

Amazon Athena 是一个基于开源框架构建的无服务器、交互式分析服务，支持开放表和文件格式。Athena 提供了一种简化、灵活的方式来分析位于其所在位置的数PB数据。从 Amazon Simple Storage Service (S3) 数据湖和 30 个数据源（包括本地数据源或其他云系统）使用 SQL 或 Python 分析数据或构建应用程序。Athena 构建于开源的 Trino 和 Presto 引擎以及 Apache Spark 框架之上，无需配置或设置。

本笔记本介绍了如何从 AWS Athena 加载文档。

设置

请遵循说明设置 AWS 账户。安装 Python 库：

! pip install boto3

示例

from langchain_community.document_loaders.athena import AthenaLoader

database_name = "my_database"
s3_output_path = "s3://my_bucket/query_results/"
query = "SELECT * FROM my_table"
profile_name = "my_profile"

loader = AthenaLoader(
    query=query,
    database=database_name,
    s3_output_uri=s3_output_path,
    profile_name=profile_name,
)

documents = loader.load()
print(documents)

包含元数据列的示例

database_name = "my_database"
s3_output_path = "s3://my_bucket/query_results/"
query = "SELECT * FROM my_table"
profile_name = "my_profile"
metadata_columns = ["_row", "_created_at"]

loader = AthenaLoader(
    query=query,
    database=database_name,
    s3_output_uri=s3_output_path,
    profile_name=profile_name,
    metadata_columns=metadata_columns,
)

documents = loader.load()
print(documents)

在 GitHub 上编辑此页面源文件。

以编程方式连接这些文档到 Claude、VSCode 等，通过 MCP 获取实时答案。

热门提供商

按组件划分的集成

设置

示例

热门提供商

按组件划分的集成

​设置

​示例

设置

示例