YouTube 是一个由 Google 创建的在线视频共享和社交媒体平台。本笔记本介绍了如何从
YouTube 转录 中加载文档。
添加视频信息
添加语言偏好
语言参数:它是一个按降序优先级排列的语言代码列表,默认为en。 翻译参数:它是一个翻译偏好,您可以将可用的转录翻译成您的首选语言。获取带时间戳的转录块
获取一个或多个Document 对象,每个对象包含视频转录的一个块。可以指定块的长度(以秒为单位)。每个块的元数据都包含视频在 YouTube 上的 URL,该 URL 将从特定块的开头开始播放视频。 transcript_format 参数:langchain_community.document_loaders.youtube.TranscriptFormat 值之一。在本例中,为 TranscriptFormat.CHUNKS。 chunk_size_seconds 参数:表示每个转录数据块的视频秒数的整数。默认为 120 秒。来自 Google Cloud 的 YouTube 加载器
先决条件
- 创建 Google Cloud 项目或使用现有项目
- 启用 YouTube API
- 授权桌面应用程序的凭据
pip install -U google-api-python-client google-auth-httplib2 google-auth-oauthlib youtube-transcript-api
🧑 导入 Google Docs 数据的说明
默认情况下,GoogleDriveLoader 期望 credentials.json 文件位于 ~/.credentials/credentials.json,但这可以使用 credentials_file 关键字参数进行配置。token.json 也是如此。请注意,token.json 将在您第一次使用加载器时自动创建。 GoogleApiYoutubeLoader 可以从 Google Docs 文档 ID 列表或文件夹 ID 加载。您可以从 URL 获取您的文件夹和文档 ID:请注意,根据您的设置,需要设置 service_account_path。有关更多详细信息,请参阅 此处。以编程方式连接这些文档到 Claude、VSCode 等,通过 MCP 获取实时答案。