AssemblyAIAudioTranscriptLoader 允许使用 AssemblyAI API 转录音频文件,并将转录后的文本加载到文档中。 要使用它,您应安装 assemblyai python 包,并设置环境变量 ASSEMBLYAI_API_KEY 为您的 API 密钥。或者,API 密钥也可以作为参数传递。 关于 AssemblyAI 的更多信息:
安装
首先,您需要安装assemblyai python 包。 您可以在 assemblyai-python-sdk GitHub 仓库中找到更多相关信息。示例
AssemblyAIAudioTranscriptLoader 至少需要 file_path 参数。音频文件可以指定为 URL 或本地文件路径。
loader.load() 会阻塞直到转录完成。 转录的文本在 page_content 中可用:metadata 包含完整的 JSON 响应以及更多元信息
转录格式
您可以指定transcript_format 参数来获取不同的格式。 根据格式的不同,会返回一个或多个文档。以下是不同的 TranscriptFormat 选项:TEXT:一个包含转录文本的文档SENTENCES:多个文档,按每个句子分割转录内容PARAGRAPHS:多个文档,按每个段落分割转录内容SUBTITLES_SRT:一个包含以 SRT 字幕格式导出的转录内容的文档SUBTITLES_VTT:一个包含以 VTT 字幕格式导出的转录内容的文档
转录配置
您还可以指定config 参数来使用不同的音频智能模型。 请访问 AssemblyAI API 文档 以获取所有可用模型的概览!将 API 密钥作为参数传递
除了将 API 密钥设置为环境变量ASSEMBLYAI_API_KEY 外,也可以将其作为参数传递。
以编程方式连接这些文档到 Claude、VSCode 等,通过 MCP 获取实时答案。