本笔记本的目标
本笔记本展示了一个将 OpenAI 链部署到生产环境的简单示例。您可以将其扩展以部署您自己的自托管模型,您可以轻松定义运行模型在生产中高效所需的硬件资源(GPU 和 CPU)数量。有关可用选项(包括自动扩缩)的更多信息,请参阅 Ray Serve 文档。设置 Ray Serve
使用pip install ray[serve] 安装 ray。
通用框架
部署服务的一般框架如下:部署带自定义提示的 OpenAI 链的示例
从此处获取 OpenAI API 密钥。运行以下代码时,系统会要求您提供 API 密钥。localhost:8282 上,我们可以发送 POST 请求以获取结果。
以编程方式连接这些文档到 Claude、VSCode 等,通过 MCP 获取实时答案。