Xinference 是一个功能强大且用途广泛的库,旨在为 LLM、语音识别模型和多模态模型提供服务,即使在您的笔记本电脑上也能运行。使用 Xorbits Inference,您只需一条命令即可轻松部署和提供您自己的或最先进的内置模型。安装和设置
Xinference 可以通过 pip 从 PyPI 安装LLM
Xinference 支持各种兼容 GGML 的模型,包括 chatglm、baichuan、whisper、vicuna 和 orca。要查看内置模型,请运行命令Xinference 的封装
您可以通过运行以下命令启动 Xinference 的本地实例用法
有关更多信息和详细示例,请参阅 xinference LLM 的示例嵌入
Xinference 还支持嵌入查询和文档。有关更详细的演示,请参阅 xinference 嵌入的示例。Xinference LangChain 合作伙伴包安装
通过以下方式安装集成包聊天模型
LLM
以编程方式连接这些文档到 Claude、VSCode 等,通过 MCP 获取实时答案。