本地模型接入

Lumoswitch 可通过 Ollama 或 LM Studio 的 OpenAI-compatible 接口接入本地模型。关键前提是 Lumoswitch Gateway 必须能够访问模型服务所在地址。

Ollama

在 Ollama 中拉取并启动模型。
确认 OpenAI-compatible 接口可访问。
在 Lumoswitch 新增 Ollama 上游。
填写 Gateway 实际可访问的 Base URL，例如 http://127.0.0.1:11434/v1。
保存后执行连接测试和模型检测。

默认示例模型为 llama3.2，实际应使用 ollama list 中存在的模型。

LM Studio

在 LM Studio 下载并加载模型。
启动 Local Server。
在 Lumoswitch 新增 LM Studio 上游。
Base URL 通常为 http://127.0.0.1:1234/v1。
执行连接测试、模型检测和聊天测试。

`localhost` 的含义

localhost 永远指向 Lumoswitch Gateway 自己所在的机器或容器，而不一定是你的电脑。

场景	应使用的地址
Gateway 与模型服务在同一台主机	`127.0.0.1` 或本机地址
Gateway 与模型服务在不同容器	容器服务名或容器网络地址
Gateway 在远程服务器	远程服务器可访问的内网地址
使用托管版 Lumoswitch	托管服务通常无法访问你的本机 `localhost`

不要为了方便把本地模型端口直接暴露到公网。优先使用受控内网、VPN 或安全隧道。

私有地址限制

部分 Lumoswitch 实例会拒绝访问私有 IP，以降低 SSRF 风险。如果连接测试提示私有地址被禁止，需要联系实例管理员确认是否允许本地上游；普通用户无法通过更换 Key 绕过此限制。

常见问题

模型列表为空：确认模型已下载并由服务加载。
Gateway 连接失败：从 Gateway 所在网络测试 Base URL，而不是只在浏览器中测试。
Docker 中 127.0.0.1 无效：改用模型服务容器名或宿主机可达地址。
请求很慢：检查本机推理资源、上下文长度和并发请求数。

协议与兼容性 API 参考