Lumoswitch
本地模型接入

本地模型接入

Lumoswitch 可通过 Ollama 或 LM Studio 的 OpenAI-compatible 接口接入本地模型。关键前提是 Lumoswitch Gateway 必须能够访问模型服务所在地址。

Ollama

  1. 在 Ollama 中拉取并启动模型。
  2. 确认 OpenAI-compatible 接口可访问。
  3. 在 Lumoswitch 新增 Ollama 上游。
  4. 填写 Gateway 实际可访问的 Base URL,例如 http://127.0.0.1:11434/v1
  5. 保存后执行连接测试和模型检测。

默认示例模型为 llama3.2,实际应使用 ollama list 中存在的模型。

LM Studio

  1. 在 LM Studio 下载并加载模型。
  2. 启动 Local Server。
  3. 在 Lumoswitch 新增 LM Studio 上游。
  4. Base URL 通常为 http://127.0.0.1:1234/v1
  5. 执行连接测试、模型检测和聊天测试。

localhost 的含义

localhost 永远指向 Lumoswitch Gateway 自己所在的机器或容器,而不一定是你的电脑。

场景应使用的地址
Gateway 与模型服务在同一台主机127.0.0.1 或本机地址
Gateway 与模型服务在不同容器容器服务名或容器网络地址
Gateway 在远程服务器远程服务器可访问的内网地址
使用托管版 Lumoswitch托管服务通常无法访问你的本机 localhost

不要为了方便把本地模型端口直接暴露到公网。优先使用受控内网、VPN 或安全隧道。

私有地址限制

部分 Lumoswitch 实例会拒绝访问私有 IP,以降低 SSRF 风险。如果连接测试提示私有地址被禁止,需要联系实例管理员确认是否允许本地上游;普通用户无法通过更换 Key 绕过此限制。

常见问题

  • 模型列表为空:确认模型已下载并由服务加载。
  • Gateway 连接失败:从 Gateway 所在网络测试 Base URL,而不是只在浏览器中测试。
  • Docker 中 127.0.0.1 无效:改用模型服务容器名或宿主机可达地址。
  • 请求很慢:检查本机推理资源、上下文长度和并发请求数。