模型资源
模型资源是由已托管上游 Key 检测得到的可调度模型实例。它不只是一个模型名称,还关联了上游、凭证、健康状态和路由可用性。
模型资源从哪里来
上游 Key
-> 拉取厂商模型列表
-> 持久化模型资源
-> 匹配模型规格库
-> 供配置 API 选择和调度同一模型 ID 可能在多个上游或多个凭证中出现。Lumoswitch 会把它们视为不同的资源来源,便于健康检查和故障转移。
检测模型
- 至少完成一个 上游接入。
- 进入 模型资源。
- 执行模型检测。
- 等待页面返回已发现数量。
- 核对模型 ID、厂商、上游来源和健康状态。
检测结果会持久化,不需要在每次请求前重新拉取。当上游 Key、模型权限或厂商可用列表变化时,应重新检测。
资源清单字段
| 字段 | 含义 |
|---|---|
| 模型 ID | 厂商返回的真实模型标识 |
| 显示名称 | 匹配规格库后的可读名称 |
| 厂商 / 上游 | 该资源实际使用的服务来源 |
| 健康状态 | 最近检测或调用信号 |
| 可路由 | 是否可作为配置 API 的候选资源 |
| 能力 / 上下文 | 从模型规格库补全的能力和上下文信息 |
健康状态
| 状态 | 说明 |
|---|---|
| 健康 | 最近检测成功,可作为调度候选 |
| 异常 | 最近检测或调用失败 |
| 已过期 | 健康结果过旧,需重新检测 |
| 未拉取到 | 当前上游未再返回该模型 |
| 健康未知 | 尚无足够的检测信号 |
模型规格匹配
Lumoswitch 会使用厂商和模型 ID 匹配平台维护的模型规格库,用于补全:
- 上下文长度
- 能力标签
- 输入与输出价格信息
- 目录状态
模型规格库是平台级数据,普通用户可以查看匹配结果,但由管理员统一维护规格。
与配置 API 的关系
创建配置 API 时,选择的是模型资源,而不是手工输入一个未知模型名称。对外暴露的模型名称可以与上游真实模型 ID 不同。
例如:
对外模型:lumos-chat
-> 候选资源 1:DeepSeek / deepseek-chat
-> 候选资源 2:OpenAI / gpt-4o-mini没有检测到模型
- 在上游页面执行连接测试。
- 确认 API Key 有权限访问模型列表。
- 确认 Base URL 包含正确的 API 路径前缀。
- 检查账户余额、组织或地域限制。
- 如果厂商不支持列表模型,核对当前连接器与预设是否适用。