配置模型

本页介绍如何为 Hermes 配置大语言模型，包含三种配置方式的差异、API Key 的获取方式、管理台配置步骤、支持的模型列表以及选型建议。

本页覆盖

三种配置方式的差异（Coding Plan / API / 自定义模型）
API Key 的获取方式
管理台配置步骤
模型切换
支持的模型
模型选型建议

三种配置方式

管理台「模型」卡片第一级下拉提供三个选项：

方式	计费模式	API Key 来源	适用场景
模型 Coding Plan	包月/包年	服务商	高频使用
模型 API	按量	服务商	低频或试用
自定义模型	取决于端点	用户自备	接入国外模型或 OpenAI 兼容端点

获取 API Key 的通用流程

各服务商的界面不同，但流程一致：

访问服务商官网：在管理台模型卡片选中某个模型后，下方显示「点击获取 API KEY」外链，点击可直达该服务商官网
注册或登录账号：多数国内平台支持微信或手机号登录
完成实名认证：国内模型服务商普遍要求实名认证后方可调用 API
进入 API Key 管理页：通常位于"控制台 → API 管理 / 密钥管理 / 访问凭证"
创建新 Key：为 Key 命名（如 LightVela），创建后立即复制。多数平台只在创建时显示一次
回到 LightVela 粘贴 Key

在管理台配置

进入管理台，打开「模型」按键。

配置步骤

选择来源（第一级下拉）：模型 API / 模型 Coding Plan / 自定义模型
选择具体模型（第二级下拉）：根据上一步的来源显示可用列表
填入 API Key：粘贴已获取的 Key。右侧眼睛图标可切换显示状态
点击「添加为默认」
下方「当前模型」列表出现对应记录即表示配置成功

自定义模型的附加字段

选择「自定义模型」时，除 API Key 外通常还需填写：

Base URL：模型服务的 API 地址，例如 https://api.openai.com/v1
Model Name：模型标识，例如 gpt-4o、claude-3-5-sonnet-20241022

具体字段以管理台界面为准。

配置腾讯云 Token Plan 套餐

腾讯云 Token Plan 套餐按包月方式计费，同等用量下费用相比按量调用节省超过 50%，已集成腾讯混元、智谱 GLM、Kimi-K2.5、MiniMax M2.5 等多种模型，并支持由系统自动选择合适的模型。

1. 选择腾讯云 Token Plan

在管理台「模型」卡片的第一级下拉中选择「模型 Coding Plan」，第二级下拉中选择「腾讯云 Token Plan」。

模型下拉用于指定实际调用的模型，默认为「自动」，也可按需手动指定。

2. 获取 API Key

单击卡片下方「点击获取 API KEY」链接，跳转至腾讯云 Token Plan 页面，按页面指引完成套餐选购后，在密钥管理处创建并复制 API Key。

🔔 已购买账号无需重复选购

若当前登录的腾讯云账号此前已选购过 Token Plan，可直接在密钥管理处创建 API Key。

3. 回到管理台粘贴 Key

返回 LightVela 管理台，将复制好的 API Key 粘贴至「API Key」输入框。

4. 添加为默认

单击「添加为默认」。下方「当前模型」列表出现对应记录，即表示配置成功。

切换模型

切换方式

重新执行配置步骤，新的「添加为默认」将覆盖原有配置。

切换对记忆的影响

切换模型不会影响对话记忆。记忆为 Hermes 自身数据，模型仅负责生成响应。

支持的模型

模型 Coding Plan（包月）

名称	服务商
MiniMax Token Plan（国内）	MiniMax
腾讯云 Token Plan	腾讯云
腾讯云 Coding Plan	腾讯云
百炼 Coding Plan	阿里云百炼
智谱 Coding Plan（国内）	智谱 AI
火山引擎方舟 Coding Plan	火山引擎（字节）
Kimi Coding Plan	Moonshot AI
百度千帆 Coding Plan	百度

模型 API（按量）

名称	服务商
深度求索（DeepSeek）	深度求索
百炼（千问）	阿里
MiniMax	MiniMax
Moonshot AI（Kimi）	Moonshot
智谱 AI（GLM）	智谱
火山引擎（豆包）	字节
小米 MiMo	小米
百度（文心一言）	百度

自定义模型

任何兼容 OpenAI Chat Completions 协议的端点均可接入，包括：

国外大模型：Claude、GPT-4/5、Gemini（通过官方 API 或中转服务）
自建模型：vLLM、Ollama、LM Studio 等暴露 OpenAI 兼容端点的服务
聚合平台：OpenRouter 等

选型参考

不同关注点对应的选型方向：

关注点	参考方向
免费额度	多数国内服务商新账号提供免费额度，可先行试用
长文本处理	选择上下文长度大的模型（如 Moonshot AI）
响应速度	不同服务商差异较大，以实际体验为准
中文理解	国内模型对中文支持普遍更好
高频使用	选择对应服务商的 Coding Plan 包月套餐
使用 Claude / GPT / Gemini	选择自定义模型，自备可访问端点

建议：先通过启航套餐的体验积分进行若干轮对话，确认 Hermes 工作正常后再决定模型选型。

常见问题

现象	可能原因	处理方式
填入 Key 后「当前模型」仍为空	Key 格式错误或含空格	重新复制粘贴，确认首尾无空格
消息发送后长时间无响应	服务商余额不足或 Key 被禁用	在服务商控制台检查余额与 Key 状态
响应内容为乱码或无意义	自定义模型端点不符合 OpenAI 协议	先用其他 OpenAI 兼容客户端验证端点可用性
提示"模型响应超时"	服务商限流或网络波动	稍后重试，或切换其他服务商
不确定自定义模型的 Base URL	—	查阅对应服务的 API 文档，通常为 `https://xxx.com/v1`

对话报错「HTTP 401:InvalidAuthentication」或类似 401 报错

在与 OpenClaw 对话过程中，如果出现 HTTP 401:InvalidAuthentication 或其他 401 xxx 报错提示，通常由以下原因导致：

模型的 API Key 配置错误；
错误混淆了 Coding Plan 和普通模型的 API Key；
错误选择了模型服务商提供的国内版和国际版。

遇到该问题时，建议再次检查模型配置。

本页覆盖

三种配置方式

获取 API Key 的通用流程

在管理台配置

配置步骤

自定义模型的附加字段

配置腾讯云 Token Plan 套餐

1. 选择腾讯云 Token Plan

2. 获取 API Key

3. 回到管理台粘贴 Key

4. 添加为默认

切换模型

切换方式

切换对记忆的影响

支持的模型

模型 Coding Plan（包月）

模型 API（按量）

自定义模型

选型参考

常见问题

对话报错「HTTP 401:InvalidAuthentication」或类似 401 报错

下一步

本页目录