LightVela

配置模型

接入和管理 Hermes 使用的大语言模型。

本页介绍如何为 Hermes 配置大语言模型,包含三种配置方式的差异、API Key 的获取方式、管理台配置步骤、支持的模型列表以及选型建议。


本页覆盖

  • 三种配置方式的差异(Coding Plan / API / 自定义模型)

  • API Key 的获取方式

  • 管理台配置步骤

  • 模型切换

  • 支持的模型

  • 模型选型建议


三种配置方式

管理台「模型」卡片第一级下拉提供三个选项:

方式计费模式API Key 来源适用场景
模型 Coding Plan包月/包年服务商高频使用
模型 API按量服务商低频或试用
自定义模型取决于端点用户自备接入国外模型或 OpenAI 兼容端点

获取 API Key 的通用流程

各服务商的界面不同,但流程一致:

  1. 访问服务商官网:在管理台模型卡片选中某个模型后,下方显示「点击获取 API KEY」外链,点击可直达该服务商官网

  2. 注册或登录账号:多数国内平台支持微信或手机号登录

  3. 完成实名认证:国内模型服务商普遍要求实名认证后方可调用 API

  4. 进入 API Key 管理页:通常位于"控制台 → API 管理 / 密钥管理 / 访问凭证"

  5. 创建新 Key:为 Key 命名(如 LightVela),创建后立即复制。多数平台只在创建时显示一次

  6. 回到 LightVela 粘贴 Key


在管理台配置

进入管理台,打开「模型」按键。

配置步骤

  1. 选择来源(第一级下拉):模型 API / 模型 Coding Plan / 自定义模型

  2. 选择具体模型(第二级下拉):根据上一步的来源显示可用列表

  3. 填入 API Key:粘贴已获取的 Key。右侧眼睛图标可切换显示状态

  4. 点击「添加为默认」

  5. 下方「当前模型」列表出现对应记录即表示配置成功

自定义模型的附加字段

选择「自定义模型」时,除 API Key 外通常还需填写:

  • Base URL:模型服务的 API 地址,例如 https://api.openai.com/v1

  • Model Name:模型标识,例如 gpt-4oclaude-3-5-sonnet-20241022

具体字段以管理台界面为准。


配置腾讯云 Token Plan 套餐

腾讯云 Token Plan 套餐按包月方式计费,同等用量下费用相比按量调用节省超过 50%,已集成腾讯混元、智谱 GLM、Kimi-K2.5、MiniMax M2.5 等多种模型,并支持由系统自动选择合适的模型。

1. 选择腾讯云 Token Plan

在管理台「模型」卡片的第一级下拉中选择「模型 Coding Plan」,第二级下拉中选择「腾讯云 Token Plan」。

模型下拉用于指定实际调用的模型,默认为「自动」,也可按需手动指定。

2. 获取 API Key

单击卡片下方「点击获取 API KEY」链接,跳转至腾讯云 Token Plan 页面,按页面指引完成套餐选购后,在密钥管理处创建并复制 API Key。

🔔 已购买账号无需重复选购

若当前登录的腾讯云账号此前已选购过 Token Plan,可直接在密钥管理处创建 API Key。

3. 回到管理台粘贴 Key

返回 LightVela 管理台,将复制好的 API Key 粘贴至「API Key」输入框。

4. 添加为默认

单击「添加为默认」。下方「当前模型」列表出现对应记录,即表示配置成功。


切换模型

切换方式

重新执行配置步骤,新的「添加为默认」将覆盖原有配置。

切换对记忆的影响

切换模型不会影响对话记忆。记忆为 Hermes 自身数据,模型仅负责生成响应。


支持的模型

模型 Coding Plan(包月)

名称服务商
MiniMax Token Plan(国内)MiniMax
腾讯云 Token Plan腾讯云
腾讯云 Coding Plan腾讯云
百炼 Coding Plan阿里云百炼
智谱 Coding Plan(国内)智谱 AI
火山引擎方舟 Coding Plan火山引擎(字节)
Kimi Coding PlanMoonshot AI
百度千帆 Coding Plan百度

模型 API(按量)

名称服务商
深度求索(DeepSeek)深度求索
百炼(千问)阿里
MiniMaxMiniMax
Moonshot AI(Kimi)Moonshot
智谱 AI(GLM)智谱
火山引擎(豆包)字节
小米 MiMo小米
百度(文心一言)百度

自定义模型

任何兼容 OpenAI Chat Completions 协议的端点均可接入,包括:

  • 国外大模型:Claude、GPT-4/5、Gemini(通过官方 API 或中转服务)

  • 自建模型:vLLM、Ollama、LM Studio 等暴露 OpenAI 兼容端点的服务

  • 聚合平台:OpenRouter 等


选型参考

不同关注点对应的选型方向:

关注点参考方向
免费额度多数国内服务商新账号提供免费额度,可先行试用
长文本处理选择上下文长度大的模型(如 Moonshot AI)
响应速度不同服务商差异较大,以实际体验为准
中文理解国内模型对中文支持普遍更好
高频使用选择对应服务商的 Coding Plan 包月套餐
使用 Claude / GPT / Gemini选择自定义模型,自备可访问端点

建议:先通过启航套餐的体验积分进行若干轮对话,确认 Hermes 工作正常后再决定模型选型。


常见问题

现象可能原因处理方式
填入 Key 后「当前模型」仍为空Key 格式错误或含空格重新复制粘贴,确认首尾无空格
消息发送后长时间无响应服务商余额不足或 Key 被禁用在服务商控制台检查余额与 Key 状态
响应内容为乱码或无意义自定义模型端点不符合 OpenAI 协议先用其他 OpenAI 兼容客户端验证端点可用性
提示"模型响应超时"服务商限流或网络波动稍后重试,或切换其他服务商
不确定自定义模型的 Base URL查阅对应服务的 API 文档,通常为 https://xxx.com/v1

对话报错「HTTP 401:InvalidAuthentication」或类似 401 报错

在与 OpenClaw 对话过程中,如果出现 HTTP 401:InvalidAuthentication 或其他 401 xxx 报错提示,通常由以下原因导致:

  1. 模型的 API Key 配置错误;

  2. 错误混淆了 Coding Plan 和普通模型的 API Key;

  3. 错误选择了模型服务商提供的国内版和国际版。

遇到该问题时,建议再次检查模型配置。


下一步