写在前面:Hermes Agent能做什么?

Hermes Agent不是一个“一问一答”的聊天机器人,而是一个能长期运行、自我进化、主动干活的AI智能体。它的核心能力包括:
| 能力 | 说明 | 一句话示例 |
|---|---|---|
| 自然语言操控电脑 | 用中文指令完成文件操作、代码编辑 | “帮我把桌面所有Excel合并成一个” |
| 持久化记忆 | 跨会话记住你的偏好和项目信息 | 几周后还记得你的工作目录 |
| 自我进化技能 | 完成任务后自动提炼经验为Skill | 下次同类任务直接调用,不用重来 |
| 定时自动化 | 用自然语言设置定时任务 | “每天早上8点把新闻发我微信” |
| 多平台接入 | 微信/飞书/钉钉/Telegram远程控制 | 手机上指挥电脑干活 |
| 子Agent委派 | 同时启动多个AI并行处理 | 三个任务10分钟全搞定 |
| 浏览器自动化 | 像人一样操作网页 | 自动填表单、抓数据、截图 |
读完这篇文章,你会知道怎么把这些能力全部用起来。
第一部分:终端命令大全
1.1 基础命令
| 命令 | 说明 | 示例 |
|---|---|---|
hermes | 启动交互式对话 | 直接输入即可 |
hermes --continue | 恢复上一次会话 | 继续昨天的项目讨论 |
hermes --version | 查看版本 | 确认安装成功 |
hermes doctor | 诊断系统问题 | 排查环境问题 |
1.2 配置命令
| 命令 | 说明 | 示例 |
|---|---|---|
hermes setup | 完整配置向导 | 首次配置推荐使用 |
hermes model | 配置/切换大模型 | 在交互菜单中选择 |
hermes tools | 配置工具权限 | 启用/禁用工具集 |
hermes config edit | 编辑配置文件 | 手动修改YAML配置 |
hermes config list | 查看当前配置 | 确认配置生效 |
1.3 网关命令
| 命令 | 说明 | 示例 |
|---|---|---|
hermes gateway setup | 配置消息平台 | 接入微信/飞书/Telegram |
hermes gateway start | 启动网关服务 | 后台运行 |
hermes gateway status | 查看网关状态 | 检查连接 |
1.4 定时任务命令
| 命令 | 说明 | 示例 |
|---|---|---|
/cron add | 添加定时任务 | /cron add "每天早上8点" "推送新闻" |
/cron list | 查看所有任务 | 列出已配置的定时任务 |
/cron remove | 删除任务 | /cron remove 1 |
1.5 记忆与技能命令
| 命令 | 说明 | 示例 |
|---|---|---|
/model | 切换模型 | 在对话中直接切换 |
/compress | 压缩会话历史 | 节省token |
/usage | 查看消耗 | 监控API费用 |
第二部分:对话指令实战技巧
2.1 如何写一个高质量Prompt
给Hermes下指令时,遵循以下公式:
[操作对象] + [具体动作] + [输出格式] + [边界条件]
错误示例:
“帮我整理一下文件”
正确示例:
“帮我把桌面‘待处理’文件夹中所有Word文档,按修改日期倒序排列,移动到‘已处理_日期’文件夹。操作前先问我确认。”
实战案例:让Hermes生成小程序
代码语言:TXT自动换行AI代码解释
帮我用微信小程序写一个“今日运势”应用。功能如下: 1. 首页有一个“开始占卜”按钮 2. 点击后随机显示一条运势文案(好运/中运/小吉) 3. 不同运势对应不同的背景色 4. 生成完整的项目代码,可以直接导入微信开发者工具运行
2.2 文件操作指令
| 任务 | 指令示例 |
|---|---|
| 批量分类 | “把E盘WorkBuddy文件夹里2026年3月的所有md文章,按发布日期分类,每个日期建一个文件夹归档” |
| 批量改名 | “把‘工作文档’文件夹里所有‘草稿_’开头的Word文件,重命名为‘定稿_日期_原文件名’” |
| 内容查找 | “帮我找E盘里内容同时包含‘AI’和‘Hermes’的所有文档,按修改时间倒序排列” |
| 清理文件 | “帮我删除桌面超过6个月没打开的安装包和压缩包,操作前先问我” |
2.3 网页与信息采集指令
| 任务 | 指令示例 |
|---|---|
| 搜索信息 | “搜索‘2026 AI智能体发展趋势’的前5条新闻,把标题和链接整理成表格” |
| 抓取价格 | “访问淘宝搜索‘智能手表’,抓取前3个商品的价格和店铺名” |
| 截图保存 | “打开知乎搜索‘Hermes Agent测评’,截取前3条回答的完整内容截图” |
| 监控更新 | “每天早上9点,检查竞品A的商品页价格,有变动时微信通知我” |
2.4 代码开发指令
| 任务 | 指令示例 |
|---|---|
| 生成代码 | “帮我写一个Python脚本,读取Excel文件,计算每列的平均值,输出到新文件” |
| 调试修复 | “运行时报错‘module not found’,帮我安装缺失的依赖并重新运行” |
| 代码审查 | “审查这个PR的代码质量,指出潜在的性能问题和安全风险” |
| 项目理解 | “帮我理解这个代码仓库的架构,生成一份README文档” |
2.5 定时任务指令
Hermes支持用自然语言创建定时任务,底层是标准cron系统:
代码语言:TXT自动换行AI代码解释
/cron add "每天早上8点" "抓取Hacker News的AI新闻,总结摘要发到我微信"
代码语言:TXT自动换行AI代码解释
/cron add "每周五下午4点" "汇总本周的销售数据,生成图表保存到桌面"
代码语言:TXT自动换行AI代码解释
/cron add "每2小时" "检查服务器状态,如果CPU超过80%就发告警"
SILENT模式:如果你的任务是监控性质的,可以在指令里加上“如果一切正常,不要通知”。Hermes在健康时不打扰你,只有出问题时才发通知。
第三部分:隐藏技巧与进阶玩法
3.1 SOUL.md:给Agent装上“灵魂”
Hermes启动后第一件事不是跟你聊天,而是读一个叫SOUL.md的文件。这个文件定义了Agent的“人格”——每次对话都会被注入到系统提示词里。
不改SOUL.md的效果:Hermes是一个礼貌但无趣的通用助手。
改完SOUL.md的效果:Hermes变成有观点、有态度、有性格的专属助手。
如何修改SOUL.md:
代码语言:Bash自动换行AI代码解释
# 找到SOUL.md文件位置 ls ~/.hermes/SOUL.md # 用任意编辑器打开 vim ~/.hermes/SOUL.md
推荐修改内容(社区验证有效的“The Molty Prompt”):
展开 代码语言:Markdown自动换行AI代码解释
# 我的身份 我是你的AI助手,不是客服机器人。 # 我的原则 - 我有自己的观点,不会只说“取决于情况” - 删掉所有听起来像企业客服的规则 - 禁止用“好问题”“我很乐意帮你”开头 - 直接回答,不废话 - 简洁是硬要求 - 可以直接指出问题 - 做你凌晨两点还想聊天的那种助手
建议:不要一次写太长,保持在1KB以内。写你反复需要纠正的行为规则,而不是泛泛的性格描述。“别用感叹号”比“要简洁有力”有用一百倍。
3.2 AGENTS.md:项目级的“工作手册”
如果你同时在多个项目上使用Hermes,AGENTS.md是必须理解的机制。
在每个项目的根目录放一个AGENTS.md文件,Hermes每次在该目录下工作时会自动读取它。里面写的是这个项目的特定规则:
展开 代码语言:Markdown自动换行AI代码解释
# 项目规则 ## 技术栈 - 这是一个FastAPI后端项目 - 使用SQLAlchemy ORM - 数据库操作必须用async/await - 测试放在tests/目录,用pytest-asyncio ## 禁止事项 - 绝对不要提交.env文件 - 不要修改requirements.txt - 不要在生产环境使用调试模式
这相当于给每个项目配了一份专属的“入职手册”。Hermes不需要你每次重新交代这些规则。
关键细节:根目录的AGENTS.md在会话启动时就加载,子目录的文件是惰性发现的。把最重要的规则放在根目录。
兼容Cursor规则:Hermes也会读.cursorrules和.cursor/rules/*.mdc,如果你之前用Cursor写过规则,直接就能复用。
3.3 记忆系统:让Agent真正“记住”你
Hermes的Memory分三层:
| 层级 | 存储位置 | 内容 | 容量 |
|---|---|---|---|
| 会话记忆 | 内存 | 当前对话上下文 | 会话结束时清空 |
| 持久记忆 | MEMORY.md + USER.md | 事实和偏好 | 约2200+1375字符 |
| 技能记忆 | Skills目录 | 可复用工作流 | 无限制 |
关键在于:这些Memory是跨会话的。你今天告诉Hermes“我用的是M1 Mac”,三天后新建一个会话,它还记得。
手动管理Memory:
展开 代码语言:TXT自动换行AI代码解释
# 让Hermes主动总结经验 “把这次的关键经验存到MEMORY.md” # 查看当前记忆 cat ~/.hermes/MEMORY.md # 手动编辑记忆 vim ~/.hermes/MEMORY.md
进阶玩法:定期让Hermes在空闲时做Memory维护——读最近几天的对话记录,提炼有价值的经验更新到长期记忆里。相当于让AI自己做“复盘”。
3.4 Skill系统:Agent的“肌肉记忆”
Skill是Hermes最被低估的功能。大多数人以为Skill就是“插件”,但Skill的真正价值不在于单个Skill有多强大,而在于多个Skill组合后产生的化学反应。
Skill是什么:每个Skill是一个存储在~/.hermes/skills/目录下的Markdown文件,里面写的是“如何完成某类任务”的步骤说明。来源包括框架自带的40多个预置Skill、社区Hub,以及——Agent自主创建。
Hermes如何自动创建Skill:
当你完成一个复杂任务后,Hermes会自动将成功的过程提炼成一个Skill文件。下次做类似的事,它不会重新推理,而是直接调用这个Skill。
代码语言:TXT自动换行AI代码解释
# 主动让Hermes保存Skill “把刚才做的数据清洗流程保存为一个Skill”
Skill自改进:当用户对Skill的执行结果给出反馈时,Hermes不仅能调整当前输出,还会自动回溯并修改对应的Skill文件本身,使得该技能在未来使用时能直接应用改进后的方案。
Skill设计的核心原则:
单一职责:每个Skill只做一件事
文件系统传递:Skill之间通过文件交换数据,不依赖内存变量
幂等性:重复运行同一个输入不会产生副作用
可观测:每一步都有详细的日志和输出文件
容错设计:单个步骤失败不影响其他步骤
3.5 Subagent委派:让多个AI同时替你干活
Hermes有一个叫delegate_task的工具,能从当前会话里派生出独立的子Agent。
这意味着什么:你可以并行处理多个任务。
传统方式:一个接一个做,每个10分钟,总共30分钟。
Subagent方式:三个同时跑,10分钟搞定。
如何使用:
展开 代码语言:TXT自动换行AI代码解释
delegate_task( tasks=[
{"goal": "审查这个PR的代码质量", "toolsets": ["terminal", "file"]}, {"goal": "搜索竞品X最近的融资动态", "toolsets": ["web"]}, {"goal": "整理这份文档的目录结构", "toolsets": ["file"]}, ] )子Agent的特点:
拿到的是你给它的目标和上下文,没有主会话的冗余历史 → 干活更专注、更快
可以给子Agent指定不同的模型(简单任务用便宜模型,复杂推理用旗舰模型)
最终只返回摘要结果,主会话的token不被中间数据淹没
3.6 Cron定时任务:让Agent在你睡觉时干活
很多人不知道Hermes有完整的定时任务系统。
创建方式极其简单,你甚至不需要记cron表达式:
代码语言:TXT自动换行AI代码解释
/cron add "every morning at 9am" "Check Hacker News for AI news and send me a summary"
Hermes会自动把自然语言翻译成定时任务。
进阶用法:Cron任务可以挂载Skill:
代码语言:TXT自动换行AI代码解释
/cron add "every 6h" "Look for new local events" --skill blogwatcher --skill find-nearby
多个Skill可以同时挂在一个Cron任务上。这意味着你的定时任务不是简单的“执行脚本”,而是“带专业技能的AI在特定时间帮你做决策”。
3.7 多模型切换技巧
Hermes支持在对话中实时切换模型:
代码语言:TXT自动换行AI代码解释
# 在对话中输入 /model openrouter:google/gemini-2.5-pro /model qwen2.5:7b
多模型配置示例(~/.hermes/config.yaml):
展开 代码语言:YAML自动换行AI代码解释
providers: openrouter: api_key: '你的_OPENROUTER_KEY' deepseek: api_key: '你的_DEEPSEEK_KEY' base_url: 'https://api.deepseek.com/v1' ollama: base_url: 'http://localhost:11434' model: default: 'openrouter/auto'
3.8 接入微信/飞书
Hermes原生支持微信接入,扫码即可绑定。
安装依赖:
代码语言:Bash自动换行AI代码解释
pip install aiohttp cryptography # 可选:在终端显示二维码 pip install qrcode
启动Gateway配置向导:
代码语言:Bash自动换行AI代码解释
hermes gateway setup
在渠道列表中选择「Weixin」,按提示扫码登录即可。配置完成后,你的微信小号就变成了一个能随时指挥的AI入口。
3.9 浏览器自动化
Hermes可以像人一样操作浏览器:
代码语言:TXT自动换行AI代码解释
“打开淘宝,搜索‘智能手表’,抓取前5个商品的价格和销量”
代码语言:TXT自动换行AI代码解释
“登录公司OA系统,下载本月考勤报表”
代码语言:TXT自动换行AI代码解释
“打开知乎,搜索‘Hermes Agent’,截取第一条回答的完整内容”
3.10 从OpenClaw迁移
如果你之前用OpenClaw,Hermes提供了一键迁移命令:
代码语言:Bash自动换行AI代码解释
hermes claw migrate --dry-run # 预览,不做改动 hermes claw migrate # 完整迁移
它会自动把SOUL.md、MEMORY.md、Skill、模型配置等30多个类别的数据搬过来。注意Session历史和Cron任务定义不会迁移,需要手动重建。
第四部分:实战案例——5个完整工作流
案例1:让Hermes自动写一篇公众号文章
完整指令:
代码语言:TXT自动换行AI代码解释
帮我写一篇关于“AI Agent发展趋势”的公众号文章。要求: 1. 1500字左右 2. 包含Hermes和OpenClaw的对比 3. 有小标题分段 4. 语言通俗易懂 5. 生成后保存到桌面“AI文章.md”
Hermes会:搜索资料 → 组织结构 → 撰写内容 → 保存文件。
核心亮点:完成这篇文章后,Hermes会自动把整个写作流程提炼成一个Skill。下次你再让它写公众号文章时,它会直接调用这个Skill,几秒钟就能生成符合你风格的文章。
案例2:让Hermes监控GitHub仓库PR
完整指令:
代码语言:TXT自动换行AI代码解释
帮我创建一个技能:每天检查我的GitHub仓库“my-project”是否有新的PR, 如果有,把PR标题和链接整理成摘要发到我的微信。
Hermes会:分析任务 → 调用GitHub API → 编写Python脚本 → 配置定时任务 → 自动将流程固化为Skill。
案例3:让Hermes生成电商商品图
完整指令:
展开 代码语言:TXT自动换行AI代码解释
帮我完成这款无线耳机的商品上架准备工作: 1. 先用FLUX生成一张白底主图,纯白背景、银色耳机、左侧放置产品、右侧留白,尺寸1600×1600 2. 再用FLUX生成一张场景图,商务人士佩戴耳机在咖啡馆工作,16:9宽屏,自然光 3. 根据这款耳机的核心卖点(主动降噪、40小时续航、蓝牙5.3),写一段亚马逊Listing的5点描述 4. 把生成的两张图和文案保存到桌面/amazon_listing/文件夹 5. 用browser_automation打开亚马逊卖家后台,自动填写商品信息并上传图片
Hermes会按顺序执行:调用FLUX生成图片 → 调用大模型生成文案 → 调用文件工具保存 → 调用浏览器自动化上传。
案例4:让Hermes做数据日报
完整指令:
代码语言:TXT自动换行AI代码解释
每天早上9点自动执行: 1. 读取销售数据文件夹中昨天的Excel文件 2. 计算销售额、订单量、转化率 3. 生成可视化图表 4. 把结果发送到我的企业微信
设置完成后,每天到点自动执行,全程无人值守。
案例5:让Hermes管理多个社交媒体账号
Skill组合实战:用5个Skill串出一条Twitter自动化流水线:
| Skill | 职责 |
|---|---|
| 克隆 | 采集30条推文,输出人格画像 |
| 采集 | 根据话题搜索最近12小时新闻素材 |
| 创作 | 结合画像+素材生成原创推文 |
| 配图 | 为推文生成视觉统一配图 |
| 发布 | 批量发布,支持三种模式 |
整条流水线每天早上9点自动跑,生成3-5条推文,分散发布。实测分散发布比集中发布互动率高出大约40%。
第五部分:避坑指南
坑1:Windows用户直接安装失败
解决方案:Hermes Agent支持原生Windows部署,如果遇到问题,推荐使用WSL2或阿里云轻量应用服务器。
坑2:模型未被识别,名称显示为空
解决方案:在对话中输入/model命令手动指定模型。
坑3:API Key配置不生效
解决方案:
确认密钥放在
~/.hermes/.env中,而非config.yaml检查密钥前后有无多余空格
运行
hermes config env-path确认当前加载的.env文件路径
坑4:base_url配置后请求返回404
解决方案:确保base_url以/v1结尾。例如https://api.example.com/v1,而不是https://api.example.com。
坑5:微信回复被截断
原因:微信单条消息有4000 token上限。
解决方案:让回答保持简洁,或分多次询问。目前暂无完美解决方案。
坑6:2GB内存服务器卡顿
解决方案:创建Swap分区扩展虚拟内存:
代码语言:Bash自动换行AI代码解释
fallocate -l 4G /swapfile chmod 600 /swapfile mkswap /swapfile swapon /swapfile echo '/swapfile none swap sw 0 0' | tee -a /etc/fstab
建议直接买2核4G配置,省去这个麻烦。
总结:从“聊天”到“干活”的进阶路线
| 阶段 | 核心能力 | 关键指令/操作 |
|---|---|---|
| L1 入门 | 基础对话、文件操作 | hermes + 自然语言指令 |
| L2 进阶 | 记忆管理、项目规则 | 编辑SOUL.md、AGENTS.md |
| L3 高手 | 技能系统、定时任务 | /cron add、Skill提炼 |
| L4 专家 | 子Agent委派、多模型切换 | delegate_task、/model |
Hermes最反直觉的地方在于,它不是一个“工具”,而是一个会成长的系统。
你用得越久,它越了解你。你踩过的坑变成了它的Skill,你的偏好写进了它的Memory,你的项目规则刻在它的AGENTS.md里。三个月后你会发现,它已经不只是一个AI助手了,它更像是一个数字化的你,在你不在的时候继续替你工作。
最后送你一条“验证指令”:
代码语言:TXT自动换行AI代码解释
“帮我写一段100字的自我介绍,说明我是一个会自我进化的AI助手。然后把这段自我介绍保存到桌面‘我的Hermes.txt’”
看到文件被创建出来的那一刻,你的“养马”之旅就正式开始了。
文章来自:https://cloud.tencent.com/developer/article/2658142?policyId=1004
- 本文固定链接: https://www.ttfde.top/index.php/post/457.html
- 转载请注明: admin 于 TTF的家园 发表
《本文》有 0 条评论