@changedi
2026-04-28T08:31:49.000000Z
字数 9215
阅读 11
如果有一个AI助手,能记住你的一切工作偏好、持续学习新技能、24小时无人值守执行任务、自动协调多个子任务并行工作——一个人,真的可以等于一支军队。
2024年,少楠(@Get到了桩)还是一名普通的iOS独立开发者,每年要花99美元续费苹果开发者会员。
2024年,他用GPT-4o + Claude 3.5 Sonnet + Cursor,上架了4个APP到App Store——副业追踪分析管理大师、DDLTodo、翻转计时、Paging大狮。
不只是上架,他还在少楠的SideProject社区做了年度回顾功能。
99美元的会员费,早就赚回来了。
同样是2024年,另一位独立开发者idoubi在GitHub写下了这样一段话:
"2024年,我上线了11款AI产品。ThinkAny做到ProductHunt日榜第四,HeyBeauty的虚拟试衣效果领先,ShipAny预售4小时突破1万美金。"
他的工具栈是什么?
- NextJS 全栈开发
- DALL-E 3 AI壁纸生成
- Suno/Udio AI音乐
- Cursor AI代码编辑
- Claude/GPT-4 编程辅助
一个人,11款产品。
不只是个体案例。
根据美国人口普查局的数据,2023年有117,060名独立创业者(Solopreneur)实现了百万美元收入,这个数字是两年前的两倍多。
Forbes在2025年底的报道中写道:
"AI正在重新定义独立创业——以及成功需要什么。"
OpenAI的预测更激进:一人公司可以达到10亿美元估值。Base44、Daymaker、OpenClaw等公司正在用实践验证这个预言。
这不是科幻。这是正在发生的事实。
看到这里,你可能会想:我能不能也在企业里做到"一人成军"?
这是一个好问题。但答案没有那么简单。
独立开发者的成功案例之所以令人振奋,正是因为他们没有历史包袱:没有技术债务,没有生产管控,没有安全合规审查,没有跨部门审批流程。
而企业级生产系统,完全是另一个世界。
我们今天要探讨的,正是:如何在企业级场景下,找到"一人成军"的可能性。
要理解这个问题,我们先要理解一个关键概念:上下文断裂。
你用过ChatGPT吗?你用过Claude吗?它们很强大,但有一个共同的天花板:
每次对话,都是一次全新的开始。
用户:帮我写一个用户注册APIAI: [生成代码]用户:接下来,添加登录功能AI: [生成代码,但可能需要重新解释上下文]用户:这个项目是做什么的?AI: [一脸茫然] 我不知道...
每次新的对话,AI都会"失忆"。它不知道:
- 你的项目是什么
- 你之前做了什么决策
- 你的编码风格偏好
- 你踩过哪些坑
这就是上下文断裂。
如果我们想要一个AI Agent真正提升个人生产力,它需要满足三个标准:
标准1:持久记忆
不只是单会话的上下文,而是跨会话、跨时间记住所有重要信息。
标准2:能力进化
不是每次都从零开始,而是能从经验中学习,持续变强。
标准3:持续执行
不只是被动响应,而是能主动、持续地完成任务,无需人工干预。
大多数AI助手,只能满足第3点(被动响应),距离"真正生产力"还有很大距离。
在深入技术细节之前,我想先分享一个重要的认知转变。
Copilot(副驾驶):你在开车,AI帮你看地图。它是被动的、辅助的。
Agent(智能体):你设定目标,AI去执行。它是主动的、执行的。
Hermes Agent属于后者。
它不是一个等待你提问的工具,而是一个会主动思考、记忆、学习、执行的AI队友。
让我用一张图来解释Hermes的核心架构:

Hermes Agent由四大核心系统构成:
| 系统 | 功能 | 技术实现 |
|---|---|---|
| 记忆系统 | 跨会话持久记忆 | FTS5 + LLM摘要 |
| 技能系统 | 自动创建可复用技能 | agentskills.io标准 |
| 工具生态 | 40+内置工具 + MCP扩展 | 函数调用 + API集成 |
| 调度系统 | Cron定时 + 子Agent并行 | 事件驱动架构 |
每一套系统,都指向同一个目标:让AI真正成为你的长期队友,而不只是工具。
这一章,我们深入探讨Hermes Agent的三大核心能力。
想象一下这个场景:
第一天:你花了30分钟,向AI介绍你的项目背景、技术栈、编码规范、团队约定。
第二天:你打开新的对话,问AI:"继续昨天的任务。"
AI的回复是:"抱歉,我不知道你在说什么。"
这就是传统AI的记忆困境。
Hermes Agent通过三层机制解决记忆问题:
第一层:上下文文件(Context Files)
在项目根目录放置特殊文件,Hermes会自动发现并加载:
# .hermes.md - 项目级上下文# AGENTS.md - Agent行为规范# SOUL.md - Agent人格定义# CLAUDE.md - Claude兼容配置
第二层:持久记忆(Persistent Memory)
通过MEMORY.md和USER.md存储跨会话信息:
# MEMORY.md - 系统记忆- 用户使用Python为主- 偏好TypeScript风格注释- 喜欢在代码中留TODO注释- 上次完成了用户认证模块# USER.md - 用户画像- 技术栈:Python + FastAPI + React- 编码风格:详细注释、类型标注- 时区:UTC+8
第三层:FTS5全文搜索 + LLM摘要
当记忆积累到一定程度,如何快速检索?
Hermes使用FTS5全文搜索引擎,配合LLM summarization:

1. 所有对话历史 → 存入SQLite数据库2. FTS5建立全文索引 → 支持高速搜索3. LLM生成摘要压缩 → 保持记忆精简4. 需要时快速召回 → 注入到当前上下文
有了持久记忆,Hermes可以做到:
第一次对话(陌生):"我的项目使用FastAPI,我需要添加JWT认证"第二次对话(认识你):"继续完善认证模块,注意要和之前的OAuth实现保持风格一致"✅ 自动加载项目上下文✅ 理解之前的OAuth实现✅ 保持编码风格统一第三次对话(更熟悉):"添加单元测试"✅ 了解项目结构✅ 知道测试框架偏好✅ 理解认证模块的边界
这不是魔法,这是记忆的力量。
回顾idoubi的案例,他在2024年做了11款产品。
每一款产品,从立项到上线,都是一次完整的学习过程。但如果每次做新产品,都要重新学习一遍"怎么用Cursor更高效"、"什么样的提示词更适合做壁纸生成器",效率就会大打折扣。
技能系统解决的是这个问题——让AI从经验中学习,把成功的方法论固化成可复用的模式。
Hermes Agent不只能使用技能,还能自主创建技能。
工作流程:
1. 观察成功交互↓2. 抽象为可复用的模式↓3. 编码为技能文件(Markdown格式)↓4. 存储到技能库↓5. 下次遇到类似任务,自动加载使用
技能文件示例(skills/code-review.md):
# Code Review Skill## 触发条件- 用户要求审查代码- 提交了Pull Request- 发现潜在问题## 执行步骤1. 理解代码意图和上下文2. 检查代码风格一致性3. 识别潜在bug和安全风险4. 评估性能影响5. 提供具体的改进建议## 输出格式- 问题列表(严重程度 + 位置)- 建议优先级- 示例代码(如果需要)## 注意事项- 优先关注功能性bug- 安全问题要明确标注- 保持建设性的语气
Hermes的技能系统基于agentskills.io开放标准,这意味着:
这就像是AI时代的"开源技能库"。
Hermes内置调度系统,支持自然语言或Cron表达式定义任务:
用户:每天早上8点,爬取竞品数据,生成分析报告,发到飞书群Hermes:✅ 已创建定时任务📅 时间:每天 08:00 (UTC+8)📍 触发:自动执行 + 报告推送🔗 目标:飞书
不需要写一行代码,Hermes就能帮你设置完整的自动化流程。
回顾idoubi做11款产品的过程。如果有一款产品失败了,他会怎么做?
正常流程是:分析失败原因 → 调整策略 → 继续下一款。
但Hermes可以做得更聪明——并行执行。
复杂任务,Hermes可以拆解为多个子任务,同时处理:
主任务:完成产品发布准备拆分方案:├── 子Agent-1:前端界面检查├── 子Agent-2:后端API测试├── 子Agent-3:文档更新└── 子Agent-4:监控告警配置并行执行 → 汇总结果 → 主Agent协调
每个子Agent有独立的上下文和工具集,可以同时处理不同的工作流。
Hermes支持Webhook,可以响应外部事件触发自动化:
代码提交 → 触发自动化流程→ Hermes自动运行测试→ 生成测试报告→ 通知结果到企业微信/钉钉群
在国内企业场景下,Hermes可以无缝集成主流办公平台:
| 平台 | 适用场景 | 集成方式 |
|---|---|---|
| 飞书 | 日常沟通、文档协作 | 消息推送、群机器人 |
| 钉钉 | 企业办公、审批流程 | 机器人、Webhook |
| 企业微信 | 内部沟通、客户对接 | 应用消息、群通知 |
示例:钉钉告警配置用户:项目有异常时,推送到钉钉"运维告警"群Hermes:✅ 已创建钉钉机器人✅ 已配置告警规则:ERROR日志 → 钉钉消息✅ 已配置告警规则:接口响应 > 5s → 钉钉消息
作为技术从业者,你可能已经在使用其他AI工具。那么Hermes和其他工具有什么区别?
| 维度 | Claude Code | Hermes Agent |
|---|---|---|
| 核心定位 | 专业代码助手 | 全栈个人AI队友 |
| 设计哲学 | 代码库内的深度专家 | 跨场景的长期伙伴 |
| 主要场景 | 编程任务 | 持续性工作流 |

| 维度 | Claude Code | Hermes Agent |
|---|---|---|
| 记忆范围 | 单会话 + 项目上下文 | 跨会话持久记忆 |
| 技能系统 | Skill(手动创建) | 技能(自动创建+进化) |
| 部署方式 | 本地CLI | 本地/云端/7×24 |
| 任务类型 | 以编程为主 | 全栈任务 |
| 多Agent | Subagent隔离执行 | Cron+并行+调度 |
| MCP生态 | 支持MCP Server | 支持MCP Client |
| 自动化 | 需要手动触发 | 内置定时+事件驱动 |
这不是"哪个更好"的问题,而是"什么时候用什么"的问题。
回顾少楠和idoubi的真实工作流:
少楠用Cursor写iOS代码,用Claude做产品分析,用GPT-4o生成文案。每款产品都能快速从0到1。
idoubi用Cursor开发Web产品,用GPT做AI功能集成,用Claude做代码审查。11款产品同时推进。
Claude Code擅长:
- 深度代码理解和重构
- 大型代码库的复杂修改
- 代码审查和优化
Hermes擅长:
- 需要持续记忆的任务
- 跨会话的长期项目
- 自动化工作流编排
- 7×24监控和响应

最佳实践:
日常开发 → Claude Code(深度代码工作)持续任务 → Hermes(自动化+记忆+协调)复杂项目 → 两者结合
现在让我们进入实操部分:如何真正用好Hermes Agent,实现"一人成军"。

回顾真实案例中的成功路径:
第一阶段:让Agent认识你(第1周)
- 建立USER.md,描述你的背景和偏好
- 配置MEMORY.md,记录项目信息
- 设置上下文文件,建立工作环境
参考:少楠会先告诉Claude他是Apple开发者,偏好SwiftUI,这会影响后续的代码建议。
第二阶段:建立标准化技能(第2-3周)
- 观察Hermes完成的任务
- 提取成功的模式,固化为技能
- 建立团队专属的技能库
参考:idoubi从第一款产品中总结的"AI壁纸prompt模板",可以直接复用到第二款。
第三阶段:部署自动化任务(第4周起)
- 识别重复性任务
- 配置Cron定时执行
- 设置告警和通知渠道
参考:ThinkAny上线后,idoubi设置自动监控,有异常立刻告警到飞书。
第四阶段:多Agent协作(持续迭代)
- 复杂任务拆解
- 并行子Agent执行
- 主Agent协调汇总
技巧1:清晰的任务描述
❌ 不好的描述:"帮我看看这个项目有什么问题"✅ 好的描述:"审查src/api/下的所有文件,确保符合REST规范,检查错误处理"
技巧2:适当的上下文提供
不是越多越好,而是越相关越好。提供任务相关的背景,忽略无关信息。
技巧3:及时的反馈和纠正
当Hermes做错了,及时纠正。这会帮助它学习你的偏好。
技巧4:定期的技能审计
每月检查技能库,删除过时技能,优化低效技能,添加新的技能。
陷阱1:过度依赖,失去独立思考能力
AI是放大器,不是替代品。你的判断力、创造力、决策力才是核心。
陷阱2:盲目信任,不做验证
AI会犯错,尤其是在复杂任务中。关键环节必须人工验证。
陷阱3:技能过载,流程过于复杂
不是为了用技能而用技能。只保留真正提升效率的技能。
独立开发者的案例令人振奋,但你可能已经注意到一个问题:
少楠和idoubi的成功,很大程度上是因为他们是独立作战——没有历史包袱,没有流程约束,没有审批链条。
如果你在一家中大型企业工作,这个故事就不那么简单了。
企业级生产系统,有一系列独立开发者不需要面对的挑战:
| 约束类型 | 具体表现 |
|---|---|
| 技术债务 | 老旧系统耦合、新技术无法直接引入、历史代码无人敢动 |
| 生产管控 | 变更需要审批、发布需要窗口期、故障需要回滚 |
| 安全合规 | 等保要求、敏感数据脱敏、审计日志、权限最小化 |
| 流程约束 | 跨部门协作、需求评审、代码Review、测试验收 |
| 组织分工 | 产品、开发、测试、运维、安全各自的职责边界 |
在这种情况下,你没法像idoubi那样——
ideation → coding → testing → deploying → shipping
一个周末搞定一款产品。
企业里的"POC陷阱":
很多团队做过这样的尝试:用一个AI工具快速做出一个POC,效果很好。然后呢?
然后POC就停在了POC阶段。因为从POC到生产系统,还有十万八千里:
这些问题,不是AI能帮你解决的。
但这并不意味着企业级场景下"一人成军"是伪命题。关键是策略。
核心思路:不要试图用AI"绕过"企业级约束,而是主动识别和定义约束边界。
第一步:模块化设计
在做任何事情之前,先想清楚模块边界:

┌─────────────────────────────────────────────────────┐│ 你的POC项目 │├──────────────────┬──────────────────┬───────────────┤│ 核心业务逻辑 │ Mock数据层 │ 本地模拟层 ││ (AI可以快速生成) │ (用模拟替代真实) │ (替代企业组件)│├──────────────────┴──────────────────┴───────────────┤│ 定义清晰的集成边界接口 ││ ① 认证接口:XXX/Auth/SAML ←→ 企业SSO ││ ② 数据接口:XXX/Data/xxx ←→ 真实数据源 ││ ③ 告警接口:XXX/Monitor ←→ 企业监控平台 ││ ④ 安全接口:XXX/Security ←→ 安全扫描工具 │└─────────────────────────────────────────────────────┘
第二步:Mock环境隔离企业约束
| 企业组件 | Mock替代方案 | 目的 |
|---|---|---|
| 企业数据库 | SQLite / Mock Server | 快速开发、数据自主 |
| SSO认证 | 本地JWT | 绕过权限开发核心功能 |
| 消息队列 | 内存队列 | 开发阶段快速迭代 |
| 监控告警 | 本地日志 + 飞书Mock | 逻辑验证优先 |
| CDN/存储 | 本地文件 | 绕过发布流程开发 |
第三步:明确定义集成点
当你完成了核心功能验证,下一步不是"直接上线",而是清晰定义集成清单:
POC验证完成清单:✅ 核心业务逻辑已完成并验证✅ Mock数据验证了数据模型正确性✅ 功能逻辑验证了用户需求满足度需要集成的企业组件:□ 企业SSO认证对接(预计工作量:X天)□ 数据库迁移(预计工作量:X天)□ 监控告警接入(预计工作量:X天)□ 安全合规审查(预计工作量:X天)□ 生产发布审批(预计工作量:X天)风险评估:□ 某些企业组件可能没有标准API□ SSO对接可能需要安全团队介入□ 数据库迁移可能影响现有系统
这样做的价值是:把"能不能做"的验证,和"怎么做"的实现,分阶段处理。
用AI快速验证"能不能做",再用传统方式处理"怎么做"——这才是合理的企业级策略。
传统模式:
需求调研 → 设计评审 → 开发 → 测试 → 预生产 → 生产↑ ↑花费最多时间 花费最多时间
AI增强模式(POC阶段):
想法验证(POC) 企业集成阶段│ │▼ ▼快速原型 → 验证核心逻辑 → 定义集成清单 → 企业化改造(AI加速) (AI加速) (人工规划) (团队协作)
核心观点:
在企业级场景下,"一人成军"的目标不是一个人完成整个生产系统,而是一个人完成想法验证(POC),并清晰定义后续的集成路径。
当你验证了"这个方向是对的",剩下的工作——即使是传统的、需要团队协作的工作——也会更高效、更聚焦。
因为你已经证明了价值,团队也更愿意投入资源。
这是我想特别强调的一点。
在独立开发者案例中,成功主要靠工具。你有一台电脑,有AI工具,就可以开干了。
但在企业级场景下,"一人成军"需要三个层面的配合:
| 层面 | 要素 | 现状(很多企业的痛点) |
|---|---|---|
| 系统工具层 | AI Agent、代码库、部署环境 | 工具可能存在,但分散、碎片化 |
| 环境支撑层 | Mock环境、沙箱、独立开发空间 | 缺乏快速搭建能力,依赖运维 |
| 组织分工层 | 审批流程、职责边界、协作模式 | 流程僵化,AI时代的工作方式未被接纳 |
大多数企业的瓶颈,不在工具,而在环境和组织。
举几个常见的场景:
场景1:你想搭一个Mock环境,但运维团队排期要两周
解决方案:需要有快速环境搭建的能力,包括容器化模板、一键部署脚本。
场景2:你用AI做出了POC,但上线需要走三个月的审批流程
这不是技术问题,是流程适配问题。企业需要重新思考:什么样的变更需要严格审批,什么样的可以快速迭代?
场景3:你想用AI做数据处理,但数据安全要求你必须在特定环境中操作
这是环境隔离和安全管控的平衡问题。需要给AI工具提供足够的数据访问权限,同时保障安全合规。
挑战总结:企业级"一人成军"需要跨越的三个台阶
台阶1:工具可用↓ 你有AI工具,你知道怎么用台阶2:环境可搭↓ 你能快速搭建隔离环境,进行POC验证台阶3:流程可配↓ 企业流程适配AI时代的工作方式
大多数企业卡在台阶2和台阶3。
这也意味着,企业级"一人成军"的推动者,不只是开发者,还需要DevOps、安全、流程等多方协作。
行文至此,我想分享一个更深层的思考。
尽管Hermes Agent非常强大,但它有明确的边界:
不能替代:
- 判断力:什么是对的,什么是重要的
- 创造力:定义新问题,提出新方案
- 责任感:承担决策的后果
AI可以执行,但它不能替你思考"为什么做"和"做什么"。

当工具足够强大,决定成败的不再是"你有多少资源",而是"你有多会使用工具"。
这不是新的概念,而是工业革命以来每次技术进步的规律:
"一人成军"不是一个人做所有事。
它是一个人在"指挥"AI军队,完成更大的事。
你不需要成为每个领域的专家,但你需要成为:
- 定义目标的人
- 评估结果的人
- 做出决策的人
Hermes Agent和其他AI工具,正在降低达成目标的门槛。
而你要做的,是站在门槛里面,学会使用这些工具。
2024年,少楠用AI工具赚回了苹果开发者会员费。
2024年,idoubi一个人上线了11款AI产品,其中ThinkAny冲到ProductHunt日榜第四,ShipAny预售4小时破万美金。
2023年,117,060名独立创业者实现了百万美元收入——这个数字是两年前的两倍多。
2026年,OpenAI预测一人公司可以达到10亿美元估值。Base44、Daymaker、OpenClaw正在验证这个预言。
这不是魔法,这是工具进化带来的范式转变。
而在企业级场景下,这个故事有了新的注解:
独立开发者可以用AI"一人成一军",因为他们没有包袱。
企业里的你,可以用AI"一人完成POC",因为你可以用模块化设计剥离约束、用Mock环境绕过流程、把重心放在想法验证。
真正的挑战不只是工具,还有环境和组织。
问题的关键从来不是"AI能不能做到",而是"你会不会用它做到",以及"你的组织是否准备好接受它"。
Hermes Agent提供了一个可能:一个会记忆、会学习、会进化、会持续执行的AI队友。
但它只是开始。
真正的"一人成军",需要你:
- 理解这些工具的能力和局限
- 在企业约束下找到合理的切入点
- 建立适合自己的工作流
- 推动组织层面的配套升级
- 在AI的辅助下,成为更好的自己
参考资料:
- 少楠的2024独立开发者之旅
- idoubi:2024年我上线了11款AI产品
- Forbes: How AI Is Redefining Solo Entrepreneurship
- OpenAI Called The One Person AI Startup And Three Founders Proved It
- Hermes Agent官方文档:https://hermes-agent.nousresearch.com/
- agentskills.io开放标准:https://agentskills.io/
- Claude Code文档:https://code.claude.com/

如果你有任何问题或想法,欢迎在评论区交流。