有志者事竟成
有志者事竟成
文章
笔记
浅色
深色
自动
Security
安全防护体系:当 Agent 拥有终端时如何防止「做出格」的事
Agent 拥有 terminal 权限意味着它也能执行 rm -rf /。Hermes 用四道防线解决这个问题——工具调用守卫(防止循环)、危险命令审批(人工+智能双模式)、敏感路径保护(安全策略文件本身也是被保护的)、以及工具结果清洗(防止错误字符串里的结构标记欺骗模型)。这四道防线如何协同工作?本文拆解 Hermes 的安全架构。
2026-07-04
Hermes 探秘 Agent 工程