Recoleta Item Note

SBOMs into Agentic AIBOMs: Schema Extensions, Agentic Orchestration, and Reproducibility Evaluation

本文将静态 SBOM 扩展为具备上下文推理能力的 agentic AIBOM,使软件物料清单不仅记录组件,还能结合运行时证据与策略输出可审计的漏洞可利用性判断。其核心贡献是多智能体编排、对 CycloneDX/SPDX 的最小模式扩展,以及围绕可复现性与漏洞解释稳定性的评估。

sbomaibommulti-agent-systemssoftware-supply-chain-securityreproducibilityvex-csaf

本文将静态 SBOM 扩展为具备上下文推理能力的 agentic AIBOM,使软件物料清单不仅记录组件,还能结合运行时证据与策略输出可审计的漏洞可利用性判断。其核心贡献是多智能体编排、对 CycloneDX/SPDX 的最小模式扩展,以及围绕可复现性与漏洞解释稳定性的评估。

  • 传统 SBOM 只描述静态依赖,无法反映运行时行为、环境漂移、动态加载与真实可利用性,因此难以支持高可信的软件供应链安全与可复现审计。
  • 在海量 CVE 背景下,组件“存在”不等于漏洞“可利用”;若缺少上下文过滤,安全团队会被大量不可利用漏洞淹没。
  • 受监管或高保证分析环境需要把软件组成、执行上下文和审计证据绑定到一起,否则即使代码与数据不变,环境差异也会破坏结果复现与合规判断。
  • 提出 agentic AIBOM 框架:把 SBOM 从被动清单变成主动溯源对象,输出与 CSAF v2.0 / VEX 对齐的结构化可利用性声明,而不是直接执行封禁动作。
  • 采用三类多智能体协作:MCP 负责基线环境重建,A2A 负责运行时依赖与环境漂移监测,AGNTCY 负责结合策略、缓解措施与执行证据进行漏洞/VEX 推理。
  • 对 CycloneDX 和 SPDX 做“最小且兼容”的 schema 扩展,新增执行上下文、依赖演化时间线、agent 决策来源与 advisory 证据字段,同时保持互操作性。
  • 通过 pre/mid/post 多阶段快照、导入钩子与包管理器插桩建立运行时依赖真值,并用 Capture Rate、FPR、FNR、语义/精确复现率、延迟与开销评测。
  • 为保证高可信性,系统加入故障闭锁、跨快照一致性校验、分段签名和完整性阈值;例如缺失或错误哈希组件超过 2% 时触发完整性违规并要求人工裁决。
  • 论文明确声称:在异构分析工作负载上,agentic AIBOM 相比 ReproZip、SciUnit、ProvStore 等既有溯源系统,提高了运行时依赖捕获复现保真度漏洞解释稳定性,且计算开销较低。
  • 论文还声称消融实验表明三个 agent 各自提供了确定性自动化无法替代的独特能力,支持其多智能体设计必要性。
  • 文中给出了可量化的评测定义与阈值:精确复现使用 SHA-256 字节级一致;语义复现容差为确定性任务 ε=1e-12、浮点 ML 任务 ε=1e-6
  • 可靠性机制中给出明确规则:若跨阶段校验发现预计组件中超过 2% 缺失或哈希错误,则阻止流程继续并升级人工审查。
  • 背景数据强调问题规模:截至写作时 CVE 超过 191,633 条,后续已超过 200,0002022 年 32,760 条、2021 年约 22,000 条;约 11% 被归为 critical;约 95% 的 SBOM 组件漏洞通常在产品中不可利用。
  • 提供的摘录没有出现直接的最终 benchmark 数值表(如具体提升百分比、各数据集绝对分数或开销毫秒数),因此无法从摘录中提取更细的定量对比结果。
Built with Recoleta

Run your own research radar

Turn arXiv, Hacker News, OpenReview, Hugging Face Daily Papers, and RSS into local Markdown, Obsidian notes, Telegram digests, and a public site.