Recoleta Item Note

EmbC-Test: How to Speed Up Embedded Software Testing Using LLMs and RAG

本文提出 EmbC-Test：一个面向嵌入式 C 单元测试生成的 RAG+LLM 流水线，用项目内代码、文档和历史测试来约束生成结果。其目标不是完全替代人工，而是把测试工程师从手写测试转向高效审核与修订，从而显著加速工业验证流程。

ragllm-testingembedded-cunit-test-generationcode-intelligence

Summary

工业评估中，RAG 生成测试达到 100.0% 语法正确率、84.5% 运行验证通过率；对比随机检索 100.0% / 62.4%、无检索 96.8% / 50.5%，RAG 在运行正确性上明显更强。
覆盖率方面，RAG 最佳配置达到 43% branch coverage 和 67% line coverage；人工现有测试套件为 76% branch、93% line，但后者经历了数月迭代，而 RAG 结果来自单次生成、无反馈优化。
人工评估中，最佳 RAG 配置在 5 分量表上达到：4.33（relevance）、4.61（assertion correctness）、4.06（edge-case completeness）、4.83（readability）。
最佳配置的测试可用率达到 94.4%；其中 38.9% 可直接接受，55.6% 需少量修改，仅 5.6% 需要重写。
生成效率约为 270 tests/hour，而人工在该框架下约 1 test/hour。
在 57 条软件需求的案例中，总测试工作量可从 57 小时 降至 19.2 小时，宣称节省 66% 时间。

Built with Recoleta

Turn arXiv, Hacker News, OpenReview, Hugging Face Daily Papers, and RSS into local Markdown, Obsidian notes, Telegram digests, and a public site.