Trend brief · 2026-03-14

代理发现、终端调度与可验证程序搜索升温

今天的材料很分散,但主线很清楚:代理生态开始补“怎么找到、怎么管理、怎么落地”这些缺的层,而不只是继续堆模型能力。Joy代表了一类新的代理基础设施。它不只提供MCP接口,还把代理注册、搜索、担保和端点验证放进同一个网络。这里最值得注意的不是性能数字,而是它明确把开放代理生态里的信任问题产品化了。另一条明显趋势是,终端正在变成多代理工作的控制面。

5 tracked topics
Evolution3 signals · Continuing 2 · Emerging 1

今天的材料很分散,但主线很清楚:代理生态开始补“怎么找到、怎么管理、怎么落地”这些缺的层,而不只是继续堆模型能力。Joy代表了一类新的代理基础设施。它不只提供MCP接口,还把代理注册、搜索、担保和端点验证放进同一个网络。这里最值得注意的不是性能数字,而是它明确把开放代理生态里的信任问题产品化了。另一条明显趋势是,终端正在变成多代理工作的控制面。

3 signals3 history windows

今天与历史窗口最一致的主线,是代理系统继续从“能调用工具”走向“能进入真实环境”。不同之处在于,当前窗口更少强调安全与测试,更强调发现、调度和实际操控。一条延续线来自MCP。prev2里代表系统主要解决接入问题,而Joy在当前窗口把/mcp接口继续保留,同时补上代理发现、担保和端点所有权验证。也就是说,基础设施开始从“怎么连”转向“连上之后先找谁、信谁”。另一条延续线来自软件工程代理。

MCP 基础设施从接线层走向发现与信任层

Continuing

延续 MCP代理基础设施与生产治理同步升温 (2026-03-12) 的“MCP接口层从单工具走向成套代理基础设施”,但今天的重心从“把工具接进来”进一步移到“如何在开放网络里发现并信任代理”。Joy 提供 /mcp 端点、/agents/discover/vouches,并把每次担保设为 +0.3 分、上限 3.0;同时加入端点所有权验证后的排序优先级。和 MCP代理基础设施与生产治理同步升温 (2026-03-12) 中以 Auto-Browser、local-memory-mcp 为代表的接线层相比,今天多了一层可计算的信任排序。

软件代理继续进入真实工作流,但焦点转向会话运营

Continuing

多代理进入真实流程的趋势仍在继续,但今天更偏“操作面”而不是“治理面”。MCP代理基础设施与生产治理同步升温 (2026-03-12) 强调可观测、可测试、可约束,可验证反馈、PR测试与执行层安全推动代理进入真实流程 (2026-03-13) 强调 PR 测试与执行层安全;而 Recon 把多个 Claude Code 会话收束到 tmux 仪表盘中,用 2 秒轮询和增量 JSONL 解析追踪状态,并直接展示 45k/1M、90k/200k 这类上下文配额。它没有提供治理指标,却说明团队开始把代理当作需要持续调度的并行进程。

代理的可验证循环从代码任务外溢到数学发现

Emerging

相较 代码智能走向过程学习,软件代理转向真实评测与可审计执行 (2026-03-11)Understanding by ReconstructionExecVerify 为代表的代码过程学习,今天出现了更偏科学发现的代理式程序搜索。AlphaEvolve 不是优化代码生成通过率,而是自动变异组合搜索程序,并把 R(3,13)、R(3,18)、R(4,13)、R(4,14)、R(4,15) 五个 Ramsey 数下界分别推进 1,同时声称恢复了所有已知精确 Ramsey 数对应的下界。这说明“可验证反馈驱动代理”已开始从软件任务外溢到数学搜索。

代理发现与信任层开始产品化

代理基础设施继续前移到“可发现、可接入、可排序”。Joy 把代理目录、MCP 接入和信任分合到一个网络里。其机制很直接:每次 vouch 增加 0.3 分,最高 3.0;完成端点所有权验证的代理会在搜索中获得更高优先级。与只做连接器不同,这类系统开始处理开放代理生态里“先找到谁、再信任谁”的问题。

Representative sources

终端成为多代理工作的主控台

今天多篇项目都在缩短“人管代理”的操作链。Recon 用 tmux 原生仪表盘管理多个 Claude Code 会话,2 秒轮询一次,并能显示 45k/1M、90k/200k 这类上下文用量;Nia CLI 则把索引、搜索、研究任务统一到一个命令行里,支持仓库、文档和本地目录一起纳入检索。两者共同指向一个变化:代理不再只是单次调用,而是被当成可持续运行的工作单元。

Representative sources

真实设备上的 GUI 代理更像可用原型

iPad 演示说明,设备代理的吸引力正在从网页扩展到真实消费硬件。系统允许用户排队后用自然语言下达命令,代理可执行打开应用、点击、滚动和简单多步任务,如“Open Goodnotes then close it”。但它同时明确禁用了文本输入、复杂手势、通知、锁屏和登录场景,说明这股趋势仍以受限能力的可运行原型为主。

Representative sources

代理式程序搜索开始产出硬结果

今天也有一条更硬的研究线:AlphaEvolve 不直接生成答案,而是变异搜索程序本身,并把 5 个经典 Ramsey 数下界各推进了 1。具体包括 R(3,13) 从 60 到 61、R(3,18) 从 99 到 100、R(4,13) 从 138 到 139、R(4,14) 从 147 到 148、R(4,15) 从 158 到 159。相比大量产品原型,这是一项少见的、带明确数学改进的结果。

Representative sources

开发栈围绕代理与检索继续补基础设施

配套开发基础设施也在补齐。NumenText 试图把终端 IDE 做成低门槛的完整工作台,提供 20+ 语言高亮、LSP 与 DAP 集成,以及至少 9 种语言的构建运行;GitDB 则把分支、合并、回滚和时间旅行查询带入向量数据库,并宣称已有 21 个模块、13150 行代码和 394 个测试。它们都不是以新模型取胜,而是把工程工作流做得更连续。

Representative sources

Built with Recoleta

Run your own research radar

Turn arXiv, Hacker News, OpenReview, Hugging Face Daily Papers, and RSS into local Markdown, Obsidian notes, Telegram digests, and a public site.

NewerVLA转向主动感知、轻量多模态融合与部署级系统优化Older可验证反馈、PR测试与执行层安全推动代理进入真实流程