研究:AGENTS.md文件可使AI编程Agent运行时间缩短29%、输出token减少17%

2026/03/03 15:37:42

3 月 3 日,据 1M AI News 消息,新加坡管理大学、海德堡大学、班贝格大学和伦敦国王学院的研究团队在 arXiv 发表论文,首次量化评估了仓库级配置文件 AGENTS.md 对 AI 编程 Agent 效率的影响。AGENTS.md 是一种存放在代码仓库根目录的指令文件,用于向 AI Agent 说明项目架构、构建命令、编码规范和操作约束,类似于 Anthropic Claude Code 的 CLAUDE.md 和 GitHub Copilot 的 copilot-instructions.md,目前已被超过 6 万个 GitHub 仓库采用。


研究团队在 10 个仓库的 124 个已合并 PR(代码改动均不超过 100 行)上使用 OpenAI Codex(gpt-5.2-codex)进行配对实验,分别在有和无 AGENTS.md 两种条件下运行。结果显示,存在 AGENTS.md 时中位数运行时间从 98.57 秒降至 70.34 秒(降幅 28.64%),中位数输出 token 从 2,925 降至 2,440(降幅 16.58%),任务完成行为无显著差异(Wilcoxon signed-rank test, p < 0.05)。


研究者指出,AGENTS.md 将 Agent 指导从「短暂的提示词」转变为「版本控制、可审查、协作维护的配置工件」,建议开发团队将其作为标准实践纳入仓库。局限性方面,该研究仅测试了 OpenAI Codex 单一 Agent,样本限于小规模 PR,且未进行全面的代码正确性评估。

相关推荐

Anthropic曾竞标五角大楼1亿美元无人机蜂群项目,未入选,SpaceX和OpenAI阵营胜出

据 1M AI News 消息,Anthropic 今年早些时候提交了一份方案,参与五角大楼一项总额 1 亿美元的竞赛项目 Orchestrator Prize Challenge,目标是开发语音控制的自主无人机蜂群技术。该竞赛由特种作战司令部下属的 Defense Autonomous Warfare Group 和 Defense Innovation Unit 联合发起,分五个阶段推进,从软件开发到实战测试,后期阶段涉及「目标感知与共享」及「从发射到终结」。Anthropic 的方案以 Claude 为核心,将指挥官意图转化为数字指令并协调无人机编队,不涉及自主瞄准或武器决策,人类全程保持监督权,公司还提议与五角大楼建立联合研究项目以安全地开发和评估自主武器能力。


Anthropic 认为该方案未触及其「不参与完全自主武器」的红线,因为人类仍可随时监控和终止系统。但 Anthropic 最终未被选中,Bloomberg 未能确认原因。入选方案包括 SpaceX 与 xAI 的联合提案,以及两家将 OpenAI 列为 AI 合作伙伴的防务科技公司(其中一家为自动驾驶军用车辆承包商 Applied Intuition)。OpenAI 的技术将用于「任务控制」环节,帮助将语音指令转化为数字指令。在五角大楼上周五宣布禁止其承包商与 Anthropic 开展任何商业活动后数小时,OpenAI 即宣布与国防部达成在保密云系统上使用其 AI 工具的新协议。Anthropic 拒绝置评。(彭博社)

5小时前

Solana、BSC和Base同时发力AI Agent基建,链上AI或将迎来爆发

3 月 3 日,尽管加密市场深处熊市,但 AI 蓬勃发展的当下,链上 AI Agent 基建仍如火如荼。BYS-PUSH 简单总结 Solana、BSC 和 Base 发展动态如下:


Solana


Solana 凭借亚秒级确认、低费用和高吞吐,成为 AI Agent 执行层首选,尤其适合高频微交易和自主操作。Solana 3 月 3 日于主网上线 AI Agent Registry 信任层,原生集成身份验证。


此外,Solana 网络代理部署已超 9000 个;生态强调 x402 支付、MCP 服务器(代理自主部署 token)、Claw 系列工具。生态顶级项目包括 SendAI 的 Solana Agent Kit(最流行工具包)、ElizaOS、Rig 等框架。


Base


受益于 x402 协议,Base 网络是目前 AI Agent 最成熟、最活跃的生态之一。x402 协议由 Coinbase 在 2025 年 5 月推出,目前已成为 Base 上代理经济的核心基础设施。


此外,衍生于 Openclaw 的诸多代理自主交易、DeFi 管理、社交(如 Moltbook 等 Reddit 式代理论坛)、预测市场等已初见规模。


BSC


BSC 在 2026 年初加速 AI Agent 基础设施建设,成为可扩展代理身份和应用的热门链。BSC 上 ERC-8004 和 BAP-578 等协议已在主网和测试网上线,支持低费用、高频代理活动。其 AI Agent 生态扩张到 58 个项目,覆盖 10 大类别,吸引 200+开发者参与黑客松。


3 月 1 日,Four.Meme 宣布即将上线「Agentic Mode」AI Agent 新产品,旨在探索 Agent 原生 Meme 形态。CZ、何一、BSC 生态增长执行总监 Nina Rong 也频频关注 AI 生态项目发展,并转发相关推文。


总体来看,加密主流参与者在 AI Agent 领域全面发力,Base 着重「社群/经济化」、Solana 最「性能/交易化」、BSC 则倾向「标准化/官方推动」。代理已从概念转向真实链上活动(如自主交易、互雇、支付),2026 年很可能继续爆发。

6小时前

Base生态代币FAI市值短时涨超3000万美元,24小时涨幅达122%

3 月 3 日,据 GMGN监测显示,Base 老牌生态代币 FAI 今晨市值从约 1100 万美元快速拉升至 3800 万美元,创下短期高点,目前市值回落至 2600 万美元左右,24 小时涨幅达 122%,同期成交量达 870 万美元。


本轮上涨或因知名分析师 Algod(X:AlgodTrading)言论有关,其在 X 平台发文称已重仓投资一个的$vvv 竞争对手,目标将该项目市值推高至 10 亿美元以上。Algod 并未明说具体代币名称,但其披露的多项数据指标,被部分社区用户将猜测指向 FAI。


FAI 为 Freysa AI 项目的原生代币,部署在 Base 链上,去年曾受马斯克转推致使市值大幅上涨,高点曾达 6.6 亿美元,目前代币已上线 460 天。


BYS-PUSH 提醒用户,链上代币交易波动巨大,多依赖市场情绪和概念炒作,并无实际价值或用例,投资者需注意风险。

9小时前

03

03

快讯
研究:AGENTS.md文件可使AI编程Agent运行时间缩短29%、输出token减少17%

3 月 3 日,据 1M AI News 消息,新加坡管理大学、海德堡大学、班贝格大学和伦敦国王学院的研究团队在 arXiv 发表论文,首次量化评估了仓库级配置文件 AGENTS.md 对 AI 编程 Agent 效率的影响。AGENTS.md 是一种存放在代码仓库根目录的指令文件,用于向 AI Agent 说明项目架构、构建命令、编码规范和操作约束,类似于 Anthropic Claude Code 的 CLAUDE.md 和 GitHub Copilot 的 copilot-instructions.md,目前已被超过 6 万个 GitHub 仓库采用。


研究团队在 10 个仓库的 124 个已合并 PR(代码改动均不超过 100 行)上使用 OpenAI Codex(gpt-5.2-codex)进行配对实验,分别在有和无 AGENTS.md 两种条件下运行。结果显示,存在 AGENTS.md 时中位数运行时间从 98.57 秒降至 70.34 秒(降幅 28.64%),中位数输出 token 从 2,925 降至 2,440(降幅 16.58%),任务完成行为无显著差异(Wilcoxon signed-rank test, p < 0.05)。


研究者指出,AGENTS.md 将 Agent 指导从「短暂的提示词」转变为「版本控制、可审查、协作维护的配置工件」,建议开发团队将其作为标准实践纳入仓库。局限性方面,该研究仅测试了 OpenAI Codex 单一 Agent,样本限于小规模 PR,且未进行全面的代码正确性评估。