研究：AGENTS.md文件可使AI编程Agent运行时间缩短29%、输出token减少17%

2026/03/03 15:37:42

3 月 3 日，据 1M AI News 消息，新加坡管理大学、海德堡大学、班贝格大学和伦敦国王学院的研究团队在 arXiv 发表论文，首次量化评估了仓库级配置文件 AGENTS.md 对 AI 编程 Agent 效率的影响。AGENTS.md 是一种存放在代码仓库根目录的指令文件，用于向 AI Agent 说明项目架构、构建命令、编码规范和操作约束，类似于 Anthropic Claude Code 的 CLAUDE.md 和 GitHub Copilot 的 copilot-instructions.md，目前已被超过 6 万个 GitHub 仓库采用。

研究团队在 10 个仓库的 124 个已合并 PR（代码改动均不超过 100 行）上使用 OpenAI Codex（gpt-5.2-codex）进行配对实验，分别在有和无 AGENTS.md 两种条件下运行。结果显示，存在 AGENTS.md 时中位数运行时间从 98.57 秒降至 70.34 秒（降幅 28.64%），中位数输出 token 从 2,925 降至 2,440（降幅 16.58%），任务完成行为无显著差异（Wilcoxon signed-rank test, p < 0.05）。

研究者指出，AGENTS.md 将 Agent 指导从「短暂的提示词」转变为「版本控制、可审查、协作维护的配置工件」，建议开发团队将其作为标准实践纳入仓库。局限性方面，该研究仅测试了 OpenAI Codex 单一 Agent，样本限于小规模 PR，且未进行全面的代码正确性评估。

推特

电报

复制

海报

相关推荐

Binance推出首批7个AI Agent Skill，覆盖钱包数据与现货API

3 月 3 日，据官方公告，Binance 与 Binance Wallet 正式推出首批 7 个 AI Agent Skill，覆盖钱包数据与现货 API:

Binance Spot Skill（Binance 现货）：覆盖行情、交易，支持 API Key/Secret 签名，兼容主网与测试网；

地址洞察（Query Address Info）：生成钱包持仓、估值、24h 变化与集中度画像，辅助鲸鱼/聪明钱监控与地址日报；

代币详情（Query Token Info）：秒级返回 Symbol、链、价格、流动性、持有人、成交活跃度，适合新币初筛与内容生产；

市场榜单（Crypto Market Rank）：融合趋势、热搜、净流入、交易员 PnL 等榜单，提供「今日先看什么、为什么看」的优先级清单；

Meme Rush：按新发/迁移中/已迁移阶段追踪 Meme 叙事，映射 BSC/SOL 关联代币，构建结构化热点表；

交易信号（Trading Signal）：附带触发价、当前价、maxGain、exitRate、状态等指标，支持噪音过滤与信号复盘；

代币合约审计（Query Token Audit）：自动检测增发、冻结、所有者权限等风险字段，输出「关注 / 谨慎 / 回避」标签，交易前进行安全体检。

19分钟前

OpenClaw的Github星标数超25万位列第一，AI代理热潮持续爆发

3 月 3 日，OpenClaw 在 Github 的星标数已超过 25 万，超越 React 的约 24.3 万，成为 GitHub 上获星最多的实际软件项目。

星标数作为 GitHub 上衡量项目受欢迎程度和社区关注度的最直观指标，显示 AI 代理热潮持续爆发。

3小时前

Anthropic曾竞标五角大楼1亿美元无人机蜂群项目，未入选，SpaceX和OpenAI阵营胜出

据 1M AI News 消息，Anthropic 今年早些时候提交了一份方案，参与五角大楼一项总额 1 亿美元的竞赛项目 Orchestrator Prize Challenge，目标是开发语音控制的自主无人机蜂群技术。该竞赛由特种作战司令部下属的 Defense Autonomous Warfare Group 和 Defense Innovation Unit 联合发起，分五个阶段推进，从软件开发到实战测试，后期阶段涉及「目标感知与共享」及「从发射到终结」。Anthropic 的方案以 Claude 为核心，将指挥官意图转化为数字指令并协调无人机编队，不涉及自主瞄准或武器决策，人类全程保持监督权，公司还提议与五角大楼建立联合研究项目以安全地开发和评估自主武器能力。

Anthropic 认为该方案未触及其「不参与完全自主武器」的红线，因为人类仍可随时监控和终止系统。但 Anthropic 最终未被选中，Bloomberg 未能确认原因。入选方案包括 SpaceX 与 xAI 的联合提案，以及两家将 OpenAI 列为 AI 合作伙伴的防务科技公司（其中一家为自动驾驶军用车辆承包商 Applied Intuition）。OpenAI 的技术将用于「任务控制」环节，帮助将语音指令转化为数字指令。在五角大楼上周五宣布禁止其承包商与 Anthropic 开展任何商业活动后数小时，OpenAI 即宣布与国防部达成在保密云系统上使用其 AI 工具的新协议。Anthropic 拒绝置评。（彭博社）

5小时前

Solana、BSC和Base同时发力AI Agent基建，链上AI或将迎来爆发

3 月 3 日，尽管加密市场深处熊市，但 AI 蓬勃发展的当下，链上 AI Agent 基建仍如火如荼。BYS-PUSH 简单总结 Solana、BSC 和 Base 发展动态如下：

Solana

Solana 凭借亚秒级确认、低费用和高吞吐，成为 AI Agent 执行层首选，尤其适合高频微交易和自主操作。Solana 3 月 3 日于主网上线 AI Agent Registry 信任层，原生集成身份验证。

此外，Solana 网络代理部署已超 9000 个；生态强调 x402 支付、MCP 服务器（代理自主部署 token）、Claw 系列工具。生态顶级项目包括 SendAI 的 Solana Agent Kit（最流行工具包）、ElizaOS、Rig 等框架。

Base

受益于 x402 协议，Base 网络是目前 AI Agent 最成熟、最活跃的生态之一。x402 协议由 Coinbase 在 2025 年 5 月推出，目前已成为 Base 上代理经济的核心基础设施。

此外，衍生于 Openclaw 的诸多代理自主交易、DeFi 管理、社交（如 Moltbook 等 Reddit 式代理论坛）、预测市场等已初见规模。

BSC

BSC 在 2026 年初加速 AI Agent 基础设施建设，成为可扩展代理身份和应用的热门链。BSC 上 ERC-8004 和 BAP-578 等协议已在主网和测试网上线，支持低费用、高频代理活动。其 AI Agent 生态扩张到 58 个项目，覆盖 10 大类别，吸引 200+开发者参与黑客松。

3 月 1 日，Four.Meme 宣布即将上线「Agentic Mode」AI Agent 新产品，旨在探索 Agent 原生 Meme 形态。CZ、何一、BSC 生态增长执行总监 Nina Rong 也频频关注 AI 生态项目发展，并转发相关推文。

总体来看，加密主流参与者在 AI Agent 领域全面发力，Base 着重「社群/经济化」、Solana 最「性能/交易化」、BSC 则倾向「标准化/官方推动」。代理已从概念转向真实链上活动（如自主交易、互雇、支付），2026 年很可能继续爆发。

6小时前

xAI推送Grok4.20Beta2更新，改进指令遵循与幻觉抑制

据 1M AI News 消息，3 月 3 日，xAI 官方账号 @grok 今日发布 Grok 4.20 Beta 2 更新说明，列出五项改进：指令遵循能力提升、能力幻觉（capability hallucination）减少、科学文本质量改善（LaTeX 排版）、图片搜索触发精度提高、多图渲染可靠性增强。

Grok 4.20 于 2 月下旬进入公开测试，Elon Musk 此前表示该版本采用「快速学习」架构，将每周发布改进并附更新说明，并鼓励用户提交反馈。

7小时前

Core Scientific计划Q1出售约2500枚比特币，以支持AI转型

3 月 3 日，比特币矿企 Core Scientific（纳斯达克代码：CORZ）预计将在 2026 年第一季度出售其持有的全部约 2,500 枚比特币，以增强流动性并为其 AI 算力托管扩张相关的资本支出提供资金。

在周一提交的年度报告中，公司表示，「目前预计大部分」比特币储备的出售将发生在第一季度，但具体时间和金额将取决于市场状况和流动性需求，可能会有所调整。截至 2025 年 12 月 31 日，Core Scientific 持有 2537 枚比特币。（TheEnergyMag）

CORE$0.12+3.05%

8小时前

Base生态代币FAI市值短时涨超3000万美元，24小时涨幅达122%

3 月 3 日，据 GMGN 监测显示，Base 老牌生态代币 FAI 今晨市值从约 1100 万美元快速拉升至 3800 万美元，创下短期高点，目前市值回落至 2600 万美元左右，24 小时涨幅达 122%，同期成交量达 870 万美元。

本轮上涨或因知名分析师 Algod（X：AlgodTrading）言论有关，其在 X 平台发文称已重仓投资一个的$vvv 竞争对手，目标将该项目市值推高至 10 亿美元以上。Algod 并未明说具体代币名称，但其披露的多项数据指标，被部分社区用户将猜测指向 FAI。

FAI 为 Freysa AI 项目的原生代币，部署在 Base 链上，去年曾受马斯克转推致使市值大幅上涨，高点曾达 6.6 亿美元，目前代币已上线 460 天。

BYS-PUSH 提醒用户，链上代币交易波动巨大，多依赖市场情绪和概念炒作，并无实际价值或用例，投资者需注意风险。

9小时前

某鲸鱼通过THORChain将99.5枚BTC换仓至3,347枚ETH

3 月 3 日，据 OnchainLens 监测，一鲸鱼地址通过 THORChain，将 99.5 枚 BTC（约 670 万美元），以 0.0297 的汇率兑换为 3,347 枚 ETH。

10小时前

03

月

03

日

快讯

研究：AGENTS.md文件可使AI编程Agent运行时间缩短29%、输出token减少17%

3 月 3 日，据 1M AI News 消息，新加坡管理大学、海德堡大学、班贝格大学和伦敦国王学院的研究团队在 arXiv 发表论文，首次量化评估了仓库级配置文件 AGENTS.md 对 AI 编程 Agent 效率的影响。AGENTS.md 是一种存放在代码仓库根目录的指令文件，用于向 AI Agent 说明项目架构、构建命令、编码规范和操作约束，类似于 Anthropic Claude Code 的 CLAUDE.md 和 GitHub Copilot 的 copilot-instructions.md，目前已被超过 6 万个 GitHub 仓库采用。

研究团队在 10 个仓库的 124 个已合并 PR（代码改动均不超过 100 行）上使用 OpenAI Codex（gpt-5.2-codex）进行配对实验，分别在有和无 AGENTS.md 两种条件下运行。结果显示，存在 AGENTS.md 时中位数运行时间从 98.57 秒降至 70.34 秒（降幅 28.64%），中位数输出 token 从 2,925 降至 2,440（降幅 16.58%），任务完成行为无显著差异（Wilcoxon signed-rank test, p < 0.05）。

研究者指出，AGENTS.md 将 Agent 指导从「短暂的提示词」转变为「版本控制、可审查、协作维护的配置工件」，建议开发团队将其作为标准实践纳入仓库。局限性方面，该研究仅测试了 OpenAI Codex 单一 Agent，样本限于小规模 PR，且未进行全面的代码正确性评估。