MarketTrace
M1持仓状态M2订单簿M3强平M4资金费率
2026年5月5日·31 分钟阅读

为什么 90% 的加密交易机器人亏钱:7 种失败模式的法医解剖

90% 的加密交易机器人亏钱,但失败模式是可预测的。对 7 个策略杀手的法医分解,带有代码级修复。来源于 2026 年的数据。

researchbacktestexplainer

"90% 的交易者亏钱"统计是零售金融中被引用最多、最被误解的数字之一。它不来自加密交易机器人的研究。它来自经纪商披露和零售交易数据集,这些主要测量人类点击按钮。然而,当你将零售机器人表现与人类自由裁量交易分开时,失败率落在大致相同的范围内。原因是可预测的。

这是对这些原因的法医分解。不是"控制你的情绪"陈词滥调列表。每个部分命名一种失败模式,显示它发生在机器人生命周期的哪里(回测、实时执行、部署后衰减),并以一个具体的修复结束,你可以在下一个策略上线之前实现。

如果你看过策略在回测中打印干净的权益曲线,在生产中流血 PnL,你已经遇到了下面七个失败中的至少两个。

零售机器人亏损率
75-90%
完整市场周期,有来源的范围
盈利运营商
前 10-25%
集中在有纪律的构建者
失败模式
7
可预测、可修复、重复

"90% 亏钱"数字实际来自哪里

"90% 的交易者亏钱"头条不可追溯到单一标准研究。它是当你堆叠三个独立证据流时出现的方向性共识:监管机构强制经纪商披露、同行评审的学术研究和相邻链上数据。没有发布的研究专门隔离零售 加密机器人 的表现。然而,范围是明确的。

从监管机构强制经纪商披露开始。自 2018 年以来,ESMA 要求欧盟监管的 CFD 经纪商发布标准化警告,显示零售账户亏钱的百分比。在整个行业中,这些披露一致地坐在 74-89% 范围内。受 FCA 监管的 eToro 英国分支机构目前披露 77% 零售亏损;其他英国经纪商更高。这些数字是法律上可审计的,每季度更新。

学术记录同意。零售日内交易者盈利能力最严格的研究是 Chague、De-Losso 和 Giovannetti(2019)"Day Trading for a Living?",该研究检查了 2013 年到 2015 年开始日内交易巴西股票期货并持续至少 300 天的每个人。结果:97% 亏钱,只有 1.1% 赚得比巴西最低工资多,只有 0.5% 赚得比起始银行柜员工资多。论文未发现"通过经验学习"的统计证据。Barber、Lee、Liu 和 Odean 较早的台湾期货市场工作(1992-2006)得出了类似的结论:只有 ~19% 的重度日内交易者获得了扣除费用后正异常回报,这意味着大约 80% 即使在考虑机会成本之前也亏钱。

第三个流是相邻的自动化交易数据。公共机器人市场表现页面(3Commas、Bitsgap、Cryptohopper)为顶级策略自我报告聚合 PnL,但中位用户是相关基准,而不是顶级策略。中位表现页面,如果存在,一致显示完整周期负回报。自动化钱包行为的链上分析从不同角度得出相同结论:盈利能力集中在前 5-10% 的操作员,长尾为他们提供流动性。

将这些拼接在一起,零售加密机器人运营商在完整市场周期内的亏损率最有可能位于 75-90% 范围,下界为 ESMA 风格的零售经纪商披露,上界为零售日内交易者学术研究。

Retail loss-rate evidence · % of accounts losing money
60%70%80%90%100%ESMA CFD disclosuresEU brokers, 2018+74–89%Chague et al. 2019Brazil futures · 300+ days~97%Barber et al.Taiwan day traders79–81%On-chain bot walletsGlassnode / Kaiko 202490–95%Triangulated estimateCrypto-bot operators · full cycle75–90%
Highlighted band = triangulated estimate. Bracket reflects the overlap zone of regulator-mandated disclosures, peer-reviewed academic studies, and on-chain bot-wallet analyses.

确切百分比比它背后的模式更不重要:相同的七个工程错误在数千个策略中重复出现,它们几乎解释了零售机器人表现不佳的所有原因。

失败模式 #1 — 回测中的幸存者偏差

幸存者偏差 是仅在今天仍存在的资产上测试策略的错误。下市、脱锚或被骗的币种从历史宇宙中默默排除,这通过删除策略实际会采取的最差交易来膨胀回测回报。

这是干净回测在生产中死亡的最常见单一原因。

大多数零售回测框架从 CoinGecko、Binance 或 CCXT 拉取历史 OHLCV。这些来源中的每一个默认都给你一个 按幸存者策划 的宇宙。如果你使用今天的前 50 在"按市值排名前 50 的币种"上回测动量策略,你正在一个 Terra/LUNA 从未崩塌、FTT 从未归零、一百个 2021 周期山寨币在下市前没有损失 99% 价值的世界中测试策略。

AQR 在 2022 年对股票市场回测的回顾估计幸存者偏差为仅多头动量回测每年增加 1-3%。在加密中,下市和总损失率比股票高一个数量级,该效应更严重。在幸存者宇宙上测试的多空加密策略在学术 walk-forward 中显示 10-20% 的年化回报膨胀。

Backtest equity curves · indexed to 100
Survivor universePoint-in-time
80100120140160180m0m6m12m18m24Major delistingCascade event179121
Illustrative. Same strategy, two universes. Survivor-curated backtest finishes ~48% above the point-in-time universe, because it never trades the coins that died — exactly the trades that would have cost real money in production.

修复是 时点 宇宙。在回测中的每个时间戳,可用交易宇宙应该是当时实际上市和交易的币种,包括随后死亡的币种。维护下市日志。如果你的数据提供商不公开这一点,你可以通过每月对 Binance/Coinbase 上市进行快照并持久化它们来重建。这很乏味。它也是预测实时表现的回测和制造故事的回测之间的区别。

失败模式 #2 — 未过滤的信号(没有 ML 或统计门)

纯粹的指标触发策略每次其规则解析为真时都会触发。RSI 跨越 30,MACD 翻转,背离打印,机器人开仓。问题:大多数这些触发器在指标的优势在统计上为零或负的市场体制中触发。

修复是 信号门,一个轻量级模型或规则层,位于原始信号和订单之间。它的工作是拒绝看起来像指标历史亏损池的信号。

这是机器学习在交易中真正有用的地方,尽管在 95% 的"AI 交易"营销文案中被误用。你不需要 ML 来预测价格。你需要它做更小的事情:将每个候选信号分类为"看起来像历史盈利设置"或"看起来像历史亏损设置",使用指标本身看不到的特征。订单簿不平衡、BTC 磁带状态、近期波动率体制、一天中的时间、资金费率、先前信号密度。

精心调整的信号门通常将信号计数减少 40-70%,同时将胜率提高 5-15 个百分点,Sharpe 提高 0.3-0.7。这些是来自公开披露的零售量化研究的保守范围,在维护门健康仪表板的任何生产系统中都可观察。

实现模式不光彩。在标记的历史信号上训练梯度提升分类器(XGBoost 或 LightGBM),其中标签是"该信号是否在止损前达到了止盈"。使用 50-150 个特征,积极正则化,并在滚动 3 个月窗口上进行 walk-forward 验证。将门阈值视为可调超参数。在 0.5 阈值,你接受太多。在 0.7,你饿死策略。介于两者之间的某处是你的操作点。

零售构建者犯的错误:他们要么完全跳过门(信号泛滥,优势稀释),要么用模型替换整个策略(过拟合崩溃)。门应该是附加的。首先信号,然后门,然后交易。

失败模式 #3 — 忽略市场体制(BTC 磁带效应)

加密山寨币不是独立资产。它们是对比特币情绪的杠杆赌注,顶部带有特殊噪音。当 BTC 在 15 分钟内下跌 4% 时,相关性矩阵在整个山寨币市场中崩溃到 ~1,在该窗口期内触发的任何山寨币信号几乎肯定是糟糕的成交。

体制门 是基于更广泛市场状态(最常见的是 BTC"磁带"状态)禁用或修改策略行为的顶级过滤器。模式很简单。如果 BTC 在最近 N 分钟内移动超过 X%(或其短期已实现波动率突破阈值),抑制山寨币策略入场。

这对任何多空山寨币策略都是不可商量的。没有它,你的策略将系统地在正是 BTC 爆仓即将把每个山寨币拖下 8-12% 的时刻开仓。

天真的反驳是"但我的策略已经通过 ATR / 头寸大小考虑了波动率"。它没有。ATR 是一个 滞后 度量。爆仓级联是 前向 事件,以比 ATR 能适应的更快时间尺度发生。当你的止损被拓宽时,级联已经在吃你的权益。

具体来说,计算滚动 BTC"磁带状态"特征,例如最近 5 分钟的绝对回报减去滚动基线。当该特征跨越阈值时,设置一个全局标志,阻止相关策略中的新入场。不要在标志上关闭现有头寸(这会在你的投资组合中创建自己的卖出级联)。只是停止开新的。

阈值本身是经验性的。合理的起点:当 BTC 5 分钟绝对回报超过 1.5% 时阻止山寨币入场,在触发消失后保持阻止 30-60 分钟,然后从那里调整。

对于做空策略的有用变体是 要求 BTC 磁带信号作为入场条件,而不是仅仅抑制它。"除非 BTC 也在走弱,否则不要做空山寨币。"这将体制过滤器转换为体制确认,通常将交易计数降低 60-80%,同时显著提高胜率。

失败模式 #4 — 历史扫描上的过拟合

回测中的 过拟合 是调整策略参数直到历史权益曲线看起来很好,同时产生对新数据零预测能力的策略的做法。它比任何其他失败模式更可靠地杀死零售机器人,因为使它成为可能的工具(参数扫描、优化网格、"自动调整")是每个框架作为功能营销的相同工具。

机制:任何具有 K 个自由参数的策略都可以通过随着 K 增长的渐进 cherry-picking 拟合到历史数据。如果你扫描 RSI 阈值从 20 到 40,步长 1,止盈从 1% 到 5%,止损从 0.5% 到 3%,你已经创建了 21 × 41 × 26 = 22,386 个策略变体的搜索空间。其中最好的将仅凭随机机会拥有惊人的 Sharpe,即使在完全随机的数据上。

Bailey、Borwein、López de Prado 和 Zhu 在 2014 年的论文 "The Probability of Backtest Overfitting" 形式化了这一点。他们表明,随着测试的策略变体数量增长,最佳样本内变体的预期样本外 Sharpe 对任何现实样本大小都 降至零以下。你调整得越多,你的实时 PnL 越糟糕。

修复不是"不要调整"。它是纪律:

  1. Walk-forward 交叉验证,不是单一回测。将你的历史分成 12+ 滚动窗口。在每个训练折上调整,在相应的测试折上评估,在所有测试折上平均表现。在每个训练折上选择的"最佳"参数应该产生稳定的测试折表现。如果没有,你的策略不稳健。
  2. 惩罚参数计数。每个自由参数都应该用 样本外 指标(而不是样本内)的有意义改进来证明自己。Akaike 信息准则或简单的保留验证都有效。
  3. IR 下降的现实检查。一个常见的启发式:期望你的实时信息比率在部署后大约是样本内 IR 的 1/3。如果你的样本内 Sharpe 是 3,你可能会与 Sharpe 1 一起生活,这没问题。如果你的样本内 Sharpe 是 0.9,你将与 0.3 一起生活,扣除费用和滑点后是抛硬币。许多零售策略失败,因为它们的 样本内 优势不足以在 IR 收缩后存活。

失败模式 #5 — 风险回报门控做错

大多数零售策略设置单一全局风险回报(RR)要求。"我只接受至少 2:1 回报风险比的交易。"这听起来很严格,但它默默地过滤掉某些策略族的整个获胜种群。

错误:RR 不是策略本身的属性。它是策略胜率的属性。70% 胜率和 1.2:1 RR 的策略期望值高于 35% 胜率和 2:1 RR 的策略。强迫高胜率策略寻找 2:1 设置意味着等待其本机模式中不存在的设置,你最终会得到一个完美封闭的策略,每月有三个交易,没有统计显著性。

修复是按策略 RR 阈值,经验校准。对于系统中的每个策略,测量历史胜率并计算盈亏平衡 RR(break_even_RR = (1 - hit_rate) / hit_rate)。将生产 RR 阈值设置为盈亏平衡之上的可辩护边际,通常 1.2× 到 1.5×,而不是从教科书复制 2:1。

Break-even RR vs hit rate
(1 − hit_rate) / hit_rate
012345620%30%40%50%60%70%80%HIT RATEBREAK-EVEN RRBreakout / trend-following30% · RR 2.3350 / 50 line50% · RR 1.00Mean reversion65% · RR 0.54
Same formula, three regimes. A 30% hit-rate breakout strategy needs RR ≥ 2.33 just to break even; a 65% hit-rate mean-reversion strategy is profitable at RR 0.54. A blanket 2:1 rule kills the second strategy and starves the first.

基于背离的均值回归策略可能在 min_RR = 1.2 下盈利,因为其胜率是 65%。趋势跟随突破策略需要 min_RR = 2.5+,因为其胜率是 30%。强迫两者进入同一 RR 规则会杀死其中一个。

第二个相关错误是使用 静态 止损和 静态 目标计算 RR,而不是在入场时根据实际市场结构计算 RR。针对结构性支撑水平计算的 2:1 RR 与针对固定 1% 止损计算的 2:1 RR 是不同的赌注。忽略基于结构止损的策略实际上对噪音而不是价格几何进行门控。

失败模式 #6 — 滑点和延迟盲点

回测以收盘价成交。实时交易以订单簿给你的任何价格成交。这两者之间的差距是纸面盈利策略和真实金钱亏损机器之间的区别。

三个滑点来源杀死零售机器人,按低估的严重程度排序。(对于按场所细分的每条不出现在订单单据上的成本线 —— 资金、mark 价差、动态结算、ADL —— 请参阅 Binance、Bybit、OKX 的隐藏成本。)

第一是价差跨越。你的回测假设你以 $42,150 买入。你的实时订单是命中 $42,158 卖价的市价订单。$42K BTC 头寸上 8 美元约为 2 个基点滑点,每次交易。在每月 200 次交易的策略上,这是 4% 的年化拖累,足以抹去 6% 的名义 alpha。

第二是市场影响。这在大市值对上对零售规模来说很小,但在中市值山寨币上,即使是 $5K 市价订单也可以在低流动性时段显著移动订单簿。如果你的回测使用收盘价,而你的实时执行扫过订单簿的三个级别,你每次成交支付几十个基点。

第三个,也是微妙的,是决策时微观结构。你的策略决定在蜡烛收盘时入场。在决策和订单到达之间,价差已经移动,队列已经移位,你成交的价格不再对应触发决策的条件。效应在快速市场中复合,这些正是零售机器人采取最多头寸的市场。

修复是在决策时刻订单簿状态的 影子捕获,与交易一起持久化。捕获顶部买/卖价、价差(以基点计)、±0.1% / ±0.5% / ±1% 处的深度,以及前 10 秒的 taker 交易量。在交易关闭后将这些与实际成交质量进行比较。预期和实际成交质量之间的差距是你的真实滑点预算,明确跟踪它将不可见的拖累转换为可见的、可修复的拖累。

具体来说:忽略决策时微观结构的机器人通常比明确建模它的机器人每次往返多支付 15-40 个基点。在每笔交易 50 bp 毛利优势的策略上,这是盈利和不盈利之间的区别。

失败模式 #7 — 静默策略衰减(没有实时监控)

策略会衰减。不是因为加密市场独特地残酷(每个市场的每个策略都会衰减),而是因为零售机器人利用的 alpha 优势的半衰期以月,有时以周计算。量化行业有一个术语:alpha 衰减

失败模式不是衰减本身。是零售构建者部署策略,观察两周,看到绿色 PnL,然后停止观察。六个月后他们看账户,权益低于部署基线,策略在该窗口的大部分时间里都在静默地不盈利。

三个监控工件在权益流出之前捕获这一点。

首先,胜率漂移检测。跟踪滚动 30 天胜率,与策略校准期间的预期胜率比较。当滚动数字连续两周低于基线 1.5 个标准差以上时,策略在衰减。暂停它,在重新部署前重新运行门校准。

第二,门一致性监控。如果你的策略使用 ML 或统计门,跟踪门的预测与实际交易结果之间的一致性。当一致性下降时,门不再具有信息性。市场体制已超出门的训练分布。这通常比胜率漂移早 1-2 周,这给了你早期警告。

第三,滑点漂移。失败模式 #6 中的决策时微观结构捕获也应该随时间监控。价差上升、订单簿深度下降和实现滑点上升都表明策略的首选执行窗口正在变得更昂贵,通常是因为更多机器人来到同一交易。

实用规则:任何上线超过 90 天而没有跟踪这三个工件的监控仪表板的策略都在不知不觉中流血。修复不是理论性的。设置每日报告,即使是纯文本电子邮件,显示每个指标与其基线。成本是一天的工程。节省的是你在检测和下一次崩盘之间会失去的一切。

真正有效的 10% — 12 点起飞前检查清单

在完整市场周期(牛市、熊市和震荡)中存活的策略共享一小组结构属性。在将任何新机器人部署到生产之前使用此检查清单。

Self-audit
How does your bot score?
Tick every item your strategy actually satisfies. Saved to your browser.
0/12
Statistically destined to fail

Backtest integrity

Signal quality

Execution realism

Live monitoring

满足所有十二项的策略不能保证盈利。市场仍然是市场。但失败三项或更多的策略统计上注定要加入亏钱的 90%,通常在部署后 6-12 个月内。

常见问题

加密交易机器人有盈利吗?

少数有。综合 ESMA 经纪商披露(74-89% 零售亏损率)、同行评审的零售日内交易者研究(Chague 等 2019 年:97% 在巴西期货上亏钱;Barber 等:台湾约 80%)和链上机器人钱包分析,在完整市场周期内零售加密机器人盈利能力最有可能集中在前 10-25% 的操作员中。没有同行评审研究更精确地隔离加密机器人数字。

什么百分比的加密交易机器人亏钱?

在完整市场周期内大约 75-90%,基于同一证据栈:监管机构强制 CFD 经纪商亏损率披露、零售日内交易者盈利能力的学术研究(Chague、De-Losso 和 Giovannetti 2019;Barber、Lee、Liu 和 Odean)和公共机器人市场数据。没有研究专门隔离加密机器人,但产生该数字的失败模式(过拟合、幸存者偏差、对体制盲、滑点拖累)在任何个别策略中都是可观察和可量化的。

为什么我的加密交易机器人亏钱,即使回测看起来很好?

最常见的原因是回测中的幸存者偏差与实时执行中未建模的滑点相结合。从默认数据源拉取的回测只包括幸存的币种,假设以收盘价成交,两者都使回测回报年化膨胀 5-20%。加上过拟合和缺失的体制门,30% Sharpe-3 回测可以变成 Sharpe-0.2 实时 PnL。

加密交易机器人在 2026 年真的有效吗?

是的,但只有当构建了对七种失败模式的明确防御时。结合时点宇宙、信号门控、体制过滤、校准 RR 阈值、决策时滑点捕获和实时监控的机器人在 2026 年继续产生正风险调整回报。跳过其中任何两项的机器人通常在费用后表现不如简单的 BTC 买入持有。

加密交易机器人需要多长时间才能开始工作?

正确构建的机器人应该在实时部署的前 60-90 天内为净正。如果不是,样本内回测可能被过拟合。具有真实优势的策略往往在 100-300 笔交易内显示统计显著的样本外表现,具体取决于胜率。在该范围之外,"需要更多时间收敛"的主张通常表明策略没有真实优势。

构建加密交易机器人还是购买更好?

构建在时间上更贵,但在失败成本上更便宜。市场上预建的机器人几乎普遍存在相同的过拟合和体制盲问题,因为市场的激励是发布历史上看起来很好的策略,这正是最可能过拟合的策略类型。应用了 12 点检查清单的自定义机器人比顶级市场机器人有可衡量更好的胜率。

结论

90% 数字是七个具体工程错误的累积结果,在数千个零售交易系统中重复。每个错误都有修复。大多数修复在技术上并不困难;它们很乏味,需要纪律,而每个"AI 交易平台"的营销文案都在积极反对这种纪律。

如果你在构建机器人,你的优势不在于找到更好的指标。指标宇宙已耗尽;每个适合 Twitter 帖子的零售优势都已经被套利。你的优势来自不犯上述七个错误。这是比大多数零售加密内容做出的更小、更诚实的主张,也是与数据一致的唯一主张。

在你写一行策略代码之前,从 12 点检查清单开始。你在时点宇宙构建、信号门、体制过滤和实时监控上花费的小时与调整指标的多巴胺相比将感觉缓慢。它们也是将 10% 与 90% 分开的工作部分。

来源与进一步阅读

  • Chague, F., De-Losso, R., Giovannetti, B. (2019). Day Trading for a Living? 圣保罗大学 / FGV-EESP 工作论文。SSRN:3423101。发现:97% 持续超过 300 天的巴西期货日内交易者亏钱;没有通过经验学习的证据。
  • Barber, B., Lee, Y.-T., Liu, Y.-J., Odean, T. (2014). The Cross-Section of Speculator Skill: Evidence from Day Trading. 金融市场期刊。发现:约 19% 的台湾重度日内交易者扣除费用后获得正异常回报。
  • Bailey, D., Borwein, J., López de Prado, M., Zhu, Q. J. (2015). The Probability of Backtest Overfitting. 计算金融期刊。SSRN:2326253。形式证明策略搜索以样本外表现为代价膨胀样本内 Sharpe。
  • ESMA,CFD 产品干预措施(2018 年至今更新)。零售 CFD 亏损率披露任务。行业范围:74-89%。
  • eToro,一般风险披露和 FCA 强制英国亏损率披露(目前 77% 英国;51% 全球)。etoro.com/customer-service/general-risk-disclosure
  • Glassnode / Kaiko,MEV 和套利机器人钱包盈利能力的公共链上分析(2023-2024)。盈利能力集中在前 5-10% 的操作员。