彼得・阿提亚(Peter Attia)针对一项近期热议的运动强度研究展开批判,该研究(Biswas 等人,2025 年发表于《自然・通讯》)分析了英国生物样本库中 73,485 名成年人(基线平均年龄 61.6±7.9 岁)的腕戴设备运动数据,追踪 8 年健康结局后提出:“1 分钟高强度运动(VPA)可等效替代 156 分钟低强度运动(LPA)(针对癌症死亡率降低)”,类似结论在全因死亡率、心血管事件等结局中也有体现(如 1 分钟 VPA 等效 50-95 分钟 LPA)。这一 “高效替代” 结论引发广泛关注,但阿提亚指出,该研究存在严重解读偏差,其结论无法直接指导个体运动计划。
<100mg 为 LPA(<3 METs,如站立、洗碗)、
100-400mg 为中等强度运动(MPA,3-6 METs,如快走)、
>400mg 为 VPA(≥6 METs,如慢跑);
研究给出的 “强度等效比”(VPA:MPA:LPA)如下:
| 健康结局 | 等效比 | 关键结论(1 分钟 VPA 等效 LPA 时长) |
| — | — | — |
| 全因死亡率 | 1:4.09:52.65 | 52.65 分钟 |
| 心血管疾病死亡率 | 1:7.78:72.47 | 72.47 分钟 |
| 主要不良心血管事件(MACE) | 1:5.44:86.13 | 86.13 分钟 |
| 2 型糖尿病 | 1:9.40:94.03 | 94.03 分钟 |
| 运动相关癌症死亡率 | 1:3.47:156.23 | 156.23 分钟(争议最大结论) |
| 运动相关癌症发病率 | 1:1.63:5.09 | 5.09 分钟 |
从数据可见,VPA 单位时间效益显著高于 MPA 和 LPA,但阿提亚强调,这一 “等效” 仅为统计关联,并非实际可替代关系。
研究仅通过 3-7 天的运动数据 “快照”,推测 8 年健康结局,忽略了个体运动习惯、体能、伤病的长期变化。例如,某参与者在数据采集期的高强度运动可能是短期行为,而非长期习惯,这种 “静态数据” 无法支撑 “长期替代” 的结论。
该模型的核心是 “排除其他强度运动的干扰后,孤立某一强度的效益”,而非 “模拟人类主动用 VPA 替代 LPA 的真实场景”。例如,模型显示 “1 分钟 VPA 与 50 分钟 LPA 对全因死亡率的降低效应相似”,但这仅代表 “两者在统计上的关联强度相当”,不意味着用 1 分钟 VPA 替代 50 分钟 LPA 后,健康效益能完全一致 —— 人类运动是多强度组合行为,而非单一强度的 “非此即彼”。
腕戴加速度计仅记录 “运动幅度与速度”,无法反映生理实际消耗。例如:
同一强度运动(如快走),在炎热天气负重进行,与凉爽天气无负重进行,设备记录的加速度可能相同,但身体承受的生理负荷(心率、乳酸水平)差异巨大;
训练有素的马拉松运动员与久坐人群进行相同强度徒步,设备数据相似,但前者的生理应激远低于后者。这种 “设备定义强度” 与 “生理实际强度” 的脱节,导致 “等效比” 的量化精度存疑 —— 模型的 “精确比值” 更多是统计结构的产物,而非真实生理规律的反映。
结合阿提亚批判与其他近期研究(如杭州师范大学、中南大学湘雅医院等),运动强度与健康的关系并非 “高强度最优”,而是呈现非线性特征:
基于上述研究,结论共同指向 “分层、平衡、个体化” 的运动策略:
运动的核心目标是 “健康获益”,而非追求 “高强度时长” 或 “步数排名”:
Biswas 研究的 “1 分钟替代 156 分钟” 结论,是对 “统计关联” 的过度解读,无法直接指导个体运动。结合所有研究,科学运动的核心在于:
D:2026.01.27>
一项在网络上疯传的可穿戴设备数据研究表明,一分钟的剧烈运动可以替代156分钟的低强度运动。但仔细分析数据后,却发现了不同的结果。
泰勒·耶特、凯瑟琳·伯肯巴赫、彼得·阿提亚 2026年1月17日
2026年已经过去近三周了,许多人仍然沉浸在新年决心多运动的动力中。但随着时间的推移,一些曾经更频繁去健身房的人会开始放弃这个习惯——通常是因为他们开始觉得投入的时间难以坚持。
因此,人们想要优化时间也就不足为奇了,尤其是在锻炼方面。我们都想知道:如何才能用最少的时间获得最大的益处?
根据最近发表的一篇论文,答案几乎简单得令人难以置信:选择强度而非持续时间。作者利用超过73000名成年人的可穿戴设备数据,研究了运动强度在提升运动健康益处方面的作用,其结果在过去几周内引起了媒体和社交媒体的广泛关注。最引人注目的发现是什么?对于某些健康指标(例如降低癌症死亡率),研究人员报告称,每分钟的高强度运动相当于156分钟(超过两个半小时)的低强度运动。
在我们的内容中,我们一直提倡训练计划应包含各种强度的训练课程,其中中等强度、稳定状态的运动(二区)所占时间至少应与高强度训练(第五区)所占时间相等。但是,既然只需几分钟全力冲刺就能结束一天的训练,为什么还要花费数小时进行低强度或中等强度的运动呢?难道我们一直以来都错了吗?
这想法很诱人,但并非如此。这种解释过于简化了研究的真实结果,更重要的是,它未能反映运动在现实世界中的作用方式。
在这项研究中,Biswas等人分析了来自英国生物银行(UK Biobank)的73,485名成年人的活动数据(平均基线年龄为61.6±7.9岁),并对这些个体进行了平均长达八年的随访,追踪了他们的各种健康结果。研究人员没有依赖自我报告的活动数据(众所周知,自我报告的活动数据不够精确),而是使用佩戴在手腕上的可穿戴设备来追踪活动情况,参与者连续佩戴该设备长达七天。然后,研究人员使用基于设备的机器学习算法,以10秒为单位对运动强度进行分类。
强度是根据既定的加速度阈值(以毫重力 (mg) 为单位)定义的,并映射到近似的代谢当量 (MET) 值。代谢当量是一个反映活动能量消耗相对于静息代谢的单位(1 MET 对应于静息能量消耗)。加速度小于 100 mg 的运动被归类为轻度运动,通常对应于 MET 低于 3 的活动,例如站立和其他日常活动(例如洗碗或熨衣服)以及慢走。加速度信号更高的活动,当达到或超过 100 mg 时,被归类为中度运动,大致对应于 MET 为 3 至 6 的活动(例如快走)。超过 400 mg 的高能量运动被归类为剧烈运动,通常对应于 MET 为 6 或更高的活动(例如慢跑或跑步)。
然后,将每个强度类别所花费的时间与包括全因死亡率、心血管事件、2 型糖尿病、癌症发病率和癌症死亡率在内的结果联系起来。通过统计校正在其他强度类别所花费的时间(一种称为“相互调整”的技术——我们稍后会详细介绍),分离出每种强度的贡献。
为了估算“等效性”,作者比较了多少轻度或中度活动与一分钟剧烈活动在达到相同模型预测的风险降低效果之间有何关联。例如,如果一分钟剧烈活动可以降低一定的全因死亡风险,那么多少分钟的轻度或中度活动才能达到相同的风险降低效果呢?
对于全因死亡率和心血管代谢结局而言,1分钟剧烈运动相当于约4-9分钟中等强度运动和约50-95分钟轻度运动。癌症死亡率的对比更为显著,我们发现普遍认为,1分钟剧烈运动与156分钟轻度运动的风险降低幅度相似。如原始文章表1(见下文)所示,在所有结局指标中,中等强度运动在单位时间内始终比轻度运动表现出更强的关联性,但剧烈运动似乎最节省时间。
事情就此结束了——对吧?如果事情就是这样,那么结论就很简单:专注于增加剧烈运动,你就万事大吉了(并且成功地最大限度地减少了你在健身房花费的时间)。
遗憾的是,这种解释远远超出了这些数据实际所能支持的范围。
高强度运动的确可能更有效率,因为与低强度或中等强度运动相比,高强度运动每分钟带来的适应性提升更大,因此Biswas等人报告的总体关系与之前的认知相符。但遗憾的是,我们只能从这些数据中得出这些结论。这项研究的局限性体现在很多方面,当我们深入分析时,会发现其限制一直延伸到核心层面。
首先,这项研究的暴露时间短暂且仅为观察性研究。研究人员仅在研究的某个阶段测量了三到七天的运动情况,然后以此来模拟几年后的结果。在这段时间里,训练习惯、体能、伤病和能力都可能发生显著变化。研究人员捕捉到的只是行为的短暂快照,然后将其推算到未来,而没有控制总活动量或活动模式随时间演变的情况。仅此一点就限制了这些结果在指导个人决策方面的精确度——但这还不是全部的局限性。
现在让我们回到之前提到的相互调整的回归模型,它是分析的核心。这种方法旨在解释人们一天中会进行多种强度的活动,轻度、中度和剧烈活动并非孤立存在。这些行为往往相互关联,而模型的任务就是理清这种重叠。它通过计算在考虑其他强度活动时间后,某一强度活动时间与健康结果之间的关联来实现这一点——这类似于其他观察性研究在评估疾病风险时调整年龄、性别或吸烟等因素的方法。该模型无法模拟现实世界中的替代情况,即人们有意用一种活动替代另一种活动。
因此,虽然从该模型可以合理地得出结论,剧烈运动一分钟与全因死亡风险降低约 50 分钟相比,具有相似的调整效果,但得出两者可以自动相互替代的结论是不公平的。
当我们进一步深入分析,探究实际测量的内容时,这种统计框架的可靠性就更加令人质疑了。数据来自佩戴在手腕上的加速度计。这或许比自我报告的活动量有所改进,但加速度计测量的是运动,而非生理负荷。换句话说,它们记录的是运动的幅度和速度,而不是运动对人体的消耗程度。试想两种步行方式,它们在手腕上的加速度模式可能非常相似:一次是凉爽的春日漫步于绵延的丘陵,另一次是在炎热的夏日背着50磅重的背包进行同样的步行。或者,想象一下一个未经训练的人和一个马拉松运动员进行同样的徒步旅行。从设备的角度来看,这两种情况可能很相似。但从人体的角度来看,情况却截然不同。
因此,本研究中使用的强度类别——轻度、中度和剧烈——是由设备定义的,而非生理学定义的。同一类别可能代表训练有素者稳定的有氧运动,也可能代表体能下降或负重者接近最大强度的运动。当基于这些类别构建等效比率时,其表面精度更多地反映了模型的结构,而非底层信号的准确性。换句话说,运动类别定义的高度不确定性意味着,任何试图通过统计“校正”其他运动所花费的时间来分离出某种运动类型的尝试都将产生巨大的误差,以至于所报告的比率几乎无法提供任何关于运动强度和疾病的可靠定量信息。
我们可以继续深入探讨,但为了避免讨论偏离主题,我们先就此打住:这些数据描述了人群层面的运动强度(而非运动强度)与长期健康结果之间的关联。它们并没有解决如何在个体训练计划中分配强度的问题。将这些结果视为时间转换公式,是用统计学上的简洁性取代了生理学的现实——在生理学的现实中,耐力、循序渐进性和总训练量仍然起着至关重要的作用。
值得回到本文的研究层面。作者提出的问题是一个群体层面的问题:*在数万人中,哪些出行模式与更好的结果相关?*这是一个合理的问题——但这与询问什么对特定个体而言能带来最佳结果并不相同。
个人训练效果取决于个人情况。时间安排、训练经历、受伤风险和当前能力都会影响训练的可持续性和有效性。对大多数人来说,关键不在于选择哪种强度,而在于将不同强度的训练结合起来,并明确训练目标。
例如,稳态训练可以让我们在控制关节压力和疲劳的同时,积累足够的训练量。这种训练量为高强度训练打下了基础,使之首先变得安全且易于承受。随着时间的推移,它还能让我们延长高强度训练的持续时间和频率,而不是仅仅短暂地进行高强度训练,然后寄希望于它能带来进步。
高强度训练的目标并非只是为了完成任务或短暂达到某种状态,而是为了培养应对更多此类训练的能力,并能更频繁地完成,同时减少疲劳和降低受伤风险。而这只有在强度训练建立在坚实的基础之上时才能实现。
我们之前已经多次探讨过这个话题。内容之多,要全部看完恐怕要花上好几个小时——正因如此,我们才发布了一期问答节目,集中讲解其中最有价值的要点。我们会详细讲解如何看待心肺适能,不同强度的训练如何融入到连贯的训练策略中,如何循序渐进地提升训练强度,以及需要避免哪些常见的误区。
我们大多数人都没有无限的时间锻炼,所以追求效率是可以理解的。我们都希望在既定的运动量下,获得最大的健康和体能收益。因此,当我们听到“一分钟剧烈运动的效果相当于两小时以上的轻度运动”这种说法时,很容易会减少总的运动量——用每周几分钟的剧烈运动来代替几个小时的轻度或中度运动。但这些说法建立在一项非常不可靠的研究之上,即使我们忽略数据可靠性的问题,Biswas等人的研究也并没有告诉我们用一种运动方式替代另一种运动方式是行不通的。
所有强度的运动都很重要,但它们不能互相替代。高强度运动对于提升心肺功能是必要的,但只有在足够多的低强度运动量之上叠加,才能真正发挥其益处,使高强度运动带来的压力变得可以承受并可重复。中等强度的稳定状态运动可以为此奠定基础,而轻度运动则可以增加总活动量,但不能替代训练。合适的平衡取决于个人——他们的运动经历、身体限制和目标——而不是基于不确定性较高的人群数据得出的时间转换比率。
如需查看以往所有每周电子邮件的列表,请点击此处。