阿提亚 博客 Attia


当复杂的模型遇到有问题的假设时

孟德尔随机化是一个强大的工具——但当要求基因回答错误的问题时,就失去了作用。

泰勒·耶特、迈克尔·雷、彼得·阿提亚 2026年3月21日

理解科学


孟德尔随机化(MR)已成为现代流行病学中的热门方法,这并非偶然。如果运用得当,能巧妙地解决该领域最古老的问题之一:偏倚。通过使用基因变异作为暴露的替代指标,MR 可以在不实际进行随机分组的情况下,近似模拟随机实验。几周前,我们详细介绍了这项技术,并深入探讨了一个引人入胜的案例——利用多个与低密度脂蛋白胆固醇(LDL-C)相关的基因来检验低LDL-C是否是导致痴呆风险的因果因素。(如果想更深入地了解优秀的 MR 方法在实践中是什么样的,这篇文章值得一读。)这正是 MR 的最佳应用:明确的生物学特征、稳健的遗传结构、强大的工具变量以及合理的因果路径。

最近一项研究试图将同样的逻辑应用于一个截然不同的问题:流行的饮食方式——特别是低热量、素食或无麸质饮食——是否会导致银屑病和湿疹等炎症性皮肤病?^¹^ 该研究的主要发现是,低热量饮食可能会增加患银屑病关节炎的风险。但是,在开始通过暴食来缓解压力之前,这里存在一个更根本的问题——这个问题远早于统计数据——那就是遗传学是否能够对这个问题给出有意义的答案。

构建案例

这项研究的前提很有意思。过去二十年来,低热量、素食和无麸质饮食迅速流行起来——这在很大程度上得益于社交媒体的推动——每种饮食都有其独特的生物学原理。低热量饮食被认为可以延长寿命、诱导自噬,并改善心血管疾病和2型糖尿病的预后。素食富含纤维和抗氧化剂,饱和脂肪含量低,且不含肉类(有时是因为人们认为肉类有害)。无麸质饮食最初是为乳糜泻患者开发的,现在由于人们普遍认为麸质会促进炎症,即使是对那些没有正式确诊的人也是如此,因此也被广泛接受。但是,如果这三种饮食不均衡,都可能导致铁、锌、钙、维生素B12、维生素D和omega-3脂肪酸的缺乏——这些营养素在免疫调节、皮肤屏障功能和伤口愈合中发挥着重要作用。换句话说,这些饮食与炎症之间的关系远非单向的。现有的观察性文献反映了这种模糊性——一些研究表明素食可以改善特应性皮炎症状,而另一些研究则发现两者之间根本没有关联——传统的观察性研究难以受到混杂因素和选择偏倚的影响,因此难以得出明确的结论。

为了排除干扰因素,该研究采用了孟德尔随机化(MR)方法,从英国生物银行(UK Biobank)——一个包含约50万英国参与者遗传和健康信息的大型生物医学数据库——提取膳食暴露数据,将其与全基因组关联研究目录(GWAS Catalog)的数据相结合。GWAS Catalog是一个涵盖数百种性状和疾病的全基因组关联研究结果库。研究人员分析了与三种膳食模式相关的遗传变异,以及四种炎症性皮肤病:银屑病、银屑病关节炎、特应性皮炎和痤疮。样本量很大——膳食暴露数据约有6.5万名参与者,疾病结局数据多达46.3万名参与者——作者采用了五种不同的MR方法,进行了敏感性分析,以检验在探究潜在缺陷时结果是否仍然成立。

从表面上看,这似乎是一项设计精良的研究。

用锤子敲螺丝

即使是最好的工具也必须用于合适的用途。你不会用锤子把两块木头用螺丝在一起——如果你真这么做了,肯定会有人批评你的手艺。

要使孟德尔随机化(MR)有效,必须满足三个核心假设:遗传变异必须能够强有力地预测暴露因素;不能与其他混杂因素相关;只能通过暴露因素本身影响结果。当暴露因素是低密度脂蛋白胆固醇(LDL-C)或血压等生物学特征时——这些特征具有明确且特征鲜明的遗传决定因素——这些假设是合理的。我们可以指出参与脂质代谢的特定基因,这些基因能够可靠地预测不同人群中LDL-C水平的升高或降低。

但究竟是什么基因能够真正预测一个人是否会选择素食呢?与低密度脂蛋白胆固醇或血压(这些生物特征受特定代谢途径调控)不同,饮食模式是复杂的人类行为,受到文化、伦理、经济、地理和个人偏好等因素的影响。任何基因信号都不太可能直接代表饮食本身。充其量,可能反映的是一些间接相关因素:口味偏好、人格特质、教育程度或其他社会经济因素。换句话说,基因检测可能根本就不是在测量饮食本身,而是在测量哪些人倾向于选择特定的饮食方式。

作者的方法清楚地揭示了这个问题。由于符合常规标准的变异体数量太少,被迫将显著性阈值放宽几个数量级——从标准的全基因组水平 p<5×10⁻⁸ 降至 p<5×10⁻⁵。实际上,这相当于在遗传学上承认根本不存在能够有效预测暴露的因子。因此,分析只能使用较弱的信号,这些信号更有可能反映的是噪声或间接相关性,而非真正的因果工具。回到之前的比喻:就像把螺丝钉进去后发现连接处不牢固,于是决定降低对牢固连接的标准——然后照常公布结果。在车间里看起来没问题,但一旦施加任何实际重量,问题就会很快显现出来。

然而,工具效度问题远不止于此。孟德尔随机化(MR)隐含地假设暴露在一生中相对稳定,因为基因变异从受孕时就已存在。这对于基因预测的低密度脂蛋白胆固醇(LDL-C)来说效果很好,因为LDL-C往往随时间推移保持稳定。但终生坚持素食、低热量或无麸质饮食的人寥寥无几。有人可能在调查时遵循某种饮食方式,但可能只是最近才开始,明年就放弃了。基因工具本应代表终生暴露,但实际暴露很可能是短暂且不稳定的。

换句话说,低密度脂蛋白胆固醇(LDL-C)是一种生物学变量,受特定基因编码的酶和转运蛋白调控。饮食模式是受文化、经济、身份和环境影响的人类行为。前者具有遗传结构,后者则没有。

将 MR 应用于自我报告的饮食模式不仅仅是一个需要顺便提及的方法论局限性——这是工具和任务之间的根本性不匹配,影响了论文中的每一个结果。

根本问题依然存在。

由于基因无法可靠地预测一个人的实际饮食习惯,这项研究仍然会受到饮食研究中常见的各种偏见的影响。自我报告的饮食数据向来不可靠——人们会谎报自己的饮食,而且饮食类别本身的定义也不够清晰。“低热量饮食”对不同的人来说意味着不同的东西。比如,有人尝试了一个月的“无肉星期一”,可能会自称是素食主义者。

因此,这项研究几乎没有发现任何结果也就不足为奇了。仅有一项具有统计学意义的结果:低热量饮食与银屑病关节炎风险略有增加相关,比值比为 1.05(95% 置信区间:1.01–1.10)——即使仅从表面上看,5% 的相对风险增加在临床上也微乎其微。低热量饮食与银屑病、特应性皮炎或痤疮之间均未发现显著关联。素食和无麸质饮食也未发现任何关联。

即使是这唯一的阳性结果也令人深感怀疑。大量文献表明,限制热量摄入可以减轻炎症——因此,一个方向相反的微弱正相关性,是基于薄弱的工具变量和宽松的显著性阈值下的自我报告数据得出的,看起来更像是噪声而非信号。

还存在反向因果关系的问题。如果低热量饮食与银屑病关节炎之间的关联是因为该病患者将低热量饮食作为一种替代疗法呢?作者正确地指出,孟德尔随机化(MR)的理论设计旨在消除这个问题——因为基因变异在受孕时就已经固定,所以不可能是由后天患上的疾病引起的。在经典的孟德尔随机化模型中,这种逻辑是成立的。但这种保护机制只有在基因变异真正代表了我们感兴趣的暴露因素时才有效。如果与“选择低热量饮食”相关的变异实际上标记的是更广泛的因素——例如健康意识、体重担忧或促使饮食改变的早期症状——那么该工具变量从一开始就没有真正测量饮食。当工具变量本身被错误指定时,孟德尔随机化无法消除偏差。只是将混杂因素转移到了上游的遗传层面。

结论

这并非是对孟德尔随机化技术本身的否定,也并非是对作者的否定。值得称赞的是,他们坦诚地指出了研究的局限性——承认统计效力不足、自我报告的饮食数据存在问题, 明确提醒读者,他们的研究结果不应被解读为确凿的因果证据。

问题在于,许多人并不阅读论文的局限性部分。他们只看标题,略读摘要,就得出低热量饮食可能导致银屑病关节炎的结论。在这种结论传播迅速的环境下,论文的实际内容与人们的理解之间存在差距,会造成真正的混乱。

根本问题不在于统计数据、样本量,甚至不在于银屑病关节炎那一项临界结果。问题在于,支撑这项分析的遗传工具根本无法捕捉到饮食模式这种行为复杂且定义不一致的因素。当基础不稳固时,再严谨的方法论也无法改变其根本所在。

当你看到一项关于行为暴露的孟德尔随机化研究时,要问问自己,这些遗传工具是否真的符合它们预期的预测结果的生物学意义。就此例而言,诚实的答案是否定的——而且无论分析方法多么复杂,都无法改变这一事实。

参考

  1. Yu Y, Wang S, Lin J, 等. 流行饮食(低热量、素食和无麸质饮食)与炎症性皮肤病之间的因果关系:一项孟德尔随机化研究。Clin Cosmet Investig Dermatol . 2025;18:2605-2615. doi: 10.2147/CCID.S538761

https://peterattiamd.com/when-sophisticated-models-meet-questionable-premises/

核心观点:孟德尔随机化(MR)是强大的流行病学工具,但用来研究饮食模式这类复杂行为时,因前提假设不成立,会得出不可靠结论


一、孟德尔随机化(MR)的价值与适用场景

  • MR 以基因变异为暴露替代指标,能规避观察性研究的混杂与偏倚,近似随机对照试验,适合LDL‑C、血压等有清晰遗传基础的稳定生物学性状
  • 理想 MR:暴露定义明确、遗传结构稳健、工具变量强、因果路径合理。

二、被批评的研究概况

  • 研究问题:低热量、素食、无麸质饮食是否导致银屑病、湿疹等炎症性皮肤病。
  • 数据来源:英国生物银行 + GWAS 目录,样本量大、用 5 种 MR 方法 + 敏感性分析。
  • 主要结果:仅低热量饮食与银屑病关节炎风险微弱相关(OR=1.05),其余均无显著关联。

三、核心批判:工具与任务严重不匹配

MR 成立的三大核心假设在此研究全部失效

  1. 工具变量无效饮食是文化、伦理、经济、偏好塑造的行为,无强遗传预测因子;研究被迫大幅放宽基因显著性阈值,工具变量极弱,易捕捉噪音与间接关联(如口味、社会经济因素)而非饮食本身。
  2. 暴露不稳定MR 默认暴露终身稳定,但多数人不会终身坚持某类饮食,基因无法代表短暂、多变的行为暴露。
  3. 偏倚无法排除自报饮食数据不可靠、定义模糊;微弱阳性结果与大量文献矛盾,更可能是反向因果或混杂(如患者为治病改吃低热量饮食),MR 无法纠正工具错误带来的偏倚。

四、结论与启示

  1. 并非否定 MR 方法或研究者,而是工具用错场景
  2. 复杂行为(如饮食)缺乏清晰遗传基础,不适合 MR
  3. 公众易只看标题忽略局限,导致科学结论被误读、传播失真
  4. 关键提醒:评估行为类 MR 研究,先看基因工具是否真能合理预测该暴露

D:2026.03.24>

彼得・阿提亚(Peter Attia)团队猛烈抨击了 Klinedinst 等人一项声称 “每日食用奶酪和饮用葡萄酒可能改善长期认知功能” 的研究,认为其结论荒谬、设计与分析存在多重致命缺陷,完全不符合科学严谨性:

**一、研究核心信息与结论**

该研究追踪 1787 名 46-77 岁参与者长达 10 年,通过食物频率问卷(FFQs)记录 49 种食物与酒精摄入情况,结合流体智力测试(FIT),探究饮食与认知功能的关联,并按阿尔茨海默病(AD)家族史(FH+/-)、APOE 基因亚型(APOE4+/-,APOE4 为 AD 高风险基因)分组分析。研究得出的核心结论包括:

  1. 奶酪摄入是 FH-、APOE4+、APOE4 - 亚组中与更高 FIT 分数关联最强的饮食因素,但 FH + 组无显著关联;
  2. APOE4 + 组每日饮用任何酒精均显有益,红葡萄酒对 APOE4 - 组和 FH + 组的 FIT 分数有积极影响;
  3. 作者宣称 “每日持续饮酒(非每周 / 每月)或可改善认知表现”,甚至提出 “在合适条件下,每日最多饮用一瓶红葡萄酒可能有益”。

**二、研究的三大核心缺陷**

**1. 测量方法存在严重漏洞**

  • 依赖食物频率问卷(FFQs)进行自我报告,参与者需回忆过去 2-7 年的饮食细节,记忆准确性极低,且无法反映饮食模式的动态变化,可能导致某些食物 / 饮品的摄入量被人为高估;
  • 仅纳入 49 种食物 / 饮品,分类过于宽泛,难以提供有意义的细分信息,与作者自身批判的 “先前研究分类粗糙” 形成矛盾。

**2. 分析逻辑与研究设计脱节**

  • 研究初衷是探究饮食对 “流体智力随时间下降” 的影响(纵向研究目标),但绝大多数 “阳性结果” 仅为基线时的横截面关联(如奶酪摄入与基线 FIT 分数相关),而非纵向追踪中认知功能的变化趋势;
  • 奶酪摄入未显示与 FIT 分数随时间变化的关联,仅酒精中的红葡萄酒与 FH + 组的认知下降减缓有微弱关联,完全未能支撑 “饮食改善长期认知” 的核心假设;
  • 无法排除所有混淆变量(如精神疾病、社交隔离等),这些因素既与 AD 风险独立相关,也可能间接影响饮食模式与认知功能,导致因果关系误判。

**3. 结果解读与报告极度不严谨**

  • 结论超出数据支撑范围:每日饮酒的 “益处” 仅存在于占比 21% 的 APOE4 + 亚组,且不同亚组结果矛盾(如 FH - 组每周饮酒与更低基线 FIT 分数相关,白葡萄酒虽与更高基线分数相关但加速认知下降),作者未解释这些矛盾,反而得出 “每日饮酒有益” 的笼统结论;
  • 未报告非显著结果与具体摄入量数据,无法判断剂量效应关系,却荒谬宣称 “每日一瓶红葡萄酒(约 6 标准杯,远超‘重度饮酒’定义)可能有益”;
  • 忽视现有大量研究证据:该研究结论与几乎所有关于酒精与 AD 风险的现有数据相悖,酒精过量摄入实则会增加认知衰退风险。

**三、作者核心观点**

作者认为,该研究的诸多缺陷(测量不可靠、分析逻辑混乱、解读夸大其词)使其结论完全无效。所谓 “奶酪和葡萄酒改善认知” 的说法看似美好,实则是对数据的误读与滥用,本质是一项缺乏科学严谨性的 “糟糕研究”,其结论不应被采信。真正的科学证据显示,过量饮酒会危害认知健康,而此类研究的传播可能误导公众。

不要喝酒搞研究:

为什么关于葡萄酒和奶酪对认知能力影响的研究简直愚蠢至极

一项声称每天食用奶酪和葡萄酒可以改善长期认知能力的研究,与其说是可靠的科学,不如说更像是一个糟糕的笑话。

作者:凯瑟琳·伯肯巴赫、彼得·阿提亚 2023年5月13日


*看到标题,我以为是个恶作剧。 《镜报》*宣称:“吃奶酪和喝红酒可以降低患阿尔茨海默病的风险。”我看了看日期——不是愚人节。这篇文章是认真的。

一项研究的惊人发现

这篇文章报道了Klinedinst等人的一项研究结果,该研究探讨了49种不同的天然食物对流体智力(FI)的影响——流体智力是指独立于任何先前学习进行抽象思考和解决问题的能力。虽然流体智力会随着年龄的增长而下降,但下降的程度与阿尔茨海默病(AD)的风险相关。1787名参与者(研究结束时年龄在46至77岁之间)接受了为期10年的随访,期间他们填写了关于食物和酒精摄入量的食物频率问卷(FFQ),并接受了三次流体智力测试(FIT)——一次在基线时,两次在随访时。为了评估已知的 AD 风险因素如何影响饮食效果,参与者根据 AD 家族史的存在(FH+,n = 482)或不存在(FH-,n = 1305)以及 APOE 亚型进行亚分类——至少携带一个高风险 APOE4 等位基因拷贝的人(APOE4+,n = 369)与不携带该等位基因的人(APOE4-,n = 967)。

作者使用控制了社会经济地位、BMI、性别、吸烟情况和教育水平等因素的模型,并将结果以标准化参数估计值(ꞵ)的形式呈现——即目标预测变量每增加一个标准差,结果变量的变化量。例如,ꞵ 为 0.5 表示预测变量每增加一个标准差,结果变量就会增加 0.5 个标准差。他们发现,在 FH-(ꞵ = 0.207,P < 0.001)、APOE4+(ꞵ = 0.162, P = 0.001 )和 APOE4-(ꞵ = 0.073,P = 0.008)亚组中,高奶酪摄入量是 FIT 评分较高的最强膳食预测因子,但在 FH+ 组中未观察到显著相关性。此外,研究表明,在APOE4+人群中,每日饮用任何类型的酒精饮料均有显著益处(χ² = 0.101,P = 0.022),而红酒尤其与APOE4-人群(χ² = 0.59, P = 0.039)和FH+人群(χ² = 0.100,P = 0.014)中更高的FIT评分相关。作者根据这些数据得出结论:“每日持续饮酒(而非每周或每月饮酒)可能进一步提高评分表现”,并且“在适当条件下,每天饮用一瓶红酒可能是有益的”。

这难道不是个笑话吗?

每天喝一整瓶葡萄酒?这相当于每天六份标准饮品,各位。每周四十二份——至少是美国国家酒精滥用与酒精中毒研究所定义的“酗酒”的三倍。

这些结果——以及研究作者从中得出的结论——几乎与所有关于酒精和阿尔茨海默病的现有数据相矛盾,我曾在之前的播客节目中探讨过这个问题。事实证明,我们无需仔细审查就能发现研究设计和解释中存在无数缺陷,这些缺陷足以让我们完全否定这些结果。我该从何说起呢?

测量误差

正如我在许多简报和播客中提到的,自我报告——例如使用食物频率问卷(FFQ)——是一种非常糟糕的测量方法。尤其是在要求参与者详细回忆过去*两到七年(!)*内的所有饮食情况时,这一点更为明显。在Klinedinst等人的研究中,基线和随访FFQ之间的时间间隔就是如此。除了难以准确回忆每个细节之外,如此长的时间间隔也使得参与者无法指出他们的饮食习惯在这段时间内可能发生的变化,因此,如果某个参与者恰好在调查前的几周内摄入了更多某种食物或饮料,那么这些食物或饮料的摄入量可能会被人为地高估。

此外,作者指出他们在问卷中纳入了49种不同的天然食品或饮品。这个数量似乎不足以涵盖所有可能的食物或饮品,而且如果将它们归类过于宽泛,反而会造成信息不清。具有讽刺意味的是,作者指出之前的研究也存在同样的缺陷,以此来解释为什么他们的研究在区分不同类型的酒精方面更胜一筹。

分析中的缺陷

Klinedinst等人开展这项研究的目的是调查各种膳食成分对食物摄入量下降的影响,这一目标需要观察食物摄入量随时间推移相对于基线的变化情况。然而,研究作者报告的大部分结果仅反映了基线时食物摄入量的显著差异。例如,奶酪摄入量是基线时食物摄入量与健康指数(FIT)评分的最强预测因子,但每日奶酪摄入量与FIT评分随时间的变化之间并未发现关联。同样,总体酒精摄入量与FIT评分仅在基线时呈正相关,尽管在FH+组中,红酒的摄入量似乎与FIT评分随时间的变化相关。换句话说,尽管研究人员试图进行一项纵向研究(对参与者进行数年的随访并追踪食物摄入量的变化),但几乎所有纵向研究结果均为阴性。因此,他们报告的大多数“阳性”结果实际上是横断面研究结果,仅代表葡萄酒/奶酪摄入量与基线食物摄入量之间的瞬时相关性。

有人可能会认为,基线差异表明某种食物或饮料在研究开始前的几年里发挥了作用,但我们有两个重要的理由对这种解释持怀疑态度。首先,假设那些一开始就摄入最多奶酪的人,之后仍然比其他人摄入更多的奶酪,那么如果奶酪确实是导致他们基线FIT评分较高的原因,我们难道不应该预期他们的FI下降速度会更慢吗?换句话说,如果只有基线而非FI下降速度随奶酪摄入量而变化,那就表明基线差异实际上是由其他一些变量造成的,这些变量的影响可能完全或主要发生在研究开始之前(例如遗传因素)。

这引出了我们第二个主要的怀疑理由。即使我们只考察基线时奶酪摄入量差异与FIT评分差异之间的相关性(即,将Klinedinst等人的研究视为一项横断面研究),我们也无法得出奶酪是致病因素的结论,因为我们不可能校正所有相关的协变量。例如,研究人员并没有校正某些精神疾病或社会隔离——这些因素已被证明与阿尔茨海默病独立相关。也许有些人奶酪摄入量较少,是因为他们不经常参加葡萄酒奶酪之夜或与朋友一起吃披萨。饮食与我们生活的其他方面密切相关,很容易想到几十种其他变量可能影响或与饮食模式*、* FI下降或阿尔茨海默病风险存在共变关系的方式。

解读和报道中的缺陷

Klinedinst等人最严重的错误或许在于,他们基于少数几个在特定亚组人群中取得的显著但不一致的结果,就得出大胆而笼统的结论,尤其是在饮酒方面。任何类型的每日饮酒仅与APOE4+人群(仅占研究参与者的约21%)的基线FIT评分较高相关。虽然在FH+人群中,红酒与FIT评分随时间推移下降速度较慢相关,但在该人群中并未观察到与红酒的显著相关性。考虑到高风险等位基因会在家族中遗传,FH+人群可能与APOE4+人群存在相当大的重叠。与此同时,在FH-人群中,每周饮酒与基线FIT评分显著降低相关;而白葡萄酒的摄入虽然与该人群的基线FIT评分较高相关,但却与研究期间FIT评分的显著快速下降相关。

这些结果如何符合逻辑?为什么每天饮酒有益,而每周饮酒却有害?为什么红酒对携带高风险APOE4基因的人没有影响,却对有阿尔茨海默病家族史的人有积极作用?作者并未解释这些矛盾之处,而是笼统地声称每天饮酒可以改善认知轨迹,而红酒则具有“额外的保护作用”。(尽管事实上,红酒的效果量比每天饮酒这一总体上唯一显著的结果还要小。)

值得注意的是,研究人员仅报告了符合显著性标准的数值,因此我们无法得知其他亚组或其他饮酒频率是否存在任何趋势。此外,作者没有提供关于实际饮酒量(或其他任何食物或饮料的摄入量)的信息,因此无法判断是否存在真正的剂量依赖性——尽管我总觉得,即使掌握了这些数据,也不会让我对作者“每天一瓶红酒有益”的说法更有信心。

笑点

那么,奶酪和酒精真的能预防认知衰退吗?俗话说,天上不会掉馅饼,Klinedinst等人的研究显然也不例外。这项研究漏洞百出,其结论根本站不住脚,尤其考虑到迄今为止大量可靠证据都与他们的发现相悖。总而言之,这项研究简直就是个笑话,或许这些研究人员只是太过沉迷于自己关于饮酒的建议,以至于忽略了其中数不胜数的缺陷。所以,也许他们最终还是成功地表达了关于葡萄酒和智力的观点:只有长期酗酒的人才会把这种愚蠢程度的结论误认为是科学。

D:2026.01.12
讨论列表 AKP讨论 查看原帖及回帖