由黎明陈
Daniel说的数字

你知道缅因州的离婚率与人造黄油的人均消费量密切相关吗?哇,也许不吃人造黄油就能防止离婚!我完全可以想象一篇流行媒体的文章有这样一个引人注目的标题。在扔掉所有人造黄油来挽救你的婚姻之前,像你这样聪明的读者可能会对自己说:“多么荒谬,趋势一致可能只是巧合,它们之间根本没有因果关系。”

图1:缅因州的离婚率与人均人均人均人均消费相关。这是一个随机发生的关系,或者这里有什么值得挖掘的吗?(来源:虚假的相关性)

这种巧合但未经证实的联系也可以在科学研究中发现,特别是在最近有关微生物组领域的新闻中,该领域探索了栖息在我们身体中的微生物(也被称为微生物)。我们肠道中的“好”微生物可以帮助我们更好地吸收营养,保护我们免受感染,而“坏”微生物会让我们生病。随着研究人员深入研究我们的微生物群,他们发现我们体内的微生物与一系列健康后果和疾病有关,包括肥胖,糖尿病,阿尔茨海默病,沮丧,多发性硬化症,ALS., 和自闭症

表面上,这些结果表明,新的一系列治疗方法在地平线上;如果我们改变我们的饮食,用酸奶更好地吃更多的益生菌,或用“好”微生物更换我们的微生物组,我们正在跟踪缓解这些疾病,对吧?但是,真相比似乎更复杂。这些研究中的大多数仅表明微生物组和疾病之间存在关系。我们尚不知道微生物导致患者迄今为止的究竟是多么了解,或者如果微生物根本引起疾病。很多时候,微生物组字段的消息落入“相关性并不意味着因果关系”陷阱,其中两个变量之间的关系并不意味着直接原因和效果。

相关性并不意味着因果关系

为了批判性地评估现有的科学发现,我们必须首先了解相关性和因果关系之间的差异。相关性意味着两种不同变量之间存在关系或模式,但它不会告诉我们它们之间关系的性质。

相反,因果关系意味着除了两个事件之间的关系之外,一个事件导致另一个事件发生。例如,如果我们不睡觉,我们会觉得困。前者(不睡觉)直接导致后者(感到困倦)。

相关性和因果关系之间的区别似乎是简单的,但很容易错误地假设来自相关的因果,特别是当存在复数的复杂相互作用时。以下是错误地推断出相关性的常见主题,或者为什么“相关性并不意味着因果关系”:

图2:关于相关性和因果关系的常见误解。(1)2个事件之间的关系可能是巧合的。(2)2个事件之间的原因和效果可能会逆转。(3)可能有一个第三个,未知的变量,可让这种关系困扰。
  1. 两个变量之间的关系是巧合的

偶然可能会发生不相关变量之间的相关性。一个例子是“Redskins规则“,在美国总统选举前最后一届华盛顿足球队的结果的结果准确预测了1936年至2000年的每次选举结果。直观地,我们知道足球比赛的结果与总统选举无关 - 这观察只是巧合。我们检查的变量越多,我们就越有可能找到由随机机会相关的不相关的变量。

  1. 反向因果关系

反向因果关系意味着事件A和B之间存在致命关系,但不按您期望的顺序 - 原因和效果颠倒。例如,如果我们观察到风车旋转的速度越快,风的风越多,我们可能错误地得出结论,风车旋转导致风。但是,我们知道它是风的风,导致风车旋转。

  1. 一个共同的(第三个)混淆变量导致了这两个事件

在某些情况下,可能存在一个隐藏的底层变量,导致似乎相关的事件。我们可能假设事件是事件B实际上,还有另一个事件C,导致事件A和B.例如,此前,许多研究人员曾发现醇消费与肺癌的风险增加有关。然而,抽烟后来被证明是一个混杂因素。喝酒越多的人抽烟也越多,这就增加了他们患肺癌的风险。

观察性研究无法证明因果关系

虽然相关性很容易观察到,但确定因果关系要复杂得多,需要适当的实验设计。理想情况下,我们希望在实验室中进行实验,在那里我们严格控制所有变量,除了我们感兴趣的那个。然而,这在人体研究中几乎是不可能的。为了进行一项最严格的随机控制实验,我们可能需要参与者住在同一个地方,吃同样的食物,锻炼和睡觉在同一时间,这只是列举了一些变量。因此,大多数人类微生物组的研究大多是观察性的。

图3:大多数微生物组人口研究中的工作流程研究人员从健康和生病的参与者中收集粪便样本,通过测序找到这些样品的组成,然后分析数据,以找到来自健康和生病参与者的样本之间的模式差异。

在大多数大规模的人类微生物研究中,比如人类微生物组计划或者美国的项目,研究人员招募一组参与者,收集和序列他们的粪便样本,同时收集有关参与者的生活方式,饮食和健康状况的信息。通过分析患有疾病和健康个体的个体的微生物组的差异,我们可以在微生物组成和感兴趣的疾病之间找到相关性(图3)。

值得注意的是,在这些关系中,因果关系的方向往往是模糊的。具体来说,科学家发现,炎症性肠病患者的肠道细菌与健康个体不同。是肠道微生物群的差异导致患者生病,还是患者自身的疾病状态(如腹泻或炎症增多)导致了肠道微生物群的差异?我们经常很快地假设前者,即细菌是导致疾病的原因,尽管这种因果关系的方向不是那么容易确定。研究人员倾向于称之为“鸡肉和鸡蛋”问题。此外,生活方式是一个很大的混淆因素。疾病患者往往在确诊后改变饮食或服药治疗,这可能会改变他们的肠道微生物组组成。

图4:去除混淆变量,以找到人口研究中的真正关系。一对一匹配的方法,即每个患病的患者与一个生活方式相似的健康对照,可以帮助我们更好地了解肠道微生物群和人类疾病之间的关系。

试图解决混淆变量的问题,a最近的刊物自然由Ivan Vujkovic-Cvijin和同事采摘了可能与微生物组成相关的生活方式差异。他们发现,性别,年龄,体重指数和酒精消费水平是与微生物组成和疾病地位相关的最大混乱。为了消除这些混乱的效果,研究人员使用了一对一匹配的方法,其中生病的个体与具有同龄人,性别和生活方式习惯的健康个体相匹配。这是在观察研究中使用的常用技术,其中研究人员无法控制完美的实验条件下的所有变量(图4)。使用这种技术,研究人员发现,肠道细菌丰富和疾病状况之间的许多关联不再有统计学意义,表明某些患有疾病的肠道微生物组变化可能是潜在的混乱的结果。

保持健康,保持持怀疑态度

尽管存在含糊不清的因果关系,但越来越多的商业公司Viomeuubiome(它是由FBI突击去年为多家保险公司开单)或DayTwo已经开始为微生物组营销干预措施。客户将邮件在粪便样本中进行测序,然后根据样品中存在的细菌类型,公司将规定个性化营养信息或为客户提供不同疾病的风险评分。虽然这些公司有良好的帮助消费者了解自己的机构,但我们需要批判性地评估他们的索赔。

微生物组无疑对我们的健康很重要。然而,尽管围绕主要相关研究,但我们仍然无法完全确定微生物组究竟是多么令人兴奋地进入疾病进展。为了确定微生物组是否导致疾病,一些研究人员正在探索各种细菌菌株的分子机制。其他研究人员正在努力设计具有更大样本尺寸和更严格的方法的实验研究。通过更好的分析工具和数据集,我们将能够在我们的身体中揭开这些微小的生物体的复杂功能。与此同时,抓住一杯酸奶,只是因为它很好吃。


陈晓是哈佛大学系统、合成和定量生物学博士一年级学生。

丹尼尔说是第6年博士。哈佛大学的有机体和进化生物学学生。

封面图片:“银色子弹”通过eschipul许可下2.0 CC冲锋队

想要查询更多的信息:

一个想法“相关性并不意味着因果关系:为什么你的肠道微生物可能(还)不是解决你所有问题的灵丹妙药

  1. 回想起来,做科学研究和临床医学实践,实际上可能需要不可调和的思维定形。我的知识起点是艺术,后来转向哲学(我不是指学术意义上的哲学,因为它遵循严格的规程,而是在欧洲咖啡馆里进行思想交流。然而,学术研究涉及了一大锅没完没了的初级研究,我说不出其中有多少是像飞蛾扑火那样的吸引力,又有多少只是为了获得学位的形式主义;但这一切,对我来说,只是有系统地向迷恋和好奇心屈服。然而,随着年龄的增长,我越来越害怕“科学”。首先,在获得高等学位之前,我一直被教导说,“科学”不过是“一种用来证伪理论的探究方法”。因此,“科学真理”更多的是一个目标,导致了一种错误的“进步”的感觉——在这些日子里,它的寿命一般只有10年左右——而不是任何类似于“有了!”因此,在临床方面,大多数患者的“主诉”似乎是根据谁是最后一个去找医生的医药代表来治疗的,给他们讲“迷你讲座”,就像深夜电视广告一样。但是在科学领域,一个人花了大约25年的时间来获得一个博士学位,他的研究资金可能会突然被切断,而且由于研究的高度专业化,今天,一个人可能会发现,只有资金枯竭时,他才有资格成为一名超级司机。这是如此令人绝望,以至于一些捍卫科学真实性的人声称,今天大约1/3的已发表论文都是“垃圾”,只是为了在游戏中保持生存。 In adolescence I was formally introduced to statistics. The first thing I was taught was the old saying: FIGURES DON’T LIE BUT LIARS FIGURE! Now, many decades later than I care to imagine, I find myself delving into primates evolution. Here too, as a neuroscience researcher, I find myself annoying academics by asking them how they reconcile IMPRESSIONISTIC SCIENCES like paleoantropology with MECHANISTIC SCIENCES like genetic evolutionary molecular biology. Systematics a la Darwin always kind of seemed, “as you like it,” but the DNA/RNA studies do not seem consonant with the impressions of the bone chips unearthers. I am still desperately trying to hang on to the notion that “phylogeny recapitulates ontogeny.” All those wonderful courses, for example, suggesting the impression that the Diploe Venous System of the skull keeps the brain 0.5C degrees cooler than the body’s core, and the relation of the CNS embyologically to its phylogenetic lineage, seem as conjured up as the brilliant notion of Eccles that the brain is an ever burning furnace of ionic fluxes that is a metabolic fire that is sculpted into actions by GABAnergic inhibition into the behaviors and thoughts we observe. But, is any of all this “FACT”? Were the ancient Greeks right in that the Gods are punishing us for the hubris of assuming that “scientifically” we can “discover” what is truth? It seems to me that in every subfiel of bioscience, about every decade, the “advances” come undone and we all have to go back to the drawing board. To this day, only the DNA/RNA genetic molecular biology theories seems to either under dogmatic doctrinaire control of Mephistopheles-like geniuses in DNA/RNA sequencing with Messiah like insight, Maybe we are just being duped by a massive statistical subterfuge at the hands of 23 & Me or Ancestry Inc’s statistical analysis– not only backwards in the sense of genealogy, but also forward in the sense of evolutionary control. It’s all moving so fast, and sectarian journals are appearing to pop up like mushrooms, that the faiths of science seem to be cut throat denomination catechisms. So thank you for reminding us that CORRELATION IS NOT DIVINATION OF TRUTH. I personalty am afraid that we’re falling for all the AI gods making Science more “take it or leave it” than analytic. After all, it is now more than ever because of the stingy “publish or perish” mania and no one is allowed to print the words “maybe” and “perhaps” as was more common in the last century.

发表评论

您的电子邮件地址不会被公开。必填字段被标记*