孟德尔随机化推断暴露因素与健康结局的因果关系

1. 孟德尔随机化方法

传统观察性流行病学研究在发现疾病病因以及因果推断中存在诸多挑战,比如反向因果关联、潜在混杂因素、微效暴露因素以及多重检验等,当研究者诉诸于随机对照试验研究(random control trial, RCT)设计,以寻找暴露因素X与疾病结局Y直接关联证据时,又因人类医学伦理和诸多试验设计的局限而难以实践。
孟德尔随机化(Mendelian Randomization,MR)研究设计,遵循“亲代等位基因随机分配给子代”的孟德尔遗传规律。如果基因型决定表型,基因型通过表型而与疾病发生关联,因此可以使用基因型作为工具变量来推断表型与疾病之间的关联。近年来,MR的研究设计随着统计学方法、大样本GWAS数据、表观遗传学以及各种“组学”技术的不断发展,在探讨复杂暴露因素与疾病结局因果关联中应用日益广泛。

1.1 应用模型

基因型决定中间表型(2);选择合适的“遗传变异 (基因型)”作为工具变量,替代无法进行实验性研究的中间表型(暴露/研究因素)
测量遗传变异与中间表型(2)、遗传变异与疾病结局(1)之间的关联,进而推断暴露与疾病结局之间的关联(3)。

1.2 孟德尔随机化与随机对照研究设计

孟德尔随机化可以进行因果推断是因为它与临床的随机对照试验有相似性。

1.3 MR方法的核心假设

工具变量作为有效工具变量必须满足以下核心假设:
1) 工具变量Z与混杂因素U无关联(独立性假设)
2) 工具变量Z与暴露因素X有关联(关联性假设)
3) 工具变量Z与结局变量Y无关联,Z只能通过变量X与Y发生关联(排他性假设)

上述方程的使用必须满足条件:
①变量X与Y之间的关联一定会受到潜在混杂因素U的影响,但工具变量Z与变量X以及Z与变量Y之间无潜在混杂因素影响;
②变量X与结局Y之间的关联无法直接观察获得,因为无法直接测量变量X,但是Z是可测量的,并且Z与X直接的关联是已知的或者可测量的,并独立于其他因素而存在。

这些对于工具变量的限制条件也使得正确选择合适的工具变量成为关联研究的难点。

2. 常见的MR研究设计方法及特点

a. 一阶段MR(One stage MR)
b. 独立样本独立样本MR(One-sample MR)

该方法利用单一研究样本,通过使用2阶段最小二乘法回归模型,定量估计暴露因素X与Y之间的关联效应大小。第一步:建立G—X回归模型,获得暴露因素预测值(predicted value,P);第二步:构建P—Y的回归模型,即获得暴露因素预测值P和结局变量Y之间的回归方程。

暴露和结局来自同一样本
直接计算-两阶段最小二乘法 (2 stage least squares regression,2SLS)
根据结局变量类型,采用不同统计方法:连续型结局-线性回归/二分类结局-logistic回归;
优点:采用个体级别数据,可控制混杂因素
缺点:样本量有限,影响统计效能。

2SLS的分析方法在Stata软件中可以使用“ivregress”(StataCorp)、在R软件中使用“ivpack”(R Foundation)来实现。

c. 两样本MR

两样本MR的设计策略是建立在G—X和G—Y的关联研究人群来自相同人群的两个独立样本(如GWAS与暴露,GWAS与结局的关联数据),要求两样本具有相似的年龄、性别和种族分布特征,因为样本量较大,该方法可以获得更大的把握度,统计效能更高。目前,两样本MR因为全球大量GWAS合作组的公共数据而被广泛使用。

d. 双向MR

此方法在解决因果网络方向的问题上将会有很大用途,但是在分析未知生物学效应的两个变量时,要防止被双向MR的结果误导。

e. 两阶段MR

与两样本MR不同的是,两阶段MR需要使用遗传工具变量来评价因果关联的可能中间变量M(Mediation),来探讨环境暴露因素(E)是否通过表观遗传指标(M)而导致疾病(O)改变,见图

第一阶段,遗传工具变量G1独立于混杂因素,指代暴露因素E与结局O之问的关联,并且必须经过中间变量M才能实现;
第二阶段,另一独立遗传工具变量G2作为中间变量M的指代工具,分析中间变量M与结局0之间的关联

比如BMI通过血压来间接影响冠心病的发生。目前此方法已被应用于表观遗传流行病学(Epigenetic Epidemiology)研究,Binder和Michels使用母亲MTHFR C677T,A1298C两位点作为工具变量,发现7个CpG位置参与了红细胞叶酸与甲基化改变之间的关联。Dekkers等陋63使用全基因组甲基化数据发现,免疫细胞差异甲基化结果是由个体内部血脂水平(TG,LDL-C,HDL-C)变化所导致,反之则不亦然。此方法必须满足E—M和E—O之间的关联呈线性以及同质性的假设前提,并且已被延伸成为分析复杂因果网络关系的基础,如网络MR设计(Network MR)。

f. 多变量孟德尔随机化
g. factorial MR

3. 工具变量假设的常见偏移及处理策略

4. 工具变量的多效性

5. 两样本MR常用的因果效应估计方法

6. 工具变量的异质性和多效性检验方法

7. MR数据库及生信工具包

8. MR研究的优势和局限性

9. 总结

10. MR写作指南

MR报告解读和评估指南

参考:
应用孟德尔随机化方法推断暴露因素与健康结局的因果关系
《孟德尔随机化法在因果推断中的应用》

©著作权归作者所有,转载或内容合作请联系作者
禁止转载,如需转载请通过简信或评论联系作者。
  • 序言:七十年代末,一起剥皮案震惊了整个滨河市,随后出现的几起案子,更是在滨河造成了极大的恐慌,老刑警刘岩,带你破解...
    沈念sama阅读 203,324评论 5 476
  • 序言:滨河连续发生了三起死亡事件,死亡现场离奇诡异,居然都是意外死亡,警方通过查阅死者的电脑和手机,发现死者居然都...
    沈念sama阅读 85,303评论 2 381
  • 文/潘晓璐 我一进店门,熙熙楼的掌柜王于贵愁眉苦脸地迎上来,“玉大人,你说我怎么就摊上这事。” “怎么了?”我有些...
    开封第一讲书人阅读 150,192评论 0 337
  • 文/不坏的土叔 我叫张陵,是天一观的道长。 经常有香客问我,道长,这世上最难降的妖魔是什么? 我笑而不...
    开封第一讲书人阅读 54,555评论 1 273
  • 正文 为了忘掉前任,我火速办了婚礼,结果婚礼上,老公的妹妹穿的比我还像新娘。我一直安慰自己,他们只是感情好,可当我...
    茶点故事阅读 63,569评论 5 365
  • 文/花漫 我一把揭开白布。 她就那样静静地躺着,像睡着了一般。 火红的嫁衣衬着肌肤如雪。 梳的纹丝不乱的头发上,一...
    开封第一讲书人阅读 48,566评论 1 281
  • 那天,我揣着相机与录音,去河边找鬼。 笑死,一个胖子当着我的面吹牛,可吹牛的内容都是我干的。 我是一名探鬼主播,决...
    沈念sama阅读 37,927评论 3 395
  • 文/苍兰香墨 我猛地睁开眼,长吁一口气:“原来是场噩梦啊……” “哼!你这毒妇竟也来了?” 一声冷哼从身侧响起,我...
    开封第一讲书人阅读 36,583评论 0 257
  • 序言:老挝万荣一对情侣失踪,失踪者是张志新(化名)和其女友刘颖,没想到半个月后,有当地人在树林里发现了一具尸体,经...
    沈念sama阅读 40,827评论 1 297
  • 正文 独居荒郊野岭守林人离奇死亡,尸身上长有42处带血的脓包…… 初始之章·张勋 以下内容为张勋视角 年9月15日...
    茶点故事阅读 35,590评论 2 320
  • 正文 我和宋清朗相恋三年,在试婚纱的时候发现自己被绿了。 大学时的朋友给我发了我未婚夫和他白月光在一起吃饭的照片。...
    茶点故事阅读 37,669评论 1 329
  • 序言:一个原本活蹦乱跳的男人离奇死亡,死状恐怖,灵堂内的尸体忽然破棺而出,到底是诈尸还是另有隐情,我是刑警宁泽,带...
    沈念sama阅读 33,365评论 4 318
  • 正文 年R本政府宣布,位于F岛的核电站,受9级特大地震影响,放射性物质发生泄漏。R本人自食恶果不足惜,却给世界环境...
    茶点故事阅读 38,941评论 3 307
  • 文/蒙蒙 一、第九天 我趴在偏房一处隐蔽的房顶上张望。 院中可真热闹,春花似锦、人声如沸。这庄子的主人今日做“春日...
    开封第一讲书人阅读 29,928评论 0 19
  • 文/苍兰香墨 我抬头看了看天上的太阳。三九已至,却和暖如春,着一层夹袄步出监牢的瞬间,已是汗流浃背。 一阵脚步声响...
    开封第一讲书人阅读 31,159评论 1 259
  • 我被黑心中介骗来泰国打工, 没想到刚下飞机就差点儿被人妖公主榨干…… 1. 我叫王不留,地道东北人。 一个月前我还...
    沈念sama阅读 42,880评论 2 349
  • 正文 我出身青楼,却偏偏与公主长得像,于是被迫代替她去往敌国和亲。 传闻我的和亲对象是个残疾皇子,可洞房花烛夜当晚...
    茶点故事阅读 42,399评论 2 342

推荐阅读更多精彩内容