Linear mixed effects models

提到线性模型可能会联想到三大类:

  1. 一般线性模型
  2. 广义线性模型
  3. 混合线性模型
  • 一般线性模型比较简单,模拟线性关系,求得我们关心的因素的系数。看到一个关于退烧药的例子很形象:吃一片药退0.1度,两片药退0.2度。模型简单,但是应用该模型的前提假设相对比较严苛:要求观测值之间相互独立,残差正态以及方差齐。
  • 广义线性模型,顾名思义,应用范围更宽泛,数据的前提假设要求有所放宽:自变量可离散可连续,残差可呈一定分布态。还是那个例子:吃一片药退0.1度,吃两片药退0.4度,及其他相对复杂关系如指数关系,对数关系等,可通过数学变换转换成为线性关系。
  • 混合线性模型则在线性模型中加入了随机效应项,没有了数据观测值独立和方差齐的限制。因而,混合线性模型的特点使其更适用于复杂的生物实验数据,尤其是自然取材、长期观察、就地检测的生态实验。

今天我们主要关注混合线性模型。并通过简单的小例子对这种模型的应用进行粗浅的了解。
案例之前需要知道的:

  1. 为什么需要mixed-effect model?
    因为有些现实的复杂数据是普通线性回归处理不了的。比如数据中存在组内(noise)和组间(random effect)的随机效应。换句话说,就是当数据中存在复杂的层次结构,除了感兴趣的变量还存在需要控制的变量时,使用该模型可以得到更切合稳健的结果。

  2. 自变量的固定效应和随机效应:
    看到的一个很容易理解的说法——两者的不同实际在于看待参数的方式的不同。
    固定效应:参数含义是自变量每变化一个单位,应变量平均变化多少。因此固定效应fixed effect影响响应变量response variable(Y)的均值
    随机效应:参数是服从正态分布的一个随机变量,对于两个不同的自变量的值,对应变量的影响不一定是相同的。 也就是说Random effect影响的是响应变量的方差。

  3. 随机效应影响模型的两种方式:
    截距影响(random intercept model)
    对某个固定效应的斜率影响(random intercept and slope model)


    Harrison et al.

    现实数据中更多的是既具有截距影响也具有斜率影响的效应。

  4. 处理混合线性模型的两个常用R包:lme4和nlme,区别不大。

在R中使用混合线性模型时,主要用法如下:

fit=lmer(data=, formula=DV~fixed_factor+(random_intercept+random_slope|random_factor))
data - 要处理的数据集
formula - 表达式
DV - 因变量
fixed_factor - 固定因子,即考察的自变量
random_intercept - 随机截距,即认为不同群体的因变量的分布不同
random_slope - 随机斜率,即认为不同群体受固定因子的影响是不同的
random_factor - 随机因子
/ nested inside

接下来看例子:
案例来自这篇文章:


文章:Conclusions beyond support: overconfident estimates in mixed models

该文章讲了混合模型使用不当时会产生pseudo-replication的问题。pseudo-replication会出现在复杂结构的生物实验数据中,主要原因是无意识地将非独立的data point当作独立的数据点并用作生物学重复。对群体中的个体测量两个及以上观测量的时候很容易出现这种情况。有时我们对自己的实验结构非常清楚,但是用在模型上面表达出来时会出现错意。总之我们使用模型时需要确认代码中的表达式是否符合实验设计。

一群雌鸟跟good quality和poor quality两种雄鸟交配,测量其产下蛋的大小。

  1. 首先关心雄鸟quality对于雌鸟产蛋大小的影响。
    数据或许是这样的:


    malequal_eggsize

这是最简单的一种情况:
lmer(EggSize ~ MaleQual + (1|FemID))
其中EggSize是关心的响应变量,MaleQual是固定效应,FemID是基于总体均值的随机效应。所以“|”前是1。这里允许了每只雌鸟个体差异对产蛋大小造成的影响。

  1. 然后研究鸟类生态的同学可能会关心到产蛋的顺序,涉及到雌鸟对子代的资源分配等问题。所以我们的问题变成了:雄鸟quality是否影响雌鸟的eggsize以及eggsize如何随着产蛋顺序而改变?


    layseq

    于是在其中加上LaySeq因素:
    lmer(EggSize~MaleQual+LaySeq+MaleQual:LaySeq+(1+LaySeq|FemID))
    但此时LaySeq是因子型变量,所以分类数据是可以作为random slope的。这里检测的就是eggsize是否因malequal而不同,是否随layseq而不同,是否受到二者相互作用的影响。同时控制了受产蛋顺序影响的雌性个体差异带来的波动。

  2. 在上述基础上再复杂一点,考虑地域性。比如


    territory

    模型中加入地域性因素:
    lmer(EggSize~MaleQual+LaySeq+MaleQual:LaySeq+(1+LaySeq|FemID)+(1+LaySeq|Territory))
    这里除了控制上述因素,还控制了雌鸟因地域不同带来的影响。

  3. 再添加最后一个因素,雌鸟体型的影响。


    femmass

    我们要看雄鸟质量、雌鸟的体型如何影响eggsize以及eggsize随产蛋顺序如何变化。既然是兴趣变量,FemMass则要作为固定效应。
    lmer(EggSize~MaleQual+LaySeq+MaleQual:LaySeq+FemMass+FemMass:LaySeq+(1+LaySeq+FemMass|FemID)+(1+LaySeq+FemMass|Territory))
    除了加入了FemMass相关的固定效应外,还控制了个体差异和地域差异带来的影响。

以上例子中的表达式并不是该情景和目的下的唯一写法。有时表达式也可以简化。

以上就是我最近学习到的一些关于混合线性模型的一些东西。刚刚接触,很多东西也是似懂非懂。以下是我学习时搜索到用到的一些资料,很多东西都直接从这些地方搬过来的:
https://blog.csdn.net/sinat_26917383/article/details/51636011
https://zhuanlan.zhihu.com/p/63092231
https://cloud.tencent.com/developer/article/1434962
https://luansheng.github.io/2017/11/19/线性混合效应模型教程1/
https://zhuanlan.zhihu.com/p/49480686
https://stats.stackexchange.com/questions/38370/interpreting-three-forms-of-a-mixed-model
https://cran.r-project.org/web/packages/lme4/vignettes/lmer.pdf
文章:A brief introduction to mixed effects modelling and multi-model inference in ecology
文章:Conclusions beyond support: overconfident estimates in mixed models
我的感觉也是这样的:这些个模型说简单也简单,说复杂也复杂。简单的是只要把自己的实验逻辑理清楚,参照工具的做法照做就可以了。复杂在于要精确地用模型将自己的实验表述清楚,要对数据存在的问题进行适当的矫正。否则就容易出现评估偏差,影响结论。

写的很粗浅,为自己做一个记录,同时也欢迎大家批评指正~

©著作权归作者所有,转载或内容合作请联系作者
  • 序言:七十年代末,一起剥皮案震惊了整个滨河市,随后出现的几起案子,更是在滨河造成了极大的恐慌,老刑警刘岩,带你破解...
    沈念sama阅读 203,179评论 5 476
  • 序言:滨河连续发生了三起死亡事件,死亡现场离奇诡异,居然都是意外死亡,警方通过查阅死者的电脑和手机,发现死者居然都...
    沈念sama阅读 85,229评论 2 380
  • 文/潘晓璐 我一进店门,熙熙楼的掌柜王于贵愁眉苦脸地迎上来,“玉大人,你说我怎么就摊上这事。” “怎么了?”我有些...
    开封第一讲书人阅读 150,032评论 0 336
  • 文/不坏的土叔 我叫张陵,是天一观的道长。 经常有香客问我,道长,这世上最难降的妖魔是什么? 我笑而不...
    开封第一讲书人阅读 54,533评论 1 273
  • 正文 为了忘掉前任,我火速办了婚礼,结果婚礼上,老公的妹妹穿的比我还像新娘。我一直安慰自己,他们只是感情好,可当我...
    茶点故事阅读 63,531评论 5 365
  • 文/花漫 我一把揭开白布。 她就那样静静地躺着,像睡着了一般。 火红的嫁衣衬着肌肤如雪。 梳的纹丝不乱的头发上,一...
    开封第一讲书人阅读 48,539评论 1 281
  • 那天,我揣着相机与录音,去河边找鬼。 笑死,一个胖子当着我的面吹牛,可吹牛的内容都是我干的。 我是一名探鬼主播,决...
    沈念sama阅读 37,916评论 3 395
  • 文/苍兰香墨 我猛地睁开眼,长吁一口气:“原来是场噩梦啊……” “哼!你这毒妇竟也来了?” 一声冷哼从身侧响起,我...
    开封第一讲书人阅读 36,574评论 0 256
  • 序言:老挝万荣一对情侣失踪,失踪者是张志新(化名)和其女友刘颖,没想到半个月后,有当地人在树林里发现了一具尸体,经...
    沈念sama阅读 40,813评论 1 296
  • 正文 独居荒郊野岭守林人离奇死亡,尸身上长有42处带血的脓包…… 初始之章·张勋 以下内容为张勋视角 年9月15日...
    茶点故事阅读 35,568评论 2 320
  • 正文 我和宋清朗相恋三年,在试婚纱的时候发现自己被绿了。 大学时的朋友给我发了我未婚夫和他白月光在一起吃饭的照片。...
    茶点故事阅读 37,654评论 1 329
  • 序言:一个原本活蹦乱跳的男人离奇死亡,死状恐怖,灵堂内的尸体忽然破棺而出,到底是诈尸还是另有隐情,我是刑警宁泽,带...
    沈念sama阅读 33,354评论 4 318
  • 正文 年R本政府宣布,位于F岛的核电站,受9级特大地震影响,放射性物质发生泄漏。R本人自食恶果不足惜,却给世界环境...
    茶点故事阅读 38,937评论 3 307
  • 文/蒙蒙 一、第九天 我趴在偏房一处隐蔽的房顶上张望。 院中可真热闹,春花似锦、人声如沸。这庄子的主人今日做“春日...
    开封第一讲书人阅读 29,918评论 0 19
  • 文/苍兰香墨 我抬头看了看天上的太阳。三九已至,却和暖如春,着一层夹袄步出监牢的瞬间,已是汗流浃背。 一阵脚步声响...
    开封第一讲书人阅读 31,152评论 1 259
  • 我被黑心中介骗来泰国打工, 没想到刚下飞机就差点儿被人妖公主榨干…… 1. 我叫王不留,地道东北人。 一个月前我还...
    沈念sama阅读 42,852评论 2 349
  • 正文 我出身青楼,却偏偏与公主长得像,于是被迫代替她去往敌国和亲。 传闻我的和亲对象是个残疾皇子,可洞房花烛夜当晚...
    茶点故事阅读 42,378评论 2 342

推荐阅读更多精彩内容