Haploview软件使用-连锁不平衡分析

当位于某一座位的特定等位基因与另一座位的某一等位基因同时出现的概率大于群体中因随机分布的两个等位基因同时出现的概率时,就称这两个座位处于连锁不平衡的状态。目前,连锁不平衡分析是群体进化的经典分析条目,分析的软件主要有plink和haploview。Haploview是一款分析单倍型的软件,依托于java形成的可视化界面,以下是整理的相关介绍及使用方法。

1. 软件安装

可以在官网直接下载封装好的java程序包,下载完成后即可使用

https://www.broadinstitute.org/haploview/downloads#JAR
wget https://www.broadinstitute.org/ftp/pub/mpg/haploview/Haploview.jar

2. 软件使用-GUI

2.1 程序运行

运行时执行java程序包,会出现可交互界面,可以上传数据、分析以及结果查看等

执行命令:java -jar /opt/software/Haploview.4.2.jar

可视化界面如下

haploview-data-load

2.2 数据输入

该软件可以允许输入多种类型的文件,其中包括连锁分型文件(linkage)、hapmap文件(hapmap)以及plink分型文件(map/ped)

haploview-input-plink

plink输出文件中的ped可以直接作为linkage分型文件导入,示例数据如下

0   s-test-106  0   0   0   0   T T G G C C G G C C T T
0   s-test-105  0   0   0   0   C C G G T T G G C C G G
0   s-test-107  0   0   0   0   C C G G T T G G C C G G
0   s-test-100  0   0   0   0   T T A G C C G G T T T T
0   s-test-101  0   0   0   0   T T A G C C G G T T T T
0   s-test-109  0   0   0   0   C C G G T T G G C C G G

对于位点信息文件,不能直接使用map文件,需要提取其中的第2、4行信息单独导入,示例如下

chr5_12526      12526
chr5_23655      23655
chr5_25580      25580
chr5_30712      30712
chr5_37018      37018
chr5_39601      39601

使用plink软件可以直接输出上述格式的文件,无需手动处理,命令为plink --recode HV。输出文件类型为HV(Haploview-forma),若不指定染色体编号以及提取区间,会对所有数据进行提取,并且会按染色体分开输出,文件命名规则为out.chr-x*.ped + .info,输出结果与上述示例输入相同相同。

对于其他类型的输入文件,有兴趣可以查看官网说明,以下是以plink软件导出的数据为例进行演示。Haploview输入文件

2.3 参数设置

在使用plink格式的输入文件时,可以设置两个参数,分析的区域大小及样本缺失过滤,都有默认值。

若输入文件为linkage格式,还可以进行关联分析,可以指定是否是家系数据或者case/control有对照的数据,界面如下

haploview-linkage-input

2.4 分析结果

  • 数据统计

导入数据后自动计算位点的maf、缺失等信息,会汇总成统计表,可以导出,示例如下

haploview-result-table

统计结果中,标红的部分是未通过过滤的位点,系统会自动全选所有通过过滤的位点参与单倍型的计算。图片下方显示的是参数设置窗口,可自行输入阈值,点击Rescore Markers即可重新统计。

  • LD-Block图

软件会自动根据输入的数据绘制对应LD-Block区域的单倍型块结果,所有统计以及图片结果都可以导出保存,示例如下

haploview-result-LD-Block

LD导出数据:

L1  L2  D'  LOD r^2 CIlow   CIhi    Dist    T-int
chr5_23655  chr5_68528  1.0 3.79    0.023   0.63    1.0 44873   168.12
chr5_23655  chr5_75682  1.0 49.24   1.0 0.96    1.0 52027   -
chr5_23655  chr5_125073 1.0 17.37   0.354   0.89    1.0 101418  -
chr5_23655  chr5_176933 1.0 49.24   1.0 0.96    1.0 153278  -
chr5_23655  chr5_206310 1.0 48.48   1.0 0.96    1.0 182655  -
chr5_23655  chr5_271689 1.0 3.92    0.023   0.64    1.0 248034  -

单倍型块数据Haplotypes:

BLOCK 1.  MARKERS: 10 11 19 27 33 44
112412 (0.560)  |0.548  0.000   0.000   0.000   0.000|
312412 (0.167)  |0.088  0.045   0.037   0.002   0.000|
111413 (0.162)  |0.018  0.066   0.060   0.007   0.007|
121242 (0.098)  |0.002  0.053   0.018   0.015   0.011|
Multiallelic Dprime: 0.786
BLOCK 2.  MARKERS: 56 74 84 86
1424 (0.652)    |0.651  0.000|
1224 (0.170)    |0.164  0.007|
3412 (0.124)    |0.011  0.114|
3424 (0.034)    |0.034  0.000|
3224 (0.013)    |0.000  0.013|
Multiallelic Dprime: 0.935
  • 标签SNP获取

一个block内的位点是高度连锁的,在分析的时候我们可以选择其中一个典型的snp做代表,这样可以实现位点的去冗余,可以极大地减少后续分析的压力。haploview可以做tag标签的筛选,界面如下

haploview-tagger

界面下方可以选择tag标签位点的计算方法,也可以设置r2和LOD的阈值,同时还可以对位点进行过滤,比如去除A/T、G/C分型的位点。设置完成后运行,结果如下

haploview-tagger-result

test数据框显示的是筛选到的tag标签位点,下面的数据框表示与这个位点紧密连锁的其他位点列表,右边的数据框表示的是tests位点与紧密连锁位点之间的r2信息

这款软件除了GUI可视化操作,还可以使用命令行进行分析,具体可查看官网说明。

参考信息:

[1] haploview: https://www.broadinstitute.org/haploview/haploview
[2] plink: https://www.cog-genomics.org/plink2

最后编辑于
©著作权归作者所有,转载或内容合作请联系作者
  • 序言:七十年代末,一起剥皮案震惊了整个滨河市,随后出现的几起案子,更是在滨河造成了极大的恐慌,老刑警刘岩,带你破解...
    沈念sama阅读 199,711评论 5 468
  • 序言:滨河连续发生了三起死亡事件,死亡现场离奇诡异,居然都是意外死亡,警方通过查阅死者的电脑和手机,发现死者居然都...
    沈念sama阅读 83,932评论 2 376
  • 文/潘晓璐 我一进店门,熙熙楼的掌柜王于贵愁眉苦脸地迎上来,“玉大人,你说我怎么就摊上这事。” “怎么了?”我有些...
    开封第一讲书人阅读 146,770评论 0 330
  • 文/不坏的土叔 我叫张陵,是天一观的道长。 经常有香客问我,道长,这世上最难降的妖魔是什么? 我笑而不...
    开封第一讲书人阅读 53,799评论 1 271
  • 正文 为了忘掉前任,我火速办了婚礼,结果婚礼上,老公的妹妹穿的比我还像新娘。我一直安慰自己,他们只是感情好,可当我...
    茶点故事阅读 62,697评论 5 359
  • 文/花漫 我一把揭开白布。 她就那样静静地躺着,像睡着了一般。 火红的嫁衣衬着肌肤如雪。 梳的纹丝不乱的头发上,一...
    开封第一讲书人阅读 48,069评论 1 276
  • 那天,我揣着相机与录音,去河边找鬼。 笑死,一个胖子当着我的面吹牛,可吹牛的内容都是我干的。 我是一名探鬼主播,决...
    沈念sama阅读 37,535评论 3 390
  • 文/苍兰香墨 我猛地睁开眼,长吁一口气:“原来是场噩梦啊……” “哼!你这毒妇竟也来了?” 一声冷哼从身侧响起,我...
    开封第一讲书人阅读 36,200评论 0 254
  • 序言:老挝万荣一对情侣失踪,失踪者是张志新(化名)和其女友刘颖,没想到半个月后,有当地人在树林里发现了一具尸体,经...
    沈念sama阅读 40,353评论 1 294
  • 正文 独居荒郊野岭守林人离奇死亡,尸身上长有42处带血的脓包…… 初始之章·张勋 以下内容为张勋视角 年9月15日...
    茶点故事阅读 35,290评论 2 317
  • 正文 我和宋清朗相恋三年,在试婚纱的时候发现自己被绿了。 大学时的朋友给我发了我未婚夫和他白月光在一起吃饭的照片。...
    茶点故事阅读 37,331评论 1 329
  • 序言:一个原本活蹦乱跳的男人离奇死亡,死状恐怖,灵堂内的尸体忽然破棺而出,到底是诈尸还是另有隐情,我是刑警宁泽,带...
    沈念sama阅读 33,020评论 3 315
  • 正文 年R本政府宣布,位于F岛的核电站,受9级特大地震影响,放射性物质发生泄漏。R本人自食恶果不足惜,却给世界环境...
    茶点故事阅读 38,610评论 3 303
  • 文/蒙蒙 一、第九天 我趴在偏房一处隐蔽的房顶上张望。 院中可真热闹,春花似锦、人声如沸。这庄子的主人今日做“春日...
    开封第一讲书人阅读 29,694评论 0 19
  • 文/苍兰香墨 我抬头看了看天上的太阳。三九已至,却和暖如春,着一层夹袄步出监牢的瞬间,已是汗流浃背。 一阵脚步声响...
    开封第一讲书人阅读 30,927评论 1 255
  • 我被黑心中介骗来泰国打工, 没想到刚下飞机就差点儿被人妖公主榨干…… 1. 我叫王不留,地道东北人。 一个月前我还...
    沈念sama阅读 42,330评论 2 346
  • 正文 我出身青楼,却偏偏与公主长得像,于是被迫代替她去往敌国和亲。 传闻我的和亲对象是个残疾皇子,可洞房花烛夜当晚...
    茶点故事阅读 41,904评论 2 341