有时候会有这样的分析需求,拿到两个基因,或者两个基因list,虽然它们是不同的基因的,但是可以提一个问题,它们之间的功能注释上有没有相似性呢?
特别是,我以前比较两个基因List,只是看它们之间有多少overlap,如果overlap小,则说明这两个gene list很不一样。但是实际上并不是这样的。有可能这两个gene list中的基因是有着相似的功能,只不过是gene ID不相同罢了。这时候,GOsemsim包就派上用场了。
GOsemsim: semantic similarity measurement based on Gene ontology,也就是用基因注释的方法来分析不同的基因或者基因list的相似性。
主要函数如下:
goSim
andmgoSim
Calculate semantic similarity between two GO terms and two sets of GO termsgeneSim
andmgeneSim
Calculate semantic similarity between two gene products and among multiple gene productsclusterSim
andmclusterSim
Semantic similarity between two gene lists and multiple gene lists
下次再比较不同gene或者gene list的时候,就可以用这个包试试,算出的值越倾向于1,则表明这两个gene list或者gene越相似。