本文是对多个内容的整理,不是原创,在此声明 1. 基本原理 支持向量机(SVM, support vector machine)SVM详解[https://zhuanlan....
本文是对多个内容的整理,不是原创,在此声明 1. 基本原理 支持向量机(SVM, support vector machine)SVM详解[https://zhuanlan....
CytoTRACE是一款基于单细胞计数矩阵推测细胞间活性和细胞间相对分化状态的一款软件,这里我们结合实际代码例子,解释CytoTRACE的数学原理: step 1:这一步先将...
WGS (whole genome sequencing) 全基因组测序分析,以Saccharomyces cerevisiae SY14菌株的illumin 测序数据为例。...
今天我们来复现一下一篇《cell》文章中的图标,图如下: (Liver Immune Profiling Reveals Pathogenesis and Therapeut...
说在前面 简单说对一切实验结果分析的核心就是数据,当我们面对原始的大量数据时,这些数据中很可能夹杂着没有任何意义或者意义模糊的数据,我们很难从中发现有用的信息。 为了快速且有...
在数据挖掘项目的数据中,数据类型可以分为两种:有序的连续数值 和 无序的类别型特征。 对于xgboost等boosting树模型,基学习通常是cart回归树,而cart树的输...
Xia W, Wang S, Yang M, et al. Multi-view graph embedding clustering network: Joint self...
之前的推文介绍了画柱形图展示富集分析的结果,今天的推文介绍一下画气泡图展示富集分析结果的代码。气泡图就是散点图的一个变种。多了一个变量映射给点的大小,富集分析里通常是用来映射...
Causal Inference in Natural Language Processing Estimation, Prediction, Interpretation ...
博文名称:Why you should be using PHATE for dimensionality reduction博文链接:https://towardsdata...
一、样本不均衡的介绍 1.1 样本不均衡现象 样本(类别)样本不平衡(class-imbalance)指的是分类任务中不同类别的训练样例数目差别很大的情况,一般地,样本类别比...
说在前面 Immugent在之前一篇推文照葫芦画图之PCA[https://mp.weixin.qq.com/s?__biz=MzI4MjY5ODI1Nw==&mid=224...
使用参考:https://rpkgs.datanovia.com/ggcorrplot/[https://rpkgs.datanovia.com/ggcorrplot/]我只...
笔记主要内容:1~3代测序技术,fastq文件 & FASTQC (1)测序技术 1、一代测序技术:Sanger Sequencing 测序条件:需要有足够的量的单链DNA,...
循环神经网络(RNN)是基于序列数据(如语言、语音、时间序列)的递归性质而设计的,是一种反馈类型的神经网络,其结构包含环和自重复,因此被称为“循环”。它专门用于处理序列数据,...
本周最新文献速递20220116 一、精细解读文献 一 文献题目: Mendelian randomization analyses support causal relat...
参考文献:Confronting false discoveries in single-cell differential expression[https://doi.o...
R-ggplot2-箱图系列(1) basic - 简书 (jianshu.com)[https://www.jianshu.com/p/bafbd08b28ef]R-ggp...
我们做数据分析,在第一次拿到数据集的时候,一般会用统计学或可视化方法来了解原始数据。 了解列数、行数、取值分布、缺失值、列之间的相关关系等等,这个过程叫做EDA(Explor...
前言 上一篇数据分析:数据预处理--标准化方法优劣了解(二)[https://www.jianshu.com/p/d4909f31b33e]讲了两类常用标准化方法,但没涉及到...