Skip to content

Latest commit

 

History

History
53 lines (41 loc) · 2.38 KB

lesson0.一些补充知识.md

File metadata and controls

53 lines (41 loc) · 2.38 KB

SCTransform

SCTransform一个函数包括NormalizeData,ScaleData,FindVariable三个函数的功能,因此使用SCTransform的pipeline如下

#读取数据,计算线粒体基因占比
scRNA_counts = Read10X("C:/Users/86269/Desktop/shun.C/single_cell/BC21")
scRNA = CreateSeuratObject(scRNA_counts,project = "sample_21",
                           min.cells = 3, min.features = 300)
                           min.cells = 3, min.features = 300)
scRNA = PercentageFeatureSet(scRNA,pattern="^MT-",col.name="percent.mt
#使用SCTransform进行归一化
scRNA =SCTransform(scRNA,vars.to.regress = "percent.mt",verbose = FALSE)

#基于SCTransform继续进行降维聚类
#PCA降维
scRNA <- RunPCA(scRNA,verbose = FALSE)

#umap聚类
scRNA <- RunUMAP(scRNA,dims=1:30,verbose=FALSE)

#tsne聚类
scRNA <- FindNeighbors(scRNA,dims=1:30,verbose=FALSE)
scRNA <- FindClusters(scRNA,verbose=FALSE)
#可视化
DimPlot(scRNA,label=TRUE)

Seurat对象的结构

Seurat对象.png

Seurat对象最重要的成分是assays与meta.data

  • assays主要保存了所有细胞的UMI矩阵
  • meta.data

meta.data.png

  • orig.ident:储存细胞的样本来源,也可以自行修改
  • ncount_RNA:每个细胞的UMI数量
  • nFeature_RNA:每个细胞检测到的基因数

UMI与barcodes

barcode与UMI.png

图中绿色片段是barcode,右边紧接着就是UMI。每一种barcode代表一个细胞,每一种UMI代表一个count

marker基因的寻找

1.FindMarkers:用于寻找两个不同组别的细胞的marker基因 2.FindAllMarkers:用于寻找一个细胞集中每个cluster的marker基因 3.FindConservedMarkers:用于寻找在两个不同组别中的保守的marker基因(即这两个组别中表达相似,但与别的组别有明显差异的marker基因)

数据标准化

数据标准化是指将数据按照比例放缩,使其落入特定区间 数据归一化时最简单的数据标准化方法,其目的是将数据变为(0,1)之间的小数并将有量纲的数据转化为无量纲的纯数量