你的位置:小初足交 > 美国十次啦怎么看不了 > 麻豆 孤注一掷 怎样整合多个单细胞数据集
发布日期:2024-08-24 05:28 点击次数:123
学员暗示他在责罚这个数据集(GSE152938)的时刻,因为数据集里面是5个样品,然而唯唯一个是平素组织的样品,分组是不屈衡的麻豆 孤注一掷,是以需要集会其它数据集的平素组织,然而不知谈如安在r编程说话里面操作。
图片
数据集(GSE152938)如下所示的数据集(GSE152938)文献形式 :
图片
文献形式关于这个数据集(GSE152938)麻豆 孤注一掷,不错使用底下的代码进行批量读取哈:
dir='GSE152938_RAW'samples=list.files( dir )samples sceList = lapply(samples,function(pro){ # pro=samples[1] print(pro) tmp = Read10X(file.path(dir,pro )) if(length(tmp)==2){ ct = tmp[[1]] }else{ct = tmp} sce =CreateSeuratObject(counts = ct , project = pro , min.cells = 5, min.features = 300 ) return(sce)}) do.call(rbind,lapply(sceList, dim))sce.all=merge(x=sceList[[1]], y=sceList[ -1 ], add.cell.ids = samples ) names(sce.all@assays$RNA@layers)sce.all[["RNA"]]$counts # Alternate accessor function with the same resultLayerData(sce.all, assay = "RNA", layer = "counts")sce.all <- JoinLayers(sce.all)dim(sce.all[["RNA"]]$counts )
学员给了一个平素东谈主的肾脏组织数据集(GSE131685),同期咱们读取它,如下所示的文献形式:
图片
数据集(GSE131685)亦然相似的读取形式:
天天影视dir='GSE131685_RAW/outputs/'samples=list.files( dir )samples
上头的这两个数据集走咱们给各人的圭臬代码后各自孤独的降维聚类分群,就会有 2-harmony/sce.all_int.rds 文献夹和文献。
然后就不错使用底下的代码,归拢两个数据集:
GSE131685 = readRDS('../2020-GSE131685-3个平素东谈主的肾单细胞/2-harmony/sce.all_int.rds') GSE131685$study = 'GSE131685'table(GSE131685$orig.ident)GSE152938 = readRDS('../2021-GSE152938-肾癌/2-harmony/sce.all_int.rds')GSE152938$study = 'GSE152938'table(GSE152938$orig.ident)sceList = list( GSE131685 = CreateSeuratObject( counts = GSE131685@assays$RNA$counts ), GSE152938 = CreateSeuratObject( counts = GSE152938@assays$RNA$counts ))sce.all=merge(x=sceList[[1]], y=sceList[ -1 ], add.cell.ids = c('GSE131685','GSE152938') ) names(sce.all@assays$RNA@layers)sce.all[["RNA"]]$counts # Alternate accessor function with the same resultLayerData(sce.all, assay = "RNA", layer = "counts")sce.all <- JoinLayers(sce.all)dim(sce.all[["RNA"]]$counts )
不错看到这两个数据集齐有不同数目的样品,归拢后即是一个大的对象了:
> table(GSE131685$orig.ident)kidney1 kidney2 kidney3 6856 5134 10532 > table(GSE152938$orig.ident)ccRCC1 ccRCC2 chRCC Normal pRCC 9478 9317 5187 1395 11395 > table(sce.all$orig.ident) GSM4145204 GSM4145205 GSM4145206 GSM4630027 GSM4630028 GSM4630029 GSM4630030 GSM4630031 6856 5134 10532 11395 9478 9317 5187 1395
这个归拢后的对象固然是不错不息走咱们给各人的圭臬代码后各自孤独的降维聚类分群啦。(
团结: https://pan.baidu.com/s/1pKEnPmWXi-pTab0WZUWzgg?pwd=a7s1
)
是以,表面上使用这个手段是不错责罚无穷多个不同开头的单细胞转录组数据集啦,况兼无需顾忌各人的文献关节的问题,归正每个数据集齐我方的里面责罚好,然后外部构建成为sceList归拢即可。
文末友情宣传热烈提倡你推选给身边的博士后以及年青生物学PI,多少许数据领悟麻豆 孤注一掷,让他们的科研上一个台阶:
生物信息学马拉松讲课(买一得五) ,你的生物信息学初学课月薪两万找生信闇练生(线下) 2024的分享就业器交个一又友福利价仍然是800千呼万唤始出来的独享生物信息学云就业器始终免费的生信进阶培训(线下) 本站仅提供存储就业,通盘本体均由用户发布,如发现存害或侵权本体,请点击举报。