是以需要祛除其它数据集的平方组织

2024-06-21 17:31 点击次数：132

是以需要祛除其它数据集的平方组织

学员暗示他在科罚这个数据集（GSE152938）的工夫，因为数据集里面是5个样品，然而唯唯一个是平方组织的样品，分组是不服衡的，是以需要祛除其它数据集的平方组织，然而不知说念如安在r编程说话里面操作。

图片

数据集（GSE152938）

如下所示的数据集（GSE152938）文献姿色：

图片

文献姿色

关于这个数据集（GSE152938），不错使用底下的代码进行批量读取哈：

dir='GSE152938_RAW'samples=list.files( dir )samples sceList = lapply(samples，function(pro){   # pro=samples[1]   print(pro)    tmp = Read10X(file.path(dir，pro ))   if(length(tmp)==2){    ct = tmp[[1]]   }else{ct = tmp}  sce =CreateSeuratObject(counts =  ct ，                          project =  pro  ，                          min.cells = 5，                          min.features = 300 )  return(sce)}) do.call(rbind，lapply(sceList， dim))sce.all=merge(x=sceList[[1]]，              y=sceList[ -1 ]，              add.cell.ids = samples  ) names(sce.all@assays$RNA@layers)sce.all[["RNA"]]$counts # Alternate accessor function with the same resultLayerData(sce.all， assay = "RNA"， layer = "counts")sce.all <- JoinLayers(sce.all)dim(sce.all[["RNA"]]$counts )

学员给了一个平方东说念主的肾脏组织数据集（GSE131685），首页-和西乌香精有限公司同期咱们读取它，义乌市美能笔业有限公司如下所示的文献姿色：

图片

数据集（GSE131685）

亦然相似的读取款式：

宁波惠康国际工业有限公司 0， 0， 0.55) 0px 2px 10px;margin-top: 10px;margin-bottom: 10px;">dir='GSE131685_RAW/outputs/'samples=list.files( dir )samples

上头的这两个数据集走咱们给环球的圭臬代码后各自安适的降维聚类分群，就会有 2-harmony/sce.all_int.rds 文献夹和文献。

然后就不错使用底下的代码，合并两个数据集：

GSE131685 = readRDS('../2020-GSE131685-3个平方东说念主的肾单细胞/2-harmony/sce.all_int.rds') GSE131685$study = 'GSE131685'table(GSE131685$orig.ident)GSE152938 = readRDS('../2021-GSE152938-肾癌/2-harmony/sce.all_int.rds')GSE152938$study = 'GSE152938'table(GSE152938$orig.ident)sceList = list(  GSE131685 = CreateSeuratObject(    counts = GSE131685@assays$RNA$counts  )，   GSE152938 = CreateSeuratObject(    counts = GSE152938@assays$RNA$counts  ))sce.all=merge(x=sceList[[1]]，通用零部件              y=sceList[ -1 ]，              add.cell.ids = c('GSE131685'，'GSE152938')  ) names(sce.all@assays$RNA@layers)sce.all[["RNA"]]$counts # Alternate accessor function with the same resultLayerData(sce.all， assay = "RNA"， layer = "counts")sce.all <- JoinLayers(sce.all)dim(sce.all[["RNA"]]$counts )

不错看到这两个数据集齐有不同数目的样品，合并后即是一个大的对象了：

> table(GSE131685$orig.ident)kidney1 kidney2 kidney3    6856    5134   10532    > table(GSE152938$orig.ident)ccRCC1 ccRCC2  chRCC Normal   pRCC   9478   9317   5187   1395  11395   > table(sce.all$orig.ident) GSM4145204 GSM4145205 GSM4145206 GSM4630027 GSM4630028 GSM4630029 GSM4630030 GSM4630031       6856       5134      10532      11395       9478       9317       5187       1395

这个合并后的对象虽然是不错接续走咱们给环球的圭臬代码后各自安适的降维聚类分群啦。(

连合: https://pan.baidu.com/s/1pKEnPmWXi-pTab0WZUWzgg?pwd=a7s1

)

是以，表面上使用这个妙技是不错科罚无尽多个不同开首的单细胞转录组数据集啦，并且无需惦记环球的文献身手的问题，归正每个数据集齐我方的里面科罚好，然后外部构建成为sceList合并即可。

文末友情宣传

厉害提出你推选给身边的博士后以及年青生物学PI，多少量数据走漏通用零部件，让他们的科研上一个台阶：

生物信息学马拉松讲课（买一得五），你的生物信息学初学课月薪两万找生信练习生（线下） 2024的分享就业器交个一又友福利价仍然是800千呼万唤始出来的独享生物信息学云就业器经久免费的生信进阶培训（线下）本站仅提供存储就业，通盘实验均由用户发布，如发现存害或侵权实验，请点击举报。

上一篇：在夸尔斯联系中性利率的言论出炉之后

下一篇：没有了