导入数据 目录
用tximport导入定量数据 (salmon) 目录
将由salmon quant
产生的quant.sf
文件导入,然后构建gene-level DESeqDataSet object
先根据样本信息构建以下格式的数据框变量samples
# samples
## pop center run condition
## ERR188297 TSI UNIGE ERR188297 A
## ERR188088 TSI UNIGE ERR188088 A
## ERR188329 TSI UNIGE ERR188329 A
## ERR188288 TSI UNIGE ERR188288 B
## ERR188021 TSI UNIGE ERR188021 B
## ERR188356 TSI UNIGE ERR188356 B
run和condition两列是必须的
然后根据samples$run来获取对应的数据集的存储路径,保存于变量files中,并且读入 transcripts-genes对应关系的table
files <- file.path(dir,"salmon", samples$run, "quant.sf")
names(files) <- samples$run
tx2gene <- read.csv(file.path(dir, "tx2gene.csv"))
导入定量数据
txi <- tximport(files, type="salmon", tx2gene=tx2gene)
最后,根据定量数据txi和样本信息samples构建DESeqDataSet
library("DESeq2")
ddsTxi <- DESeqDataSetFromTximport(txi,
colData = samples,
design = ~ condition)
Count matrix input 目录
简单来说就是构建一个表达谱矩阵,然后用DESeqDataSetFromMatrix函数构造DESeqDataSet
详细内容请点 这里
参考资料:
(1) Bioconductor tutorial: Analyzing RNA-seq data with DESeq2