拓展资源

Learning Resources

官方文档与教程

Bioconductor

RNA-seq Workflow

Bioconductor官方RNA-seq分析工作流,使用airway数据集演示完整分析流程

DESeq2 Vignette

DESeq2包官方文档,详细的差异表达分析教程

edgeR User Guide

edgeR用户指南,适用于复杂实验设计的差异分析

在线课程

HBC RNA-seq Training

哈佛生物信息学核心培训材料,涵盖RNA-seq分析全流程

NBIS RNA-seq Workshop

瑞典国家生物信息学基础设施RNA-seq培训材料

Workshop RNA-seq

本实验室fork的RNA-seq培训资料

Auto SRA RNA-seq Pipeline

自动化SRA RNA-seq数据下载与处理流程(fastq-dump、质控、比对、表达定量)

参考书籍

书名 作者 说明
RNA-seq Data Analysis Korpelainen et al. RNA-seq数据分析实用指南
Bioinformatics Data Skills Vince Buffalo 生物信息学数据处理基础
R for Data Science Wickham & Grolemund R数据科学基础
Bioconductor Case Studies Hahne et al. Bioconductor案例分析

数据库与工具

基因注释数据库

  • Ensembl: https://www.ensembl.org/
  • NCBI Gene: https://www.ncbi.nlm.nih.gov/gene
  • Gene Ontology: http://geneontology.org/
  • KEGG: https://www.genome.jp/kegg/

常用工具

工具 用途 链接
fastp 一个超快速的全能FASTQ预处理器(质量控制/接头/修剪/过滤/分割/合并…) https://github.com/OpenGene/fastp
FastQC 测序数据质控 https://www.bioinformatics.babraham.ac.uk/projects/fastqc/
Trimmomatic 接头和低质量序列去除 http://www.usadellab.org/cms/?page=trimmomatic
STAR RNA-seq reads比对 https://github.com/alexdobin/STAR
HISAT2 快速splice-aware比对 https://daehwankimlab.github.io/hisat2/
featureCounts 基因表达计数 http://subread.sourceforge.net/
MultiQC 整合质控报告 https://multiqc.info/

R包资源

clusterProfiler

全面的功能富集分析R包,支持多种富集方法和可视化

ComplexHeatmap

复杂热图绘制R包,适用于基因组数据可视化

fgsea

快速GSEA分析R包

示例数据集

课程示例数据

课程使用真实甲状腺癌RNA-seq数据集(PTC vs ATC),包含:

  • 对照组(PTC)实验组(ATC)各3个生物学重复
  • ~20,000个基因的原始计数矩阵
  • 含批次信息的完整样本metadata
文件 说明 下载
geneCountMatrix.txt 基因表达原始计数矩阵(~20,000基因 × 6样本) 下载
samplesinfo.txt 样本信息表(样本名、分组、批次) 下载

学习路径建议

入门路径

  1. 完成本课程理论学习
  2. 跟随Bioconductor RNA-seq Workflow实践
  3. 使用自己的数据重复分析流程

进阶路径

  1. 学习批次效应校正(ComBat-seq等)
  2. 掌握整合分析(多数据集meta-analysis)
  3. 探索单细胞RNA-seq分析(Seurat)

社区与支持

  • Bioconductor支持网站: https://support.bioconductor.org/
  • Biostars: https://www.biostars.org/
  • Stack Overflow: https://stackoverflow.com/questions/tagged/rna-seq

相关课程


提示:如果遇到问题,建议首先查阅官方文档和Vignette,然后通过搜索引擎/AI搜索类似问题。