课程大纲

作者

王诗翔

发布于

2026年4月23日

一、课程目标

让学生掌握基因组突变分析的理论基础,熟练运用 R 语言及 Bioconductor 相关包(如 maftools、Sigminer 等)进行突变数据处理、分析与可视化,重点掌握突变特征分析的原理与方法。

二、课程安排

本课程共 4 学时,分为理论讲授(2学时)和上机实验(2学时)两部分。

第一学时:基因组突变基础理论

主题:基因组突变概论

内容

  • 基因组突变定义:介绍基因组突变基本概念,包括突变类型(如 SNP、插入/缺失等),举例说明不同类型突变引发的后果,如引发疾病、改变性状等。

  • 突变来源:阐述突变产生的原因,如复制错误、环境因素(辐射、化学物质)等,详细解释各个因素导致突变的机制。

  • 突变检测方法:概述常见检测技术,如 Sanger 测序、NGS(下一代测序)等原理及特点,对比不同方法的优劣。

第二学时:Bioconductor 与突变分析工具

主题:Bioconductor 及突变分析相关 R 包介绍

内容

  • Bioconductor 简介:简述 Bioconductor 平台,重点介绍其在生物信息学领域,尤其是基因组学分析中的重要地位。

  • 数据格式介绍:详细介绍 VCF 和 MAF 格式的结构、字段含义及用途。

  • maftools 包:介绍 maftools 包的功能和应用场景,包括突变频谱分析、基因突变分布可视化等。

  • Sigminer 包:讲解其在突变特征分析中的应用,如提取和分析突变特征,揭示突变的潜在致病机制。

第三学时:突变数据处理与分析实践

主题:突变数据导入与预处理

内容

  • 数据格式理解:讲解 MAF 格式的各字段含义,如肿瘤样本 ID、基因名、突变类型等。

  • 数据导入:演示如何使用 R 语言读取 MAF 文件,介绍 read.maf() 函数及其参数设置。

  • 数据清洗与预处理:指导学生对导入的数据进行清洗,如去除缺失值、重复值等。

  • 基础可视化:使用 maftools 包绘制突变概览图、oncoplot 等。

第四学时:突变特征分析实践

主题:突变特征分析

内容

  • 突变特征概念:介绍突变特征的定义、分类(SBS、DBS、ID、CN等)及生物学意义。

  • Sigminer 使用:演示如何使用 Sigminer 包进行突变特征提取。

  • de novo 分析:指导学生进行从头突变特征提取。

  • 特征拟合:介绍如何将提取的特征与已知特征进行比对拟合。

  • 结果解读:帮助学生理解突变特征的潜在生物学意义。

三、课程重点与难点

重点内容

  1. 突变类型的识别与分类
  2. MAF/VCF 数据格式的理解与使用
  3. maftools 包的核心功能与操作
  4. 突变特征分析的原理与方法
  5. Sigminer 包的使用流程

难点内容

  1. 突变特征提取的数学原理(NMF分解)
  2. 突变特征的生物学解读
  3. 不同分析策略(de novo vs refitting)的选择

四、教学方式

教学环节 方式 时间分配
理论讲授 幻灯片演示 + 讲解 2学时
上机实验 演示 + 学生实践 2学时
互动讨论 问题解答 + 讨论 融入各环节

五、考核方式

本课程采用实践作业考核方式,具体要求如下:

作业内容 分值比例
Oncoplot 绘制 30%
基因生存分析 40%
结果解读与报告 30%

六、参考教材

  1. maftools 官方文档:https://bioconductor.org/packages/maftools
  2. Sigminer 文档:https://shixiangwang.github.io/sigminer-book/
  3. COSMIC 突变特征数据库:https://cancer.sanger.ac.uk/signatures/
  4. Bioconductor 官方网站:https://www.bioconductor.org/

七、预备知识

学习本课程前,学生应具备以下基础知识:

  • R 语言基本编程能力
  • 基础生物统计学知识
  • 分子生物学基础概念
  • 基因组学基本知识

八、课程资源

详细学习资源请参阅 学习资源 页面。