培训对象:生物信息分析人员、临床基因检测人员、遗传咨询师、需要掌握行业标准变异检测流程的专业人士。
培训目标:
掌握GATK的核心架构与数据预处理流程,能够从原始FASTQ生成可用于变异检测的分析就绪BAM。
熟练运用HaplotypeCaller进行胚系变异检测,掌握Joint Calling多人联合分析的完整流程。
掌握变异过滤与评估方法(VQSR、CNN、硬过滤),能够获得高质量的变异结果集。
培训内容介绍:
GATK概述与最佳实践:了解GATK的发展历程、核心组件及Broad Institute推荐的最佳实践流程。
数据预处理流程:使用MarkDuplicates标记PCR重复,使用BaseRecalibrator进行碱基质量分数重校准(BQSR)。
HaplotypeCaller原理:理解HaplotypeCaller通过局部从头组装进行变异检测的核心算法。
单个样本变异检测:对单个样本运行HaplotypeCaller,生成包含变异信息的gVCF文件。
Joint Calling联合分析:使用GenomicsDBImport合并多个样本的gVCF,使用GenotypeGVCFs进行联合基因分型。
变异过滤策略:对比硬过滤、VQSR、CNNScoreVariants三种过滤方法的原理与适用场景。
VQSR实操:使用VariantRecalibrator建立高斯混合模型,使用ApplyVQSR应用过滤阈值。
CNNScoreVariants:使用基于深度学习的CNN模型对变异进行质量评分,适应复杂基因组区域。
变异结果评估:使用VariantEval和CollectVariantCallingMetrics评估变异检测的质量。
体细胞变异检测:使用Mutect2进行肿瘤-正常配对样本的体细胞变异检测。
拷贝数变异分析:使用GATK的CNV模块进行gCNV和体细胞拷贝数变异分析。
综合实战演练:以WES或WGS数据为例,完成从预处理到变异过滤的完整GATK流程