Качество исходных fastq файлов оценивали в ПО
FastQC. Дисбалансные нуклеотиды в начале ридов триммировали ПО
BBDuk.
Выравнивание прошедших QC ридов проводили на сборку генома человека GRCh38 (
скачать последовательность) с помощью
bwa-mem2. Преобразование sam файлов в формат bam проводили ПО
SAMtools. Маркирование дупликатов делали с помощью
Picard.
Коллинг вариантов проводили двумя программами:
BCFtools и
DeepVariant. Разделение мультиаллельных вариантов и нормализацию полученных vcf проводили с помощью
vt, фильтровали с параметром DP>=3. Варианты, полученные DeepVariant, также фильтровали с параметром FILTER=PASS. Полученные vcf объединяли bcftools-1.9 merge.