Геномные стандарты
В интернете выложены референсные сборки генома человека – например, hg19, hg38, T2T – для обработки и анализа данных.

Референсы нельзя "потрогать" в своей лаборатории, чтобы проверить качество, точность и воспроизводимость собственных процессов, поэтому существуют физические геномные стандарты, про последовательность генома которых все-все известно, например, GIAB.

Образцы ДНК GIAB и других "платиновых геномов" можно купить, провести анализ у себя и сравнить с полученными у других опытных пользователей результатами. Проблема в том, что магазин образцов ДНК для нас был закрыт всегда, а эталонный геном очень нужен в научной и клинической практике.

E701

Мы создали первый российский стандарт генома человека – E701.

Он представляет собой депонированную геномную ДНК от белого европеоида с кариотипом 46XY без наследственных патологий в анамнезе.

Образцы E701 прошли через WGS 30x в трех независимых лабораториях Москвы с экспертным многолетним опытом в области NGS с использованием разных платформ для секвенирования коротких ридов:

ФГАОУ ВО РНИМУ им. Н.И. Пирогова
НМИЦ АГП им. В.И. Кулакова
НИЦ «Курчатовский институт»

Результаты обработки сиквенсной даты ниже – эталонные для расчетов чувствительности, специфичности, точности и других статистических метрик качества внутрилабораторного процессинга и анализа данных секвенирования для заведений, уже применяющих или собирающихся внедрить технологии геномного и таргетного секвенирований в рутинную практику.
Данные для скачивания
В таблице представлены ссылки на исходные файлы секвенирования, результаты выравнивания и коллинга из трех лабораторий.
Файл, содержащий позиции в геноме, которые совпали у всех трех лабораторий, можно скачать по ссылке.

Скачать все файлы сразу
Контролировать полноту скачивания можно по выложенным хеш-суммам
Качество исходных fastq файлов оценивали в ПО FastQC. Дисбалансные нуклеотиды в начале ридов триммировали ПО BBDuk.

Выравнивание прошедших QC ридов проводили на сборку генома человека GRCh38 (скачать последовательность) с помощью bwa-mem2. Преобразование sam файлов в формат bam проводили ПО SAMtools. Маркирование дупликатов делали с помощью Picard.

Коллинг вариантов проводили двумя программами: BCFtools и DeepVariant. Разделение мультиаллельных вариантов и нормализацию полученных vcf проводили с помощью vt, фильтровали с параметром DP>=3. Варианты, полученные DeepVariant, также фильтровали с параметром FILTER=PASS. Полученные vcf объединяли bcftools-1.9 merge.
Купить E701
Вы можете приобрести кит с образом E701.
Для этого нужно связаться с нами или обратиться в ФГБУ ВНИИМС
Контакты
117997 Москва, ул. Островитянова, д. 1, стр. 1