Геномные стандарты
В интернете выложены референсные сборки генома человека – например, hg19, hg38, T2T – для обработки и анализа данных.

Референсы нельзя "потрогать" в своей лаборатории, чтобы проверить качество, точность и воспроизводимость собственных процессов, поэтому существуют физические геномные стандарты, про последовательность генома которых все-все известно, например, GIAB.

Образцы ДНК GIAB и других "платиновых геномов" можно купить, провести анализ у себя и сравнить с полученными у других опытных пользователей результатами. Проблема в том, что магазин образцов ДНК для нас был закрыт всегда, а эталонный геном очень нужен в научной и клинической практике.

E701

Мы создали первый российский стандарт генома человека – E701.

Он представляет собой депонированную геномную ДНК от белого европеоида с кариотипом 46XY без наследственных патологий в анамнезе.

Образцы E701 прошли через WGS 30x в четырех независимых лабораториях Москвы с экспертным многолетним опытом в области NGS с использованием разных платформ для секвенирования коротких ридов:

ФГАОУ ВО РНИМУ им. Н.И. Пирогова
НМИЦ АГП им. В.И. Кулакова
НИЦ «Курчатовский институт»
НМИЦ радиологии

Результаты обработки сиквенсной даты ниже – эталонные для расчетов чувствительности, специфичности, точности и других статистических метрик качества внутрилабораторного процессинга и анализа данных секвенирования для заведений, уже применяющих или собирающихся внедрить технологии геномного и таргетного секвенирований в рутинную практику.
Данные для скачивания
В таблице представлены ссылки на исходные файлы секвенирования, результаты выравнивания и коллинга из четырех лабораторий.
Файл, содержащий позиции в геноме, которые совпали у всех четырех лабораторий, можно скачать по ссылке.

Консенсусную последовательность митохондриальной ДНК (мтДНК) в формате fasta можно скачать по ссылке.

Файл, содержащий профиль коротких тандемных
повторов (STR), можно скачать по ссылке.

Файл, содержащий вариации числа копий (CNV), полученный на платформе Affymetrix,
можно скачать по ссылке.

Скачать все файлы сразу
Контролировать полноту скачивания можно по выложенным хеш-суммам
Качество исходных fastq файлов оценивали в ПО FastQC. Дисбалансные нуклеотиды в начале ридов триммировали ПО BBDuk.

Выравнивание прошедших QC ридов проводили на сборку генома человека GRCh38 (скачать последовательность) с помощью bwa-mem2. Преобразование sam файлов в формат bam проводили ПО SAMtools. Маркирование дупликатов делали с помощью Picard.

Коллинг вариантов проводили двумя программами: BCFtools и DeepVariant. Разделение мультиаллельных вариантов и нормализацию полученных vcf проводили с помощью vt, фильтровали с параметром DP>=3. Варианты, полученные DeepVariant, также фильтровали с параметром FILTER=PASS. Полученные vcf объединяли bcftools-1.9 merge.
Купить E701
Вы можете приобрести кит с образом E701.
Для этого нужно связаться с нами или обратиться в ФГБУ ВНИИМС
Контакты
117997 Москва, ул. Островитянова, д. 1, стр. 1