E701 — первый российский эталонный геном человека

E701 — это депонированный образец геномной ДНК от здорового донора (европеоид, 46XY), прошедший полногеномное секвенирование (WGS 30x) в четырёх ведущих лабораториях Москвы:

  • РНИМУ им. Н.И. Пирогова
  • НМИЦ АГП им. В.И. Кулакова
  • Курчатовский институт
  • НМИЦ радиологии

Результаты секвенирования и биоинформатической обработки позволяют использовать E701 в качестве эталона для валидации процессов NGS: оценки чувствительности, специфичности и точности.

Финансирование проекта по созданию геномного стандарта осуществлялось за счет государственной поддержки создания и развития центра геномных исследований мирового уровня «Центр высокоточного редактирования и генетических технологий для биомедицины» №075-15-2019-1789 от 22.11.2019 Министерства образования и науки РФ.

Применение E701
Эталонный геном E701 — это универсальный инструмент для геномных лабораторий.
С его помощью вы можете верифицировать собственные протоколы и биоинформатические пайплайны, повысить качество анализа и обеспечить соответствие международным стандартам.
  • Валидация пайплайнов NGS
    Оцените точность определения геномных вариантов, включая SNV, CNV, STR. Используйте эталонные VCF-файлы для сравнения и валидации биоинформатических пайплайнов.
  • Обучение и тестирование персонала
    E701 идеально подходит для тренировочных запусков, отработки протоколов, тестирования квалификации новых сотрудников и студентов.
  • Настройка и контроль качества
    Используйте E701 в качестве внутреннего стандарта при валидации методов, аккредитации лабораторных процессов и внедрения новых технологий, оценивая чувствительность, специфичность и точность.
  • Введение новых панелей и таргетных решений
    Проверьте работу своих гибридизационных или ампликонных панелей на эталонном образце — до начала анализа клинических образцов реальных пациентов.
  • Межлабораторное сравнение
    Сравните результаты между платформами, лабораториями и биоинформатиками. Снижение вариативности — ключ к обеспечению воспроизводимости и надежной диагностике.
  • Публикации и научные проекты
    Используйте E701 в качестве доступного и хорошо охарактеризованного эталонного образца в научных публикациях и грантах.
Эталонные данные доступны каждому

Ниже представлены результаты биоинформатического анализа и коллинга вариантов. Эти файлы можно использовать для собственных расчётов и бенчмаркинга биоинформатических пайплайнов.

  • Файл, содержащий позиции в геноме, которые совпали у всех четырёх лабораторий:
    • РНИМУ (PE100)
    • НМИЦ АГП
    • Курчатовский институт
    • НМИЦ радиологии
    Скачать
  • Консенсусная последовательность митохондриальной ДНК (мтДНК) в формате fasta
    Скачать
  • Файл, содержащий профиль коротких тандемных
    повторов (STR)

    Скачать
  • Файл, содержащий вариации числа копий (CNV), полученный на платформе Affymetrix
    Скачать
  • Файл, содержащий позиции в геноме, совпавшие минимум в 3 из 5 результатов секвенирования
    Скачать
  • Файл, содержащий позиции в геноме, полученные при коллинге на объединённом BAM-файле (5 результатов секвенирования)
    Скачать
Обработка и анализ данных
  • 📥Предобработка данных
    Качество исходных FastQ-файлов оценивали с использованием ПО FastQC. Дисбаланс нуклеотидов в начале прочтений триммировали ПО BBDuk.
  • 🔗Выравнивание
    Выравнивание прочтений осуществляли на сборку генома человека GRCh38 (скачать последовательность) с помощью bwa-mem2. Преобразование SAM файлов в формат BAM проводили ПО SAMtools. Маркировку дубликатов осуществляли с помощью Picard.
  • 🔬 Коллинг вариантов
    Коллинг вариантов проводили двумя программами: BCFtools и DeepVariant. Разделение мультиаллельных вариантов и нормализацию полученных VCF-файлов проводили с помощью vt, после чего варианты фильтровали по глубине покрытия (DP>=3). Для вариантов, полученных DeepVariant, дополнительно применяли фильтр PASS. Полученные VCF-файлы объединяли bcftools-1.9 merge.
  • 📃 Бенчмарк BED
    Для повышения надёжности определения геномных вариантов был сформирован BED-файл на основе сборки GRCh38, из которого исключены участки, трудные для картирования коротких прочтений, а также регионы сегментных дупликаций.
Использование длинных прочтений PacBio Revio
  • Образец E701 был отсеквенирован с использованием технологии получения длинных прочтений PacBio Revio в лаборатории CeGaT.
    Чтобы оценить результаты коллинга однонуклеотидных замен (SNPs), мы сравнили их с результатами, полученными на BAM-файле, объединяющем данные секвенирования коротких прочтений с нескольких платформ.

    Анализ показал, что более 900 тысяч SNPs уникально для длинных прочтений, что составляет почти 20% от общего числа обнаруженных SNPs.

    Полученные результаты подчёркивают, что длинные прочтения позволяют охватывать геномные регионы, недоступные для коротких прочтений, в которых могут быть обнаружены клинически важные геномные варианты.
Публикации и документы

E701 является первым эталонным человеческим геномом, разработанным в России. Опыт разработки геномного стандарта представлен в научной публикации Лаборатории геномики:

Experience in developing the human genome standard E701

Опубликовано в журнале NAR Genomics and Bioinformatics


В 2024 году геномный стандарт E701 прошел официальную метрологическую верификацию. Паспорт стандартного образца утвержденного типа ГСО 12688-2024 ФГБУ "ВНИИМС" закрепляет статус E701 как эталонного геномного материала в рамках национальной системы стандартизации.


В рамках проекта было выполнено секвенирование митохондриальной ДНК (mtDNA) образца E701 с высокой глубиной покрытия. Подробнее о проекте эталонной mtDNA →

Купить стандарт E701
Получите эталонный геном E701 для своей лаборатории.
Набор включает:
  • 2 пробирки с геномной ДНК
  • Паспорт образца и спецификацию
  • Защитную упаковку
  • Доступ к эталонным данным
Часто задаваемые вопросы
Контакты
117997 Москва, ул. Островитянова, д. 1, стр. 1