Секвенирование вирусных геномов – от чистой науки к «конвейерному производству»
16-03-2025, 21:25 2
Геномы вирусов представляют из себя цепочки нуклеиновой кислоты, ДНК или РНК, в которых четырьмя «буквами (A, T, G, C для ДНК и A, U, G, C для РНК) записана информация об аминокислотных последовательностях вирусных белков, а также механизмах, обеспечивающих координированность синтеза вирусных компонентов и сборки из них инфекционных вирусных частиц. Определение точной «одномерной» последовательности четырех «геномных букв» (нуклеотидов) называется секвенированием.
Первый полный вирусный геном был секвенирован в 1976г. Его длина 3569 нуклеотидов (бактериофаг MS2). В 1977г появились методы, позволившие поставить секвенирование геномов в лабораторном масштабе на поток. За разработку этих методов Walter Gilbert и Fred Sanger получили Нобелевскую премию 1980г. Метод Gilbert довольно быстро вышел из употребления. А вот метод Sanger стал долгожителем и до сих пор иногда используется в небольших лабораториях (кстати, Fred Sanger дважды лауреат Нобелевской премии).
Поначалу секвенирование проводилось «вручную». Потом появились автоматические ДНК секвенаторы, первый в 1986г. Расшифровка генома человека «вчерне» была осуществлена с использованием этих ДНК секвенаторов первого поколения. Следующей «вехой» в секвенировании нуклеиновых кислот стало появление в середине 2000-х годов NGS (Next Generation Sequencing /секвенирования следующего поколения).
В NGS секвенируется одновременно огромное количество фрагментов ДНК/РНК, из которых программными средствами очень быстро реконструируются полные геномы, начиная от бактериофагов и кончая человеком. NGS позволяет не только идентифицировать каким вирусом инфицирован организм-хозяин, но и определить весь спектр вариантов вируса, присутствующих в данном хозяине (так-называемые квазивиды). До пандемии КОВИД NGS широко использовался в научных вирусологических исследованиях, особенно в области изучения ВИЧ, но до рутинного применения в практике дело не доходило.
КОВИД радикальным образом изменил ситуацию. Идентификация коронавируса-возбудителя КОВИДа (SARS-CoV-2) была осуществлена с помощью NGS. Сделали это 26-27 декабря 2019г в Уханьской частной биотехнологической компании Vision Medicals, специализирующейся на NGS. Кстати, на этот момент в разных больницах Уханя (население – более 11 миллионов человек) было менее 20 больных «атипичной пневмонией» и ни одного летального исхода (первый летальный исход в Ухане зарегистрирован 11 января 2020г).
Вскоре стало понятно, что SARS-CoV-2 генетически изменчив и эту изменчивость необходимо отслеживать. Делалось это с помощью NGS. Так получилось, что расшифровки геномов SARS-CoV-2 от пациентов с КОВИД со всего мира стали депонироваться в базе данных, изначально созданной китайскими исследователями для сбора/хранения информации о геномах вирусов гриппа - GISAID (Global Initiative on Sharing All Influenza Data). График ниже даёт представление о масштабе и динамике этого процесса.
На сегодня в GISAID собрано около 17 миллионов геномов SARS-CoV-2 из более чем 200 стран мира. Наибольшее число геномов было депонировано из следующих 10 стран.
Геномная информация, депонируемая в GISAID практически в режиме реального времени, анализировалась тысячами «геномных аналитиков», среди которых многие были не «дипломированными биоинформатиками», а просто IT-специалистами, участвующими в этой работе добровольно. Именно так, вскоре после их появления, были идентифицированы, сменявшие друг друга, унесшие много жизней и теперь уже забытые, варианты альфа, бета, гамма, дельта и др. и, наконец, царящий с конца 2021г. ОМИКРОН с его многочисленными «отпрысками».
Сейчас, по вполне понятным причинам, этот процесс сильно затормозился. Но если, не дай Бог, разразится новая пандемия, нечто подобное, на более совершенном технологическом уровне нужно будет возродить (здесь помогут новые возможности ИИ). Но и в отсутствии пандемии, мониторинг изменчивости немалого числа вирусов человека, был бы совсем нелишним. Но это уже другая история.