Выпуск #6/2018
К. Э. Яковлева, В. В. Родченкова
Проникновение в самую сущность микроорганизмов. Нанопоровое секвенирование на основе длинных прочтений
Проникновение в самую сущность микроорганизмов. Нанопоровое секвенирование на основе длинных прочтений
Просмотры: 2319
Микроорганизмы – наиболее многочисленная и разнородная форма жизни на Земле, насчитывающая, по оценкам, триллион видов. Это необходимые компоненты всех экосистем, играющие решающую роль в сохранении здоровья, развитии заболеваний и во многих технологических процессах.
Технологии секвенирования оказали огромное влияние на микробиологию. В работе описано, каким образом современные микробиологи используют нанопоровое секвенирование на основе длинных прочтений в реальном времени, чтобы преодолеть проблемы секвенирования коротких прочтений и полностью описать микробные геномы, открывая новые возможности изучения их эволюции, патогенности и устойчивости к антибиотикам.
УДК 579.25
DOI: 10.22184/2227-572X.2018.08.6.526.534
Технологии секвенирования оказали огромное влияние на микробиологию. В работе описано, каким образом современные микробиологи используют нанопоровое секвенирование на основе длинных прочтений в реальном времени, чтобы преодолеть проблемы секвенирования коротких прочтений и полностью описать микробные геномы, открывая новые возможности изучения их эволюции, патогенности и устойчивости к антибиотикам.
УДК 579.25
DOI: 10.22184/2227-572X.2018.08.6.526.534
Теги: ecosystems microbial genomes microbiology nanoporous sequencing микробиология микробные геномы нанопоровое секвенирование экосистемы
Традиционно, микроорганизмы изучали путем культивирования отдельных видов или штаммов на искусственных питательных средах. Однако из 10 млн видов (рис.1), описанных до настоящего времени, всего 10 000 (0,1%) культивировали в лаборатории [1].
С появлением современных технологий секвенирования для высокопроизводительного геномного анализа, особенно для ранее не культивировавшихся микроорганизмов, резко возросли возможности идентификации и описания их свойств. Сегодня общедоступны геномные последовательности примерно 150 000 микробных штаммов [2]. Однако в связи с ограничениями, присущими традиционным технологиям секвенирования на основе коротких прочтений, большая часть наших знаний о микробных геномах основывается на неполных данных. Полагают, что примерно 90% бактериальных геномов определено не полностью [3]. Разработано несколько способов секвенирования, самый популярный и надежный из них – секвенирование по Сэнгеру – позволяет "считывать" последовательности до 1 000 пар оснований (п. о.) и используется для небольших фрагментов генома / генов или для подтверждения результатов более современного секвенирования нового поколения (next-generation sequencing, NGS), когда размер одного прочитанного фрагмента варьирует от 25 до 500 п. о. Методы NGS используют для многократного прочтения генетического материала, которое необходимо, например, для ресеквенирования и сборки новых геномов (de novo), транскриптомных и эпигеномных исследований [4, 5]. Помимо этого, NGS-секвенирование значительно производительнее, поэтому возможно определение последовательности сразу десятков геномов (в зависимости от их размера) за один запуск прибора.
Одно из перспективных направлений развития методов секвенирования реализовано в приборах Британской компании Oxford Nanopore Technologies на основе нанопоровой технологии. Принцип действия заключается в использовании прочной мембраны, в которой расположены поры диаметром несколько нанометров. С помощью белковой инженерии размер нанопор можно подбирать под конкретные исследуемые молекулы. К реакционной камере секвенатора прикладывается напряжение, которое вызывает движение ионов и молекул ДНК и РНК через единичные поры в поверхности мембраны. При этом сила тока изменяется, поскольку основания G, A, T и C проходят через поры в разных комбинациях. Обработав результаты, можно расшифровать последовательность оснований, прошедших через пору.
Характерной особенностью нанопоровых секвенаторов является их сверхкомпактность. Например, самый портативный секвенатор MiniION весит всего 100 г и работает от USB 3.0 обычного компьютера или ноутбука (рис.2). Оригинальная платформа MinION может дать десятки Гб данных на цикл, тогда как два других прибора, GridION X5 и PromethION, дают сотни и тысячи Гб данных соответственно. GridION использует ту же нанопоровую технологию, вмещает до 5 проточных ячеек с 512 каналами в каждой, а PromethION размещает до 48 проточных ячеек с 3000 каналами в каждой. Каждая проточная ячейка работает независимо, поэтому их число можно выбрать для конкретного анализа, чтобы выполнять разные эксперименты параллельно. GridION X5 и PromethION доступны без капитальных затрат – необходимо приобретать только расходные материалы для эффективной работы с возможностью масштабирования. Портативное устройство MinION можно использовать везде, в том числе в условиях ограниченных ресурсов или в отдаленных местах, поэтому оно идеально подходит для анализа непосредственно в очаге возникновения инфекции. Настольные устройства GridION X5 и PromethION подходят для ситуаций с большим потоком проб для анализа.
ПРЕИМУЩЕСТВА НАНОПОРОВОГО СЕКВЕНИРОВАНИЯ ДЛЯ МИКРОБИОЛОГИЧЕСКОГО АНАЛИЗА
Сборка генома
Для реального понимания разнообразия микроорганизмов обязательно создание полного и подробно описанного генома. Области повторов и структурные вариации выполняют важные функции в геноме, в том числе влияют на развитие и распространение устойчивости к антибиотикам и факторов вирулентности [3, 6]. Известно, что технологии секвенирования с помощью коротких ридов, использующиеся для создания большинства эталонных геномов, связаны с проблемой разрешения таких областей [6, 7] (рис.3). По этим причинам большинство эталонных геномов неполные и содержат пробелы, где секвенирование или выравнивание невозможно.
В противоположность традиционным платформам, которые обычно работают с короткими (<300 п. о.) фрагментами ДНК, нанопоровая технология секвенирования позволяет читать фрагменты ДНК, проходящие через пору, независимо от их размера. Цепочки длиной в сотни тысяч пар оснований анализируются в обычном порядке, а длина прочитанных фрагментов превышает 1 Мб. Очевидно, что такие длинные прочтения с бóльшей вероятностью охватят полные области ДНК с повторяющимися последовательностями и структурные варианты, давая возможность более полной сборки генома без пробелов [7–9] (рис.4).
Длинные прочтения последовательностей дают дополнительное преимущество, так как обеспечивают лучшее перекрывание между ридами и облегчают сборку фрагментов ДНК в правильном порядке. Это можно представить в виде головоломки-мозаики: чем крупнее фрагменты, тем легче головоломка.
Благодаря ультрадлинным нанопоровым ридам теперь реально секвенировать полный вирусный геном за одно прочтение, полностью устранив необходимость в сборке [10]. В перспективе, по мере разработки протоколов пробоподготовки и создания более длинных цельных молекул ДНК и РНК, станет возможным секвенировать даже крупные геномы за одно прочтение.
Профилирование устойчивости к антибиотикам
Согласно ВОЗ, устойчивость к антибиотикам является чрезвычайной глобальной проблемой здравоохранения, серьезно угрожающей прогрессу современной медицины. Поэтому очень нужны технологии точного и быстрого определения свойств выделенных возбудителей для получения данных об их эволюции и передаче устойчивости к лекарствам, а также лучшего понимания потенциальных стратегий лечения. Нанопоровое секвенирование дает оптимизированный подход к профилированию устойчивости к антибиотикам, как в практических условиях, так и в лаборатории.
В отличие от традиционной технологии секвенирования, при которой все данные становятся доступны в конце цикла, значительное преимущество нанопорового секвенирования заключается в возможности анализа данных в реальном времени. В дополнение к резкому сокращению времени ожидания результата, в режиме онлайн сразу подтверждается правильность сбора образцов. Кроме того, после получения необходимых данных анализ можно остановить, чтобы эффективнее использовать рабочее время.
Компания Oxford Nanopore разработала схему анализа WIMP-ARMA для идентификации микроорганизмов в реальном времени и профилирования их устойчивости к антибиотикам [11]. Эта схема заключается в выравнивании прочтений в сравнении с Всеобъемлющей базой данных устойчивости к антибиотикам (Comprehensive Antibiotic Resistance Database, CARD). В полученном по результатам анализа отчете будут отмечены те определенные при выравнивании последовательности, которые указывают на устойчивость к данному антибиотику. Схема WIMP-ARMA не требует глубоких знаний в области биоинформатики, интуитивно понятна и позволяет установить особенности устойчивости к антибиотикам.
С помощью нанопорового секвенирования удалось сократить время, необходимое для анализа устойчивости к антибиотикам у возбудителя туберкулеза Mycobacterium bovis до 12 ч вместо 8–15 недель при традиционных культуральных методах [12]. Опубликованы результаты работ по определению характеристик устойчивости к лекарствам ряда возбудителей, включая бактерии, вирусы и грибы.
Полная сборка плазмид
У бактерий гены устойчивости к антибиотикам могут переноситься с бактериальным геномом или плазмидами. Понимание местоположения этих генов проясняет механизмы передачи устойчивости между возбудителями, поэтому оно становится очень важным в эпидемиологических стратегиях отслеживания и ограничения распространения болезни [13–15].
В геноме может присутствовать большое количество ДНК-повторов, поэтому полная сборка плазмид и их дифференциация от геномных последовательностей при секвенировании с помощью коротких прочтений особенно сложна [15]. Cеквенирование очень длинных фрагментов ДНК или РНК по нанопоровой технологии охватывает области с повторами и решает проблему полной и четкой сборки плазмид и генома. Кроме того, можно быстро установить конкретное местоположение генов устойчивости, получив более подробную информацию об их передаче и эволюции [13, 14].
Эксперимент, проведенный Li и др. [14], показал, что единичное нанопоровое прочтение штамма Escherichia coli, устойчивого к карабапенему, охватывает всю плазмиду длиной >90 тыс. п. о. Размеры бактериальных плазмид крайне разнообразны и варьируют от 1 до 100 тыс. п. о. При нанопоровой технологии длина прочтения ограничена только размером фрагмента ДНК, проходящим через пору. Теоретически возможно секвенировать даже крупнейшие плазмиды за единичные прочтения. Такой сценарий устраняет необходимость в сборке, упрощая ход анализа.
Вирулентность
Гены вирулентности часто сгруппированы в острова патогенности (ОП), которые могут быть встроены в геном или расположены вне хромосом (т. е. в плазмидах). Так же как гены устойчивости к антибиотикам, ОП часто граничат со вставками, содержащими повторы и облегчающими перемещение в пределах одного вида и между видами [16, 17] (рис.5).
Большие размеры ОП (обычно 10–200 тыс. п. о.) в сочетании с повторами делают их точный анализ с помощью техник коротких прочтений особенно сложным [6, 18]. Гены мобильности, такие как интегразы (int), часто расположены в начале острова близко к локусу тДНК или соответствующему месту прикрепления (см. рис.5). ОП содержат гены вирулентности (от В1 до В4) и часто перемежаются мобильными элементами, такими как перемещающиеся встроенные элементы / последовательности, которые могут быть полными или частичными. ОП часто ограничены прямыми повторами (ПП), которые используются при процессах вставки и делеции [17]. Нанопоровое секвенирование позволяет за одно прочтение полностью достоверно охарактеризовать и установить местоположение ОП.
Изучение вирулентности микроорганизмов актуально не только в традиционной медицине, но и вне земной атмосферы, например, в условиях космических полетов [19]. Научные наблюдения показали возможность повышения патогенности микроорганизмов в космическом корабле [20]. В качестве первого шага к пониманию причин этого явления научная группа NASA (США) использовала нанопоровую технологию для успешного секвенирования и анализа метагеномного образца на борту Международной космической станции. Возможно, что в будущем нанопоровое секвенирование будет применяться для изучения эволюции микроорганизмов, диагностики с целью правильного подбора лечения инфекции во время полетов и даже для поиска внеземной жизни.
РНК-геномы
РНК-содержащие вирусы лишены механизмов "вычитки", которые обычно есть у организмов с геномом на основе ДНК и, следовательно, частота мутаций у них намного выше. Такая высокая частота ошибок дает эволюционное преимущество, позволяя РНК-вирусам быстро приспосабливаться, чтобы избегать иммунного ответа организма хозяина на инфекцию и последующей противовирусной терапии. Неудивительно, что многие вновь появляющиеся вирусные заболевания человека вызваны РНК-вирусами, например, эбола, тяжелый острый респираторный синдром (ТОРС), чикунгунья, лихорадка Западного Нила, грипп. Поэтому своевременный быстрый и точный анализ генома этих микроорганизмов настоятельно необходим.
Важно провести подробный анализ генома, генетического и географического происхождения болезни, а также выявить новые варианты, усиливающие вирулентность и обеспечивающие возможность распространения между видами или передачи от человека к человеку.
Секвенирование кДНК-копий РНК-геномов вирусов стало движущей силой многих важных открытий, однако общеизвестно, что процесс превращения РНК в кДНК путем обратной транскрипции и амплификации может стать источником погрешности. Как утверждает д-р Мэттью Келлер (Dr. Matthew Keller), научный сотрудник ORISE Центра контроля и профилактике болезней (США): "Бóльшая часть наших знаний о биологии РНК видится через линзу кДНК" [21].
Недавно компания Oxford Nanopore предложила способ непосредственного секвенирования РНК с помощью нанопоровой технологии, сочетающей преимущества длинных прочтений для полного охвата генома со сниженной погрешностью по сравнению с методами коротких прочтений кДНК. Удалось полностью секвенировать РНК-геном вируса гриппа А, причем каждый из восьми сегментов генома представляет собой полную длину прочтения. Такой анализ занимает всего один день вместо нескольких дней при стандартной технологии коротких прочтений [20].
Обнаружение модифицированных оснований
Модифицированные основания (например, 5-метилцитозин, N6-метилированный аденин) обнаружены практически у всех изученных организмов. Специфические роли многих оснований полностью не изучены; однако известно, что они влияют на экспрессию генов и (у прокариот) защищают от бактериофагов и, предположительно, влияют на устойчивость к антибиотикам.
При традиционной технологии секвенирования при помощи коротких прочтений из-за необходимости в амплификации нуклеиновых кислот эти модифицированные основания удаляются и их нельзя обнаружить без дополнительных методов обработки проб, занимающих много времени и часто неэффективных [22, 23].
Нанопоровое секвенирование не требует амплификации или синтеза цепей, таким образом, и исходное, и модифицированное основание можно обнаружить в одном цикле секвенирования в реальном времени. Таким способом обнаружены псевдоуридин, N6-метиладенозин (m6A), 5-метилцитозин (5mC) и 7-метилгуанозин (m7G).
ПРАКТИЧЕСКОЕ ПРИМЕНЕНИЕ НАНОПОРОВОГО СЕКВЕНИРОВАНИЯ
Сборка бактериального генома и плазмид
Проблема полной сборки генома с помощью традиционных технологий коротких прочтений подробно описана в литературе [6, 7]. Так как большинство геномных сборок создано по технологии коротких прочтений, существуют тысячи бактериальных штаммов с неполными геномными последовательностями, которые теперь можно дополнить с помощью сочетания данных нанопорового секвенирования длинных прочтений и стратегии гибридной сборки.
Чтобы решить проблему экономической эффективности при полной сборке большого количества геномов, д-р Райан Уик (Dr. R. Wick) из университета Мельбурна изобрел стратегию мультиплексного нанопорового секвенирования с низким покрытием, позволяющую исследовать до 12 штаммов в одном цикле [24]. Кроме того, он разработал сборщик Unicycler 40 для преодоления ограничений, присущих гибридным сборщикам при работе с прочтениями с низким покрытием и кольцевыми бактериальными хромосомами.
Применение этой стратегии к штамму Klebsiella pneumoniae позволило научной группе получить полную информацию о бактериальных хромосомах и плазмидах с высокоточным распознаванием оснований. Удалось установить расположение генов друг относительно друга, а также определить, какие из них расположены в плазмидах, а какие – в хромосоме, что исключительно важно для отслеживания горизонтального переноса генов [24].
Сборка de novo и определение характеристик лекарственной устойчивости ВГЧ‑1
Примерно 60–90% населения инфицировано вирусом герпеса человека первого типа (ВГЧ‑1)46. Для большинства инфекция бессимптомна, однако до 45% населения страдает от периодических высыпаний на губах [25]. Хотя существует ряд препаратов для лечения ВГЧ‑1, он, как и все вирусы склонен к мутациям. ВГЧ‑1 – крупный вирус, содержащий двухцепочечную ДНК (152 тыс. п. о.), со структурно сложным и богатым ГЦ-геномом. Это делает сборку полного генома ВГЧ‑1 по данным секвенирования коротких прочтений технически сложной.
Для улучшения сборки и анализа генома ВГЧ‑1, установления особенностей мутаций, обусловливающих устойчивость к лекарствам, исследователи из Оксфордского университета (Великобритания) и организации общественного здравоохранения Англии объединили данные нанопорового секвенирования с результатами секвенирования коротких прочтений [28]. Проанализировано 18 образцов ВГЧ‑1 от пациентов с ослабленным иммунитетом, получающих противовирусную терапию. Для сборки генома использовали инструменты MIRA [26] и LINKS [27]. Длина прочтений при нанопоровом секвенировании позволила объединить разделенные повторяющимися элементами контиги, полученные с помощью коротких прочтений, и создать усовершенствованные геномные сборки, о чем говорит меньшее количество контигов и увеличенные значения N50 (табл. 1).
Научной группе удалось охарактеризовать области структурных различий, в том числе удвоений, делеций и перестроек. Кроме того, обнаружена высокая степень вариабельности нуклеотидов в гене UL23, в котором происходит большинство мутаций, влияющих на устойчивость к лекарствам. Ученые предположили, что эти вариации, скорее всего, возникли во время противовирусной терапии, которую проводили до начала исследований [28].
Авторы работы пришли к выводу, что нанопоровое секвенирование позволяет усовершенствовать сборку вирусного генома de novo при отсутствии эталонного генома, и пройти через повторяющиеся элементы, которыми оканчиваются контиги, полученные с помощью платформ секвенирования коротких прочтений [28].
Быстрое секвенирование РНК-геномов вирусов
Содержащие одноцепочечную РНК энтеровирусы (ЭВ) вызывают миллионы случаев заболеваний у людей во всем мире ежегодно. Клинические проявления инфекции разнообразны и могут варьировать от простой боли в горле до более серьезных состояний, таких как бронхит и пневмония. Самый распространенный метод стандартной идентификации имеющих клиническое значение вирусов – ПЦР. И все же, точечные мутации и явления рекомбинации, часто встречающиеся в вирусных геномах, потенциально способны привести к ложноотрицательным результатам при применении техники ПЦР. Кроме того, текущие техники обнаружения требуют культивирования вируса, что обычно занимает 5–10 дней и значительно замедляет получение результата. Чтобы преодолеть эти сложности, д-р Албан Раметте (Dr. Alban Ramette) и его научная группа из Бернского университета (Швейцария) оценили возможности нанопорового секвенирования кДНК и прямого секвенирования РНК для получения полных геномных последовательностей энтеровирусов из клинических образцов [10].
С помощью вирусной кДНК, полученной из образца после культивирования, удалось получить консенсусные последовательности с точностью 98,8% всего через несколько минут после начала секвенирования. "Полировка" последовательности с использованием инструмента nanopolish [29] дополнительно повысила точность до 99,8%.
Прямое секвенирование РНК, не требующее обратной транскрипции или амплификации, особенно удобно для получения быстрого результата, например, определения характеристик возбудителя. Метод подготовки проб для прямого секвенирования РНК, использовавшийся в Бернском Университете, занял всего 5,5 ч по сравнению с 23 часами, необходимыми для метода с кДНК [10].
В попытке дополнительно упростить процедуру был получен образец РНК для прямого секвенирования из образца кала без предварительного культивирования вируса. Хотя при этой методологии пробоподготовки получено всего 140 нг РНК, что несколько ниже рекомендованного начального количества 500 нг, научной группе удалось секвенировать и собрать полный геном вируса Коксаки на основе 11 прочтений, в целом длиной более 1 000 оснований. Кроме того, показано, что одно прочтение 7 208 оснований охватывает почти весь геном. В частности, оказалось пропущено всего 25 и 109 оснований с 5’ и 3’ концов последовательности при сравнении с эталонной для вируса Коксаки.
Подводя итог работе, авторы пришли к выводу, что секвенирование кДНК дает чувствительность, равную ПЦР, тогда как прямое секвенирование РНК позволяет получить результат быстрее всего и без погрешностей, обусловленных амплификацией или обратной транскрипцией.
Понимание эволюции крупных
ДНК-содержащих вирусов
Исследователи из университета Юты (США) использовали полногеномное секвенирование на основе нанопор для понимания эволюционных механизмов крупных ДНК-содержащих вирусов, действующих во время конфликта хозяина-патогена. Как и другие вирусы, содержащие двухцепочечную ДНК (дцДНК), вакцинный ортопоксвирус способен к быстрой адаптации, несмотря на относительно низкую частоту однонуклеотидных мутаций (по сравнению с вирусами, содержащими одноцепочечную ДНК или РНК). Предыдущие исследования вируса выявили два белка, E3L и K3L, подавляющие ответ хозяина на инфекцию [30,31]. Показано, что делеция гена E3L и последующие пересевы на клеточные линии человека для стимуляции конфликта хозяина-патогена приводит к удвоению гена K3L в длинных тандемных повторах. Кроме того, показано, что в гене K3L этих штаммов с делецией K3L присутствует однонуклеотидный вариант (кодирующий замену аминокислоты H47R), обусловливающий повышенную патогенность.
Платформы для секвенирования с использованием коротких прочтений могут дать информацию о частоте аллеля H47R на популяционном уровне и изменениях локуса K3L в целом. Однако они не позволяют генотипировать точечные мутации в тандемных повторах или установить изменения в числе копий. Чтобы понять механизмы возникновения этих определенных адаптаций во время эволюции вируса, научная группа обратилась к секвенированию длинных прочтений с помощью нанопоровой технологии, позволяющей охватить содержащие повторы длинные области ДНК. Результаты показали, что, хотя увеличение числа копий стабилизируется к десятому пересеву (до 15 копий), ОНП H47R накапливаются с низкой частоты при пересеве 10 до почти фиксированного количества при пересеве 20 (рис. 6) [32]. Сочетание двух генетических изменений также повышает приспособляемость вируса сильнее, чем каждое из изменений по отдельности. Предложен новый механизм эволюции вируса, когда редкие благоприятные варианты быстро закрепляются с помощью множественных копий гена.
Работа показала возможности секвенирования длинных повторов для анализа сложной динамики генома высокого разрешения. Этот тип анализа дает основу для окончательного определения содержания последовательности тандемных удвоений гена и точной идентификации вариантов в пределах этих удвоений [32]. Сейчас научная группа планирует использовать длинные прочтения с помощью нанопор для изучения поэтапной эволюции варианта.
Быстрое секвенирование плазмид и обнаружение генов устойчивости
Полирезистентные бактерии представляют собой растущую угрозу для общественного здравоохранения. Многие гены устойчивости к антибиотикам расположены в плазмидах; однако секвенирование плазмид с помощью традиционной технологии коротких прочтений затрудняется наличием большого количества повторов в ДНК. Кроме того, длина бактериальных плазмид может достигать сотен тысяч пар оснований, что дополнительно осложняет точную сборку.
Применение методов коротких прочтений дает неполные, фрагментированные плазмидные сборки, которые часто невозможно дифференцировать от геномной последовательности. Понимание местоположения генов устойчивости к антибиотикам (в плазмиде или геноме) может дать возможность более обоснованного эпидемиологического наблюдения и новую информацию об эволюции и передаче механизмов, лежащих в основе развития устойчивости к антибиотикам [13–15]. Исследователи из Национального Института Здравоохранения, США, в настоящее время применяют нанопоровое секвенирование для совершенствования сборки плазмид с целью быстрого определения особенностей устойчивости к антибиотикам.
Сначала научная группа секвенировала плазмидную ДНК хорошо описанного устойчивого к карбапенему штамма Klebsiella pneumoniae с помощью набора для подготовки библиотек ДНК на основе лигирования (Oxford Nanopore). Сборка длинных прочтений с помощью нанопор дала точность полученной последовательности 99%.
Точность можно повысить до 99,9% путем полировки прочтений, полученных по технологии коротких прочтений; однако исследователи заключили, что для возможного будущего клинического применения они предпочитают только прочтения по нанопоровой технологии в связи с сокращением времени исследования.
Покрытие всех трех известных плазмид в штамме после сборки составило 98%, и все гены устойчивости были правильно идентифицированы.
Для оценки минимального времени, необходимого для подробной идентификации гена устойчивости, исследователи секвенировали плазмидную ДНК из второго штамма K. pneumoniae с использованием набора для быстрого секвенирования на основе транспозона (Oxford Nanopore). С помощью этой стратегии стало возможно получить полный результат определения гена устойчивости к антибиотикам менее чем за 6 ч [15].
Использование плазмидной ДНК позволило проводить секвенирование с меньшим покрытием, а сборки, достаточные для полного описания гена устойчивости к антибиотикам, были получены всего за 2 000–5 000 прочтений, для чего достаточно 20 минут секвенирования [15].
Нанопоровое секвенирование плазмидной ДНК для профилирования устойчивости к антибиотикам также показано исследователями из Шэньчжэньского научно-исследовательского института (Китай), которые использовали штрих-кодирование для экономически эффективного мультиплексного анализа 12 полирезистентных бактериальных штаммов [14]. Их работа позволила создать 20 полных плазмид (и одну почти полную плазмиду) за один восьмичасовой цикл секвенирования. Следует отметить, что одна плазмида >90 тыс. п. о. была проанализирована полностью за одно прочтение и, следовательно, сборка не потребовалась.
Исследователи также указали на возможность многократных циклов секвенирования в одной нанопоровой проточной ячейке в течение 48 ч с начала первого цикла. Они полагают, что в одной проточной ячейке можно провести два цикла, каждый по 8, 10 и 12 ч, соответственно. При сочетании со штрихкодированием можно секвенировать в целом 36 образцов, что приводит к значительному снижению стоимости получения полных плазмидных последовательностей.
ВЫВОДЫ
Микроорганизмы распространены повсеместно и составляют важную часть всех экосистем. Чтобы хорошо понимать степень их влияния на здоровье людей и окружающую среду, необходимо полностью изучить их свойства и возможности. Высокопроизводительные технологии секвенирования коротких прочтений улучшили возможности обнаружения и анализа микробов, но присущие этим методам ограничения вызывают значительные сложности при сборке и анализе геномов. Непосредственное секвенирование длинных прочтений в реальном времени, ставшее возможным благодаря нанопоровой технологии, позволяет преодолеть многие проблемы, проникая в самую сущность микроорганизмов. Этот метод, как никогда ранее дает возможность сборки полного генома, быстрого профилирования устойчивости к антибиотикам и вирулентности, а также обнаружения модифицированных оснований. Как заявил профессор Ник Ломан (N. Loman) из университета Бирмингема (Великобритания): "…мы находимся на новом рубеже полногеномной реконструкции с использованием метагеномной сборки на основании секвенирования длинных прочтений" [33].
ЛИТЕРАТУРА / REFERENCES
1. Locey K. J. and Lennon J. T. Scaling laws predict global microbial diversity // Proc Natl Acad Sci USA 2016. V. 113(21) P. 5970–5975.
2. NCBI National Center for Biotechnology Information. Genomes information by organism. Available at: <www.ncbi.nlm.nih.gov/genome/browse/#!/overview/> [Accessed: 21 February 2018].
3. Land M. et al. Insights from 20 years of bacterial genome sequencing // Funct Integr Genomics 2015. V. 15(2). P. 141–161.
4. van Dijk E. L., Auger H., Jaszczyszyn Y., Thermes C. Ten years of next-generation sequencing technology // Trends in Genetics. 2014. V. 30 (9). P. 418–426].
5. https://biomolecula.ru/authors/4614
6. Duc Cao M. et al. Scaffolding and completing genome assemblies in real-time with nanopore sequencing // Nature Communications 2017. 8. 14515 doi: 10.1038/ncomms14515.
7. Tyson, J.R. et al. MinION-based long-read sequencing and assembly extends the Caenorhabditis elegans reference genome // Genome Res. 2018. V. 28(2). P. 266–274.
8. Hultqvist J. J. Nanopore sequencing for genomics of heterotrophic protists. Presentation. Available at: <www.vimeo.com/250451494> [Accessed 08 February 2018].
9. Kellog E. A. Genome sequencing: Long reads for a short plant // Nature Plants 2015. 1. 15169.
10. Ramette A. Applications of nanopore sequencing to whole genome sequencing of human viruses in the clinical setting. [online] Available at: <www.vimeo.com/252171562> [Accessed: 13 February 2018].
11. Oxford Nanopore Technologies. Oxford Nanopore launches analysis workflow for antimicrobial resistance. [online] Available at: www.nanoporetech.com/about-us/news/oxfordnanopore-launches-analysis-workflow-antimicrobialresistance [Accessed: 28 February 2018].
12. Votintseva A. A. et al. Same-day diagnostic and surveillance data for tuberculosis via whole genome sequencing of direct respiratory samples. J Clin Microbiol 2017. V. 55(5). P. 1285–1298.
13. Wick R. R., Judd L. M., Gorrie C. L. and Holt K. E. Completing bacterial genome assemblies with multiplex MinION sequencing // bioRxiv 160614 (2017).
14. Li R. et al. Efficient generation of complete sequences of MDR-encoding plasmids by rapid assembly of MinION barcoding sequencing data // GigaScience gix132 (2018).
15. Lemon J.K, Khil P.P, Frank K. M. & Dekker J. P. Rapid nanopore sequencing of plasmids and resistance gene detection in clinical isolates. Journal of Clinical Microbiology. 2017 V. 55(12). P. 3530–3543. doi: 10.1128/JCM.01069–17.
16. Ashton, P. M. MinION nanopore sequencing identifies the position and structure of a bacterial antibiotic resistance island // Nature Biotechnology. 2015. V. 33, P. 296–300. doi.org/10.1038/nbt.3103.
17. Schmidt H. & Hensel M. Pathogenicity islands in bacterial pathogenesis. Clin Microbiol Rev. 2004. V. 17(1). P. 14–56.
18. Ricker N., Qian H., and Fulthorp R. R. The limitations of draft assemblies for understanding prokaryotic adaptation and evolution. Genomics. 100(3):167–75 (2012).
19. Castro-Wallace S.L. et al. Nanopore DNA sequencing and genome assembly on the International Space Station // Scientific Reports. 7 18022 (2017). doi.org/10.1038/s41598–017–18364–0.
20. Wilson J. W. et al. Space flight alters bacterial gene expression and virulence and reveals a role for global regulator // Hfq. Proc Natl Acad Sci USA. 2007. V. 104. P. 16299–16304.
21. Keller M. Direct RNA sequencing of influenza viral RNA using the MinION. Presentation. Available at: <www.vimeo.com/250295802> [Accessed 13 February 2019].
22. Smith A. M. et al. Reading canonical and modified nucleotides in 16S ribosomal RNA using nanopore direct RNA sequencing. bioRxiv 132274 (2017).
23. Euskirchen, P. et al. Same-day genomic and epigenomic diagnosis of brain tumors using real-time nanopore sequencing // Acta Neuropathol. 2017. V. 134(5). P. 691–703.
24. Wick R. Hybrid Nanopore and Illumina assembly: working towards the perfect bacterial genome. Presentation. Available at: <www.vimeo. com/219736365> [Accessed: 15 February 2018].
25. Harmenberg J., Oberg B. & Spruance S. Prevention of ulcerative lesions by episodic treatment of recurrent herpes labialis: A literature review // Acta dermato-venereologica. 2010. V. 90(2). P. 122–130.
26. GitHub. MIRA. Available at: <www.github.com/mira> [Accessed: 25 February 2018].
27. Warren R. L. et al. LINKS: Scalable, alignmentfree scaffolding of draft genomes with long reads // Gigascience. 4:35 (2015). doi.org/10.1186/s13742-015-0076-3.
28. Karamitros T. et al. De novo assembly of Human Herpes Virus Type 1 (HHV‑1) genome, mining of noncanonical structures and detection of novel drug-resistance mutations using short- and longread next generation sequencing technologies. PLoS One 11(6) (2016). doi.org/10.1371/journal.pone.0157600
29. GitHub. Nanopolish. Available at: <www.github.com/jts/nanopolish> [Accessed: 25 February 2018].
30. Beattie E. et al. Reversal of the interferon-sensitive phenotype of a vaccinia virus lacking E3L by expression of the reovirus S4 gene // J Virol 1995. V. 69. P. 499–505.
31. Elde, N.C. et al. Poxviruses deploy genomic accordions to adapt rapidly against host antiviral defenses // Cell. 2012. V. 150. P. 831–841. doi:10.1016/j. cell.2012.05.049 (2012).
32. Sasani T. A., Cone K. R., Quinlan A. R., & Elde N. C. Long read sequencing reveals poxvirus evolution through rapid homogenization of gene arrays // bioRxiv 245373 (2018).
33. Loman, N. [Twitter] 1 December 2018. Available from: www.twitter.com/pathogenomenick/status/936636777078710272 [Accessed: 21 March 2018.
С появлением современных технологий секвенирования для высокопроизводительного геномного анализа, особенно для ранее не культивировавшихся микроорганизмов, резко возросли возможности идентификации и описания их свойств. Сегодня общедоступны геномные последовательности примерно 150 000 микробных штаммов [2]. Однако в связи с ограничениями, присущими традиционным технологиям секвенирования на основе коротких прочтений, большая часть наших знаний о микробных геномах основывается на неполных данных. Полагают, что примерно 90% бактериальных геномов определено не полностью [3]. Разработано несколько способов секвенирования, самый популярный и надежный из них – секвенирование по Сэнгеру – позволяет "считывать" последовательности до 1 000 пар оснований (п. о.) и используется для небольших фрагментов генома / генов или для подтверждения результатов более современного секвенирования нового поколения (next-generation sequencing, NGS), когда размер одного прочитанного фрагмента варьирует от 25 до 500 п. о. Методы NGS используют для многократного прочтения генетического материала, которое необходимо, например, для ресеквенирования и сборки новых геномов (de novo), транскриптомных и эпигеномных исследований [4, 5]. Помимо этого, NGS-секвенирование значительно производительнее, поэтому возможно определение последовательности сразу десятков геномов (в зависимости от их размера) за один запуск прибора.
Одно из перспективных направлений развития методов секвенирования реализовано в приборах Британской компании Oxford Nanopore Technologies на основе нанопоровой технологии. Принцип действия заключается в использовании прочной мембраны, в которой расположены поры диаметром несколько нанометров. С помощью белковой инженерии размер нанопор можно подбирать под конкретные исследуемые молекулы. К реакционной камере секвенатора прикладывается напряжение, которое вызывает движение ионов и молекул ДНК и РНК через единичные поры в поверхности мембраны. При этом сила тока изменяется, поскольку основания G, A, T и C проходят через поры в разных комбинациях. Обработав результаты, можно расшифровать последовательность оснований, прошедших через пору.
Характерной особенностью нанопоровых секвенаторов является их сверхкомпактность. Например, самый портативный секвенатор MiniION весит всего 100 г и работает от USB 3.0 обычного компьютера или ноутбука (рис.2). Оригинальная платформа MinION может дать десятки Гб данных на цикл, тогда как два других прибора, GridION X5 и PromethION, дают сотни и тысячи Гб данных соответственно. GridION использует ту же нанопоровую технологию, вмещает до 5 проточных ячеек с 512 каналами в каждой, а PromethION размещает до 48 проточных ячеек с 3000 каналами в каждой. Каждая проточная ячейка работает независимо, поэтому их число можно выбрать для конкретного анализа, чтобы выполнять разные эксперименты параллельно. GridION X5 и PromethION доступны без капитальных затрат – необходимо приобретать только расходные материалы для эффективной работы с возможностью масштабирования. Портативное устройство MinION можно использовать везде, в том числе в условиях ограниченных ресурсов или в отдаленных местах, поэтому оно идеально подходит для анализа непосредственно в очаге возникновения инфекции. Настольные устройства GridION X5 и PromethION подходят для ситуаций с большим потоком проб для анализа.
ПРЕИМУЩЕСТВА НАНОПОРОВОГО СЕКВЕНИРОВАНИЯ ДЛЯ МИКРОБИОЛОГИЧЕСКОГО АНАЛИЗА
Сборка генома
Для реального понимания разнообразия микроорганизмов обязательно создание полного и подробно описанного генома. Области повторов и структурные вариации выполняют важные функции в геноме, в том числе влияют на развитие и распространение устойчивости к антибиотикам и факторов вирулентности [3, 6]. Известно, что технологии секвенирования с помощью коротких ридов, использующиеся для создания большинства эталонных геномов, связаны с проблемой разрешения таких областей [6, 7] (рис.3). По этим причинам большинство эталонных геномов неполные и содержат пробелы, где секвенирование или выравнивание невозможно.
В противоположность традиционным платформам, которые обычно работают с короткими (<300 п. о.) фрагментами ДНК, нанопоровая технология секвенирования позволяет читать фрагменты ДНК, проходящие через пору, независимо от их размера. Цепочки длиной в сотни тысяч пар оснований анализируются в обычном порядке, а длина прочитанных фрагментов превышает 1 Мб. Очевидно, что такие длинные прочтения с бóльшей вероятностью охватят полные области ДНК с повторяющимися последовательностями и структурные варианты, давая возможность более полной сборки генома без пробелов [7–9] (рис.4).
Длинные прочтения последовательностей дают дополнительное преимущество, так как обеспечивают лучшее перекрывание между ридами и облегчают сборку фрагментов ДНК в правильном порядке. Это можно представить в виде головоломки-мозаики: чем крупнее фрагменты, тем легче головоломка.
Благодаря ультрадлинным нанопоровым ридам теперь реально секвенировать полный вирусный геном за одно прочтение, полностью устранив необходимость в сборке [10]. В перспективе, по мере разработки протоколов пробоподготовки и создания более длинных цельных молекул ДНК и РНК, станет возможным секвенировать даже крупные геномы за одно прочтение.
Профилирование устойчивости к антибиотикам
Согласно ВОЗ, устойчивость к антибиотикам является чрезвычайной глобальной проблемой здравоохранения, серьезно угрожающей прогрессу современной медицины. Поэтому очень нужны технологии точного и быстрого определения свойств выделенных возбудителей для получения данных об их эволюции и передаче устойчивости к лекарствам, а также лучшего понимания потенциальных стратегий лечения. Нанопоровое секвенирование дает оптимизированный подход к профилированию устойчивости к антибиотикам, как в практических условиях, так и в лаборатории.
В отличие от традиционной технологии секвенирования, при которой все данные становятся доступны в конце цикла, значительное преимущество нанопорового секвенирования заключается в возможности анализа данных в реальном времени. В дополнение к резкому сокращению времени ожидания результата, в режиме онлайн сразу подтверждается правильность сбора образцов. Кроме того, после получения необходимых данных анализ можно остановить, чтобы эффективнее использовать рабочее время.
Компания Oxford Nanopore разработала схему анализа WIMP-ARMA для идентификации микроорганизмов в реальном времени и профилирования их устойчивости к антибиотикам [11]. Эта схема заключается в выравнивании прочтений в сравнении с Всеобъемлющей базой данных устойчивости к антибиотикам (Comprehensive Antibiotic Resistance Database, CARD). В полученном по результатам анализа отчете будут отмечены те определенные при выравнивании последовательности, которые указывают на устойчивость к данному антибиотику. Схема WIMP-ARMA не требует глубоких знаний в области биоинформатики, интуитивно понятна и позволяет установить особенности устойчивости к антибиотикам.
С помощью нанопорового секвенирования удалось сократить время, необходимое для анализа устойчивости к антибиотикам у возбудителя туберкулеза Mycobacterium bovis до 12 ч вместо 8–15 недель при традиционных культуральных методах [12]. Опубликованы результаты работ по определению характеристик устойчивости к лекарствам ряда возбудителей, включая бактерии, вирусы и грибы.
Полная сборка плазмид
У бактерий гены устойчивости к антибиотикам могут переноситься с бактериальным геномом или плазмидами. Понимание местоположения этих генов проясняет механизмы передачи устойчивости между возбудителями, поэтому оно становится очень важным в эпидемиологических стратегиях отслеживания и ограничения распространения болезни [13–15].
В геноме может присутствовать большое количество ДНК-повторов, поэтому полная сборка плазмид и их дифференциация от геномных последовательностей при секвенировании с помощью коротких прочтений особенно сложна [15]. Cеквенирование очень длинных фрагментов ДНК или РНК по нанопоровой технологии охватывает области с повторами и решает проблему полной и четкой сборки плазмид и генома. Кроме того, можно быстро установить конкретное местоположение генов устойчивости, получив более подробную информацию об их передаче и эволюции [13, 14].
Эксперимент, проведенный Li и др. [14], показал, что единичное нанопоровое прочтение штамма Escherichia coli, устойчивого к карабапенему, охватывает всю плазмиду длиной >90 тыс. п. о. Размеры бактериальных плазмид крайне разнообразны и варьируют от 1 до 100 тыс. п. о. При нанопоровой технологии длина прочтения ограничена только размером фрагмента ДНК, проходящим через пору. Теоретически возможно секвенировать даже крупнейшие плазмиды за единичные прочтения. Такой сценарий устраняет необходимость в сборке, упрощая ход анализа.
Вирулентность
Гены вирулентности часто сгруппированы в острова патогенности (ОП), которые могут быть встроены в геном или расположены вне хромосом (т. е. в плазмидах). Так же как гены устойчивости к антибиотикам, ОП часто граничат со вставками, содержащими повторы и облегчающими перемещение в пределах одного вида и между видами [16, 17] (рис.5).
Большие размеры ОП (обычно 10–200 тыс. п. о.) в сочетании с повторами делают их точный анализ с помощью техник коротких прочтений особенно сложным [6, 18]. Гены мобильности, такие как интегразы (int), часто расположены в начале острова близко к локусу тДНК или соответствующему месту прикрепления (см. рис.5). ОП содержат гены вирулентности (от В1 до В4) и часто перемежаются мобильными элементами, такими как перемещающиеся встроенные элементы / последовательности, которые могут быть полными или частичными. ОП часто ограничены прямыми повторами (ПП), которые используются при процессах вставки и делеции [17]. Нанопоровое секвенирование позволяет за одно прочтение полностью достоверно охарактеризовать и установить местоположение ОП.
Изучение вирулентности микроорганизмов актуально не только в традиционной медицине, но и вне земной атмосферы, например, в условиях космических полетов [19]. Научные наблюдения показали возможность повышения патогенности микроорганизмов в космическом корабле [20]. В качестве первого шага к пониманию причин этого явления научная группа NASA (США) использовала нанопоровую технологию для успешного секвенирования и анализа метагеномного образца на борту Международной космической станции. Возможно, что в будущем нанопоровое секвенирование будет применяться для изучения эволюции микроорганизмов, диагностики с целью правильного подбора лечения инфекции во время полетов и даже для поиска внеземной жизни.
РНК-геномы
РНК-содержащие вирусы лишены механизмов "вычитки", которые обычно есть у организмов с геномом на основе ДНК и, следовательно, частота мутаций у них намного выше. Такая высокая частота ошибок дает эволюционное преимущество, позволяя РНК-вирусам быстро приспосабливаться, чтобы избегать иммунного ответа организма хозяина на инфекцию и последующей противовирусной терапии. Неудивительно, что многие вновь появляющиеся вирусные заболевания человека вызваны РНК-вирусами, например, эбола, тяжелый острый респираторный синдром (ТОРС), чикунгунья, лихорадка Западного Нила, грипп. Поэтому своевременный быстрый и точный анализ генома этих микроорганизмов настоятельно необходим.
Важно провести подробный анализ генома, генетического и географического происхождения болезни, а также выявить новые варианты, усиливающие вирулентность и обеспечивающие возможность распространения между видами или передачи от человека к человеку.
Секвенирование кДНК-копий РНК-геномов вирусов стало движущей силой многих важных открытий, однако общеизвестно, что процесс превращения РНК в кДНК путем обратной транскрипции и амплификации может стать источником погрешности. Как утверждает д-р Мэттью Келлер (Dr. Matthew Keller), научный сотрудник ORISE Центра контроля и профилактике болезней (США): "Бóльшая часть наших знаний о биологии РНК видится через линзу кДНК" [21].
Недавно компания Oxford Nanopore предложила способ непосредственного секвенирования РНК с помощью нанопоровой технологии, сочетающей преимущества длинных прочтений для полного охвата генома со сниженной погрешностью по сравнению с методами коротких прочтений кДНК. Удалось полностью секвенировать РНК-геном вируса гриппа А, причем каждый из восьми сегментов генома представляет собой полную длину прочтения. Такой анализ занимает всего один день вместо нескольких дней при стандартной технологии коротких прочтений [20].
Обнаружение модифицированных оснований
Модифицированные основания (например, 5-метилцитозин, N6-метилированный аденин) обнаружены практически у всех изученных организмов. Специфические роли многих оснований полностью не изучены; однако известно, что они влияют на экспрессию генов и (у прокариот) защищают от бактериофагов и, предположительно, влияют на устойчивость к антибиотикам.
При традиционной технологии секвенирования при помощи коротких прочтений из-за необходимости в амплификации нуклеиновых кислот эти модифицированные основания удаляются и их нельзя обнаружить без дополнительных методов обработки проб, занимающих много времени и часто неэффективных [22, 23].
Нанопоровое секвенирование не требует амплификации или синтеза цепей, таким образом, и исходное, и модифицированное основание можно обнаружить в одном цикле секвенирования в реальном времени. Таким способом обнаружены псевдоуридин, N6-метиладенозин (m6A), 5-метилцитозин (5mC) и 7-метилгуанозин (m7G).
ПРАКТИЧЕСКОЕ ПРИМЕНЕНИЕ НАНОПОРОВОГО СЕКВЕНИРОВАНИЯ
Сборка бактериального генома и плазмид
Проблема полной сборки генома с помощью традиционных технологий коротких прочтений подробно описана в литературе [6, 7]. Так как большинство геномных сборок создано по технологии коротких прочтений, существуют тысячи бактериальных штаммов с неполными геномными последовательностями, которые теперь можно дополнить с помощью сочетания данных нанопорового секвенирования длинных прочтений и стратегии гибридной сборки.
Чтобы решить проблему экономической эффективности при полной сборке большого количества геномов, д-р Райан Уик (Dr. R. Wick) из университета Мельбурна изобрел стратегию мультиплексного нанопорового секвенирования с низким покрытием, позволяющую исследовать до 12 штаммов в одном цикле [24]. Кроме того, он разработал сборщик Unicycler 40 для преодоления ограничений, присущих гибридным сборщикам при работе с прочтениями с низким покрытием и кольцевыми бактериальными хромосомами.
Применение этой стратегии к штамму Klebsiella pneumoniae позволило научной группе получить полную информацию о бактериальных хромосомах и плазмидах с высокоточным распознаванием оснований. Удалось установить расположение генов друг относительно друга, а также определить, какие из них расположены в плазмидах, а какие – в хромосоме, что исключительно важно для отслеживания горизонтального переноса генов [24].
Сборка de novo и определение характеристик лекарственной устойчивости ВГЧ‑1
Примерно 60–90% населения инфицировано вирусом герпеса человека первого типа (ВГЧ‑1)46. Для большинства инфекция бессимптомна, однако до 45% населения страдает от периодических высыпаний на губах [25]. Хотя существует ряд препаратов для лечения ВГЧ‑1, он, как и все вирусы склонен к мутациям. ВГЧ‑1 – крупный вирус, содержащий двухцепочечную ДНК (152 тыс. п. о.), со структурно сложным и богатым ГЦ-геномом. Это делает сборку полного генома ВГЧ‑1 по данным секвенирования коротких прочтений технически сложной.
Для улучшения сборки и анализа генома ВГЧ‑1, установления особенностей мутаций, обусловливающих устойчивость к лекарствам, исследователи из Оксфордского университета (Великобритания) и организации общественного здравоохранения Англии объединили данные нанопорового секвенирования с результатами секвенирования коротких прочтений [28]. Проанализировано 18 образцов ВГЧ‑1 от пациентов с ослабленным иммунитетом, получающих противовирусную терапию. Для сборки генома использовали инструменты MIRA [26] и LINKS [27]. Длина прочтений при нанопоровом секвенировании позволила объединить разделенные повторяющимися элементами контиги, полученные с помощью коротких прочтений, и создать усовершенствованные геномные сборки, о чем говорит меньшее количество контигов и увеличенные значения N50 (табл. 1).
Научной группе удалось охарактеризовать области структурных различий, в том числе удвоений, делеций и перестроек. Кроме того, обнаружена высокая степень вариабельности нуклеотидов в гене UL23, в котором происходит большинство мутаций, влияющих на устойчивость к лекарствам. Ученые предположили, что эти вариации, скорее всего, возникли во время противовирусной терапии, которую проводили до начала исследований [28].
Авторы работы пришли к выводу, что нанопоровое секвенирование позволяет усовершенствовать сборку вирусного генома de novo при отсутствии эталонного генома, и пройти через повторяющиеся элементы, которыми оканчиваются контиги, полученные с помощью платформ секвенирования коротких прочтений [28].
Быстрое секвенирование РНК-геномов вирусов
Содержащие одноцепочечную РНК энтеровирусы (ЭВ) вызывают миллионы случаев заболеваний у людей во всем мире ежегодно. Клинические проявления инфекции разнообразны и могут варьировать от простой боли в горле до более серьезных состояний, таких как бронхит и пневмония. Самый распространенный метод стандартной идентификации имеющих клиническое значение вирусов – ПЦР. И все же, точечные мутации и явления рекомбинации, часто встречающиеся в вирусных геномах, потенциально способны привести к ложноотрицательным результатам при применении техники ПЦР. Кроме того, текущие техники обнаружения требуют культивирования вируса, что обычно занимает 5–10 дней и значительно замедляет получение результата. Чтобы преодолеть эти сложности, д-р Албан Раметте (Dr. Alban Ramette) и его научная группа из Бернского университета (Швейцария) оценили возможности нанопорового секвенирования кДНК и прямого секвенирования РНК для получения полных геномных последовательностей энтеровирусов из клинических образцов [10].
С помощью вирусной кДНК, полученной из образца после культивирования, удалось получить консенсусные последовательности с точностью 98,8% всего через несколько минут после начала секвенирования. "Полировка" последовательности с использованием инструмента nanopolish [29] дополнительно повысила точность до 99,8%.
Прямое секвенирование РНК, не требующее обратной транскрипции или амплификации, особенно удобно для получения быстрого результата, например, определения характеристик возбудителя. Метод подготовки проб для прямого секвенирования РНК, использовавшийся в Бернском Университете, занял всего 5,5 ч по сравнению с 23 часами, необходимыми для метода с кДНК [10].
В попытке дополнительно упростить процедуру был получен образец РНК для прямого секвенирования из образца кала без предварительного культивирования вируса. Хотя при этой методологии пробоподготовки получено всего 140 нг РНК, что несколько ниже рекомендованного начального количества 500 нг, научной группе удалось секвенировать и собрать полный геном вируса Коксаки на основе 11 прочтений, в целом длиной более 1 000 оснований. Кроме того, показано, что одно прочтение 7 208 оснований охватывает почти весь геном. В частности, оказалось пропущено всего 25 и 109 оснований с 5’ и 3’ концов последовательности при сравнении с эталонной для вируса Коксаки.
Подводя итог работе, авторы пришли к выводу, что секвенирование кДНК дает чувствительность, равную ПЦР, тогда как прямое секвенирование РНК позволяет получить результат быстрее всего и без погрешностей, обусловленных амплификацией или обратной транскрипцией.
Понимание эволюции крупных
ДНК-содержащих вирусов
Исследователи из университета Юты (США) использовали полногеномное секвенирование на основе нанопор для понимания эволюционных механизмов крупных ДНК-содержащих вирусов, действующих во время конфликта хозяина-патогена. Как и другие вирусы, содержащие двухцепочечную ДНК (дцДНК), вакцинный ортопоксвирус способен к быстрой адаптации, несмотря на относительно низкую частоту однонуклеотидных мутаций (по сравнению с вирусами, содержащими одноцепочечную ДНК или РНК). Предыдущие исследования вируса выявили два белка, E3L и K3L, подавляющие ответ хозяина на инфекцию [30,31]. Показано, что делеция гена E3L и последующие пересевы на клеточные линии человека для стимуляции конфликта хозяина-патогена приводит к удвоению гена K3L в длинных тандемных повторах. Кроме того, показано, что в гене K3L этих штаммов с делецией K3L присутствует однонуклеотидный вариант (кодирующий замену аминокислоты H47R), обусловливающий повышенную патогенность.
Платформы для секвенирования с использованием коротких прочтений могут дать информацию о частоте аллеля H47R на популяционном уровне и изменениях локуса K3L в целом. Однако они не позволяют генотипировать точечные мутации в тандемных повторах или установить изменения в числе копий. Чтобы понять механизмы возникновения этих определенных адаптаций во время эволюции вируса, научная группа обратилась к секвенированию длинных прочтений с помощью нанопоровой технологии, позволяющей охватить содержащие повторы длинные области ДНК. Результаты показали, что, хотя увеличение числа копий стабилизируется к десятому пересеву (до 15 копий), ОНП H47R накапливаются с низкой частоты при пересеве 10 до почти фиксированного количества при пересеве 20 (рис. 6) [32]. Сочетание двух генетических изменений также повышает приспособляемость вируса сильнее, чем каждое из изменений по отдельности. Предложен новый механизм эволюции вируса, когда редкие благоприятные варианты быстро закрепляются с помощью множественных копий гена.
Работа показала возможности секвенирования длинных повторов для анализа сложной динамики генома высокого разрешения. Этот тип анализа дает основу для окончательного определения содержания последовательности тандемных удвоений гена и точной идентификации вариантов в пределах этих удвоений [32]. Сейчас научная группа планирует использовать длинные прочтения с помощью нанопор для изучения поэтапной эволюции варианта.
Быстрое секвенирование плазмид и обнаружение генов устойчивости
Полирезистентные бактерии представляют собой растущую угрозу для общественного здравоохранения. Многие гены устойчивости к антибиотикам расположены в плазмидах; однако секвенирование плазмид с помощью традиционной технологии коротких прочтений затрудняется наличием большого количества повторов в ДНК. Кроме того, длина бактериальных плазмид может достигать сотен тысяч пар оснований, что дополнительно осложняет точную сборку.
Применение методов коротких прочтений дает неполные, фрагментированные плазмидные сборки, которые часто невозможно дифференцировать от геномной последовательности. Понимание местоположения генов устойчивости к антибиотикам (в плазмиде или геноме) может дать возможность более обоснованного эпидемиологического наблюдения и новую информацию об эволюции и передаче механизмов, лежащих в основе развития устойчивости к антибиотикам [13–15]. Исследователи из Национального Института Здравоохранения, США, в настоящее время применяют нанопоровое секвенирование для совершенствования сборки плазмид с целью быстрого определения особенностей устойчивости к антибиотикам.
Сначала научная группа секвенировала плазмидную ДНК хорошо описанного устойчивого к карбапенему штамма Klebsiella pneumoniae с помощью набора для подготовки библиотек ДНК на основе лигирования (Oxford Nanopore). Сборка длинных прочтений с помощью нанопор дала точность полученной последовательности 99%.
Точность можно повысить до 99,9% путем полировки прочтений, полученных по технологии коротких прочтений; однако исследователи заключили, что для возможного будущего клинического применения они предпочитают только прочтения по нанопоровой технологии в связи с сокращением времени исследования.
Покрытие всех трех известных плазмид в штамме после сборки составило 98%, и все гены устойчивости были правильно идентифицированы.
Для оценки минимального времени, необходимого для подробной идентификации гена устойчивости, исследователи секвенировали плазмидную ДНК из второго штамма K. pneumoniae с использованием набора для быстрого секвенирования на основе транспозона (Oxford Nanopore). С помощью этой стратегии стало возможно получить полный результат определения гена устойчивости к антибиотикам менее чем за 6 ч [15].
Использование плазмидной ДНК позволило проводить секвенирование с меньшим покрытием, а сборки, достаточные для полного описания гена устойчивости к антибиотикам, были получены всего за 2 000–5 000 прочтений, для чего достаточно 20 минут секвенирования [15].
Нанопоровое секвенирование плазмидной ДНК для профилирования устойчивости к антибиотикам также показано исследователями из Шэньчжэньского научно-исследовательского института (Китай), которые использовали штрих-кодирование для экономически эффективного мультиплексного анализа 12 полирезистентных бактериальных штаммов [14]. Их работа позволила создать 20 полных плазмид (и одну почти полную плазмиду) за один восьмичасовой цикл секвенирования. Следует отметить, что одна плазмида >90 тыс. п. о. была проанализирована полностью за одно прочтение и, следовательно, сборка не потребовалась.
Исследователи также указали на возможность многократных циклов секвенирования в одной нанопоровой проточной ячейке в течение 48 ч с начала первого цикла. Они полагают, что в одной проточной ячейке можно провести два цикла, каждый по 8, 10 и 12 ч, соответственно. При сочетании со штрихкодированием можно секвенировать в целом 36 образцов, что приводит к значительному снижению стоимости получения полных плазмидных последовательностей.
ВЫВОДЫ
Микроорганизмы распространены повсеместно и составляют важную часть всех экосистем. Чтобы хорошо понимать степень их влияния на здоровье людей и окружающую среду, необходимо полностью изучить их свойства и возможности. Высокопроизводительные технологии секвенирования коротких прочтений улучшили возможности обнаружения и анализа микробов, но присущие этим методам ограничения вызывают значительные сложности при сборке и анализе геномов. Непосредственное секвенирование длинных прочтений в реальном времени, ставшее возможным благодаря нанопоровой технологии, позволяет преодолеть многие проблемы, проникая в самую сущность микроорганизмов. Этот метод, как никогда ранее дает возможность сборки полного генома, быстрого профилирования устойчивости к антибиотикам и вирулентности, а также обнаружения модифицированных оснований. Как заявил профессор Ник Ломан (N. Loman) из университета Бирмингема (Великобритания): "…мы находимся на новом рубеже полногеномной реконструкции с использованием метагеномной сборки на основании секвенирования длинных прочтений" [33].
ЛИТЕРАТУРА / REFERENCES
1. Locey K. J. and Lennon J. T. Scaling laws predict global microbial diversity // Proc Natl Acad Sci USA 2016. V. 113(21) P. 5970–5975.
2. NCBI National Center for Biotechnology Information. Genomes information by organism. Available at: <www.ncbi.nlm.nih.gov/genome/browse/#!/overview/> [Accessed: 21 February 2018].
3. Land M. et al. Insights from 20 years of bacterial genome sequencing // Funct Integr Genomics 2015. V. 15(2). P. 141–161.
4. van Dijk E. L., Auger H., Jaszczyszyn Y., Thermes C. Ten years of next-generation sequencing technology // Trends in Genetics. 2014. V. 30 (9). P. 418–426].
5. https://biomolecula.ru/authors/4614
6. Duc Cao M. et al. Scaffolding and completing genome assemblies in real-time with nanopore sequencing // Nature Communications 2017. 8. 14515 doi: 10.1038/ncomms14515.
7. Tyson, J.R. et al. MinION-based long-read sequencing and assembly extends the Caenorhabditis elegans reference genome // Genome Res. 2018. V. 28(2). P. 266–274.
8. Hultqvist J. J. Nanopore sequencing for genomics of heterotrophic protists. Presentation. Available at: <www.vimeo.com/250451494> [Accessed 08 February 2018].
9. Kellog E. A. Genome sequencing: Long reads for a short plant // Nature Plants 2015. 1. 15169.
10. Ramette A. Applications of nanopore sequencing to whole genome sequencing of human viruses in the clinical setting. [online] Available at: <www.vimeo.com/252171562> [Accessed: 13 February 2018].
11. Oxford Nanopore Technologies. Oxford Nanopore launches analysis workflow for antimicrobial resistance. [online] Available at: www.nanoporetech.com/about-us/news/oxfordnanopore-launches-analysis-workflow-antimicrobialresistance [Accessed: 28 February 2018].
12. Votintseva A. A. et al. Same-day diagnostic and surveillance data for tuberculosis via whole genome sequencing of direct respiratory samples. J Clin Microbiol 2017. V. 55(5). P. 1285–1298.
13. Wick R. R., Judd L. M., Gorrie C. L. and Holt K. E. Completing bacterial genome assemblies with multiplex MinION sequencing // bioRxiv 160614 (2017).
14. Li R. et al. Efficient generation of complete sequences of MDR-encoding plasmids by rapid assembly of MinION barcoding sequencing data // GigaScience gix132 (2018).
15. Lemon J.K, Khil P.P, Frank K. M. & Dekker J. P. Rapid nanopore sequencing of plasmids and resistance gene detection in clinical isolates. Journal of Clinical Microbiology. 2017 V. 55(12). P. 3530–3543. doi: 10.1128/JCM.01069–17.
16. Ashton, P. M. MinION nanopore sequencing identifies the position and structure of a bacterial antibiotic resistance island // Nature Biotechnology. 2015. V. 33, P. 296–300. doi.org/10.1038/nbt.3103.
17. Schmidt H. & Hensel M. Pathogenicity islands in bacterial pathogenesis. Clin Microbiol Rev. 2004. V. 17(1). P. 14–56.
18. Ricker N., Qian H., and Fulthorp R. R. The limitations of draft assemblies for understanding prokaryotic adaptation and evolution. Genomics. 100(3):167–75 (2012).
19. Castro-Wallace S.L. et al. Nanopore DNA sequencing and genome assembly on the International Space Station // Scientific Reports. 7 18022 (2017). doi.org/10.1038/s41598–017–18364–0.
20. Wilson J. W. et al. Space flight alters bacterial gene expression and virulence and reveals a role for global regulator // Hfq. Proc Natl Acad Sci USA. 2007. V. 104. P. 16299–16304.
21. Keller M. Direct RNA sequencing of influenza viral RNA using the MinION. Presentation. Available at: <www.vimeo.com/250295802> [Accessed 13 February 2019].
22. Smith A. M. et al. Reading canonical and modified nucleotides in 16S ribosomal RNA using nanopore direct RNA sequencing. bioRxiv 132274 (2017).
23. Euskirchen, P. et al. Same-day genomic and epigenomic diagnosis of brain tumors using real-time nanopore sequencing // Acta Neuropathol. 2017. V. 134(5). P. 691–703.
24. Wick R. Hybrid Nanopore and Illumina assembly: working towards the perfect bacterial genome. Presentation. Available at: <www.vimeo. com/219736365> [Accessed: 15 February 2018].
25. Harmenberg J., Oberg B. & Spruance S. Prevention of ulcerative lesions by episodic treatment of recurrent herpes labialis: A literature review // Acta dermato-venereologica. 2010. V. 90(2). P. 122–130.
26. GitHub. MIRA. Available at: <www.github.com/mira> [Accessed: 25 February 2018].
27. Warren R. L. et al. LINKS: Scalable, alignmentfree scaffolding of draft genomes with long reads // Gigascience. 4:35 (2015). doi.org/10.1186/s13742-015-0076-3.
28. Karamitros T. et al. De novo assembly of Human Herpes Virus Type 1 (HHV‑1) genome, mining of noncanonical structures and detection of novel drug-resistance mutations using short- and longread next generation sequencing technologies. PLoS One 11(6) (2016). doi.org/10.1371/journal.pone.0157600
29. GitHub. Nanopolish. Available at: <www.github.com/jts/nanopolish> [Accessed: 25 February 2018].
30. Beattie E. et al. Reversal of the interferon-sensitive phenotype of a vaccinia virus lacking E3L by expression of the reovirus S4 gene // J Virol 1995. V. 69. P. 499–505.
31. Elde, N.C. et al. Poxviruses deploy genomic accordions to adapt rapidly against host antiviral defenses // Cell. 2012. V. 150. P. 831–841. doi:10.1016/j. cell.2012.05.049 (2012).
32. Sasani T. A., Cone K. R., Quinlan A. R., & Elde N. C. Long read sequencing reveals poxvirus evolution through rapid homogenization of gene arrays // bioRxiv 245373 (2018).
33. Loman, N. [Twitter] 1 December 2018. Available from: www.twitter.com/pathogenomenick/status/936636777078710272 [Accessed: 21 March 2018.
Отзывы читателей