В недрах существующих открытых геномных данных было обнаружено более 130000 ранее неизвестных вирусов. Эта работа была проведена при сотрудничестве ученых СПбГУ из Центра биоинформатики и алгоритмической биотехнологии с Институтом Пастера (Франция), Университетом Британской Колумбии (Канада), Калифорнийским университетом в Беркли (США), Гейдельбергским институтом теоретических исследований (Германия).
Ученые считают, что существует большое количество еще неизвестных науке вирусов, некоторые из которых опасны и могут спровоцировать следующие пандемии. Пресс-служба СПбГУ сообщает, что новое исследование оперирует огромным количеством данных ДНК и РНК. Ученые проанализировали 16 петабайт геномных последовательностей. С таким объемом информации сложно справиться, именно поэтому была создала платформа Serratus, обладающая многими инструментами для эффективной переработки большого количества данных.
«Главная задача коллаборации Serratus заключалась в том, чтобы создать мощное, очень точное и чувствительное «сито» для обработки огромных количеств данных, отобрать данные, относящиеся к РНК-вирусам, сузив масштабы от петабайтов до гигабайтов, доступных для относительно быстрой обработки с применением обычных вычислительных мощностей», – отмечает сотрудник Центра алгоритмической биотехнологии СПбГУ Дмитрий Мелешко.
В центре алгоритмической биотехнологии СПбГУ был создан сборщик coronaSPAdes , без которого не было бы возможности качественно обработать геномные вирусные данные. Появившаяся в результате совместных усилий платформа может обрабатывать один миллион наборов данных в день при вычислительных затратах менее одного цента на набор данных.
Даже имея частичные последовательности, а не полный геном вирусов, ученые смогли построить генеалогические деревья, которые показывают развитие вирусов и их связь между собой. Так, в ходе работы исследователей было обнаружено 250 гигантских вирусов, способных поражать бактерии. Максимально похожие на них вирусы ранее были найдены у человека из Бангладеша, а также у кошек и собак в Соединенном Королевстве. До появления проекта Serratus ученые знали о существовании примерно 13 500 РНК-вирусов, проект почти в десять раз увеличил это число. К концу десятилетия ученые планируют идентифицировать более 100 миллионов РНК-вирусов. Исследование появилось в журнале Nature.
Фото: Пресс-служба СПбГУ (Коллектив Центра биоинформатики и алгоритмической биотехнологии СПбГУ)
Это новость от журнала ММ «Машины и механизмы». Не знаете такого? Приглашаем прямо сейчас познакомиться с этим удивительным журналом.