Петербургские ученые нашли способ повысить точность программ для расшифровки биополимеров
Современные методы секвенирования ДНК, РНК и других биополимеров открывают большие возможности для изучения различных свойств живых организмов. Примером практического применения этих методов является расшифровка геномов вирусов, без которой крайне сложно подобрать эффективные лекарственные вещества. Большое значение также имеет декодирование такого многочисленного класса биологических соединений как пептиды: на их основе, в частности, иммунные системы живых организмов «собирают» антитела для борьбы с болезнями.
Для секвенирования любого пептида, то есть определения его первичной структуры, применяют два основных метода. Первый подразумевает, что исследуемое вещество уже было описано учеными, и тогда его структуру можно найти в одной из существующих баз данных. Второй называется de novo секвенированием – он используется для расшифровки биополимеров с неизвестной ранее структурой. Хотя последний метод является значительно более быстрым способом расшифровки пептида, он менее точен, и поэтому ученые разрабатывают алгоритмы, которые позволяют оценить надежность предсказания с помощью de novo.
Научная группа в составе ученых СПбГЭТУ «ЛЭТИ», Алферовского университета и Санкт-Петербургского государственного университета провела исследование в рамках госзадания Минобрнауки РФ.
«В случае применения de novo секвенирования, как правило, мы получаем целый набор потенциальных вариантов первичной структуры пептида. Для определения того, какое из предсказаний является наиболее надежным, мы разработали специальный алгоритм. Он может быть встроен в программное обеспечение для расшифровки биополимеров», – рассказывает доцент кафедры математического обеспечения ЭВМ СПбГЭТУ «ЛЭТИ», заведующая кафедрой биоинформатики Алферовского университета Кира Вяткина.
В основе нового алгоритма лежит разработанный научной группой метод валидации (проверки корректности результата), который оценивает надежность результатов de novo секвенирования. Он анализирует не только аминокислотный состав, но и массы различных фрагментов пептида. Эксперименты с тестовыми белками показали, что такой способ позволяет надежно исключить ошибочные варианты de novo структуры исследуемых пептидов.
Измерения пептидов проводились на одном из наиболее широко используемых в мире масс-спектрометров Thermo Fisher Obritrap (прибор для определения состава и структуры вещества). Для обработки информации и выполнения de novo секвенирования использовалась программное обеспечение Twister, разработанное ранее Кирой Вяткиной, в которое новый алгоритм был успешно встроен и далее работал в автоматическом режиме.«Методы валидации результатов de novo секвенирования, несомненно, будут востребованы учеными, поскольку это позволит повысить эффективность их исследований. Однако у разработки есть и практические аспекты. Так, методы повышения точности алгоритмов найдут применение, например, при анализе антител, которые вырабатываются в живых организмах. На основе антител фармацевтические компании разрабатывают современные лекарственные средства. Однако аминокислотные последовательности антител напрямую не записаны в геноме, поэтому специалистам из фарминдустрии требуется регулярно пользоваться методами и алгоритмами секвенирования пептидов и белков», – поясняет Кира Вяткина.
Наука
СПбГЭТУ «ЛЭТИ»