May 26, 2023
AlphaFold от DeepMind наблюдает за потреблением белка
НЬЮ-ЙОРК – С момента своего появления в 2018 году программа DeepMind AlphaFold
НЬЮ-ЙОРК – С момента своего появления в 2018 году программа DeepMind AlphaFold стала ключевым инструментом в биологических исследованиях, позволяя ученым предсказывать структуры белков с высокой точностью на основе их аминокислотных последовательностей.
Совсем недавно исследователи начали использовать AlphaFold и его новую версию AlphaFold2 для работы по межбелковому взаимодействию (PPI), исследуя его полезность для прогнозирования и проверки белковых взаимодействий, а также для создания моделей их структур.
Эти усилия по-прежнему ограничены необходимыми интенсивными вычислительными ресурсами, но исследования показывают, что подходы на основе искусственного интеллекта могут оказаться полезными для крупномасштабных исследований PPI и могут дополнять существующие инструменты, такие как масс-спектрометрия и двухгибридные системы дрожжей.
«Это очень интересное пространство», — сказал Юри Раппсильбер, профессор протеомики Эдинбургского университета и профессор биоаналитики в Берлинском технологическом институте. В апреле он и его коллеги опубликовали в журнале Molecular Systems Biology исследование по комбинированию масс-спектрометрии сшивки и масс-спектрометрии кофракционирования с программным обеспечением AlphaFold-Multimer — расширением AlphaFold2, предназначенным для исследований PPI — для прогнозирования и проверки ИПП в Bacillus subtilis. .
Раппсилбер назвал одним из распространенных вариантов использования то, что он назвал «альфа-анализом», в котором исследователи используют программное обеспечение для скрининга белков-кандидатов-взаимодействующих веществ на предмет конкретного представляющего интерес белка, так же, как они могли бы это сделать в эксперименте по массовой спектроскопии с понижением иммунитета.
«У них есть белок, который их интересует, и ряд белков-кандидатов, которые, по их мнению, могут взаимодействовать с этим белком, и они просто подбрасывают их один за другим против интересующего их белка», — сказал Раппсилбер.
«Если результат AlphaFold положительный, то весьма вероятно, что они взаимодействуют», — сказал он. «Итак, вы переходите от 10, 20 или 50 кандидатов к небольшому количеству кандидатов, и это более вероятно для дальнейшего развития».
Раппсилбер добавил, что, что немаловажно, в отличие от других подходов к проверке PPI, исследователи выходят из такого эксперимента с моделями структур взаимодействий.
«И это очень четкая инструкция о том, что делать дальше в качестве эксперимента», — сказал он, отметив, что с помощью этой структурной информации исследователи могут создавать точечные мутанты в местах взаимодействия, что позволит им нарушить взаимодействие и исследовать его биологический эффект.
«Основное ограничение — это вычислительная мощность», — сказал об использовании AlphaFold для работы с PPI Панайотис Кастритис, младший профессор крио-ЭМ в Университете Мартина-Лютера в Галле-Виттенберге и заведующий ERA по крио-ЭМ в Национальном греческом исследовательском фонде Греции. «Большая часть этих расчетов была выполнена на компьютерах институтского масштаба».
Однако Кастритис отметил, что в ближайшие пять-десять лет эта проблема, скорее всего, станет менее сложной, поскольку вычислительная мощность продолжает становиться менее дорогой и более доступной.
Он также предположил, что определенные вычислительные стратегии могут снизить вычислительную мощность, необходимую для использования AlphaFold для крупномасштабной работы с PPI. Например, по его словам, AlphaFold2 предсказывает структуры белков, используя так называемые множественные выравнивания последовательностей, которые он производит, беря аминокислотную последовательность белка и сравнивая ее с другими базами данных последовательностей белков, чтобы идентифицировать аналогичные последовательности, которые он использует для построения своих моделей. Кастритис сказал, что по мере того, как выявляется все больше и больше этих MSA, их можно хранить таким образом, чтобы программное обеспечение могло иметь к ним прямой доступ, вместо того, чтобы снова искать базы данных последовательностей, чтобы идентифицировать их.
«Если бы мы заранее определили и рассчитали [MSA], это, конечно, было бы быстрее и проще», — сказал он.
В апреле исследователи из Microsoft и Свободного университета Берлина опубликовали препринт BioRxiv, в котором использовалось несколько вычислительных подходов, в том числе аналогичных предложенным Кастритисом, для ускорения прогнозирования ИЦП с помощью AlphaFold2. По словам авторов, когда они применили свой подход к предсказанию парных взаимодействий 1000 белков, это сократило время, необходимое для предсказаний, в 40 раз, а необходимое дисковое пространство сократилось в 4460 раз.