От последовательности – к структуре и функции

В случае, когда молекула белка-мишени определена, но ее пространственная структура не известна, приходится прибегнуть к построению 3D модели данного белка. С этой целью в настоящее время применяют три группы методов:

1. распознавание фолда (укладки, упаковки) с использованием библиотеки известных фолдов;

2. предсказания abinitio на основе знаний об атомных взаимодействиях и архитектуре белковой глобулы;

3. моделирование по гомологии.

Распознавание фолда – это стадия для построения модели трехмерной структуры белка. Оно применяется, если отсутствует информация о близких гомологах исследуемого белка, пространственная структура которых расшифрована ранее. Хотя при этом удается предсказать корректно укладку для ~75% белков, разрешение построенной таким образом модели не достаточно, чтобы использовать ее в дальнейших исследованиях как базовую для выявления механизма функционирования макромолекул.

При предсказании abinitio целью является построение модели 3D структуры без использования знаний по структуре гомологов. Эти методы близки к методам предсказания фолда как по точности распознавания, так и по разрешению.

Предсказание трёхмерной структуры белка по известной аминокислотной последовательности осуществляется наиболее успешно, когда известна пространственная структура одного или нескольких его гомологов. В этих случаях информация об известных структурах может экстраполироваться на новую аминокислотную последовательность, что позволяет получить 3D модель до расшифровки структуры нового белка методами рентгеноструктурого анализа или ЯМР. Такой подход получил название сравнительного моделирования (иногда используются также термины — моделирование по гомологии или моделирование, основанное на знаниях).

В настоящее время разработано достаточно большое число различных подходов к сравнительному моделированию. Одним из наиболее широко используемых является метод, первоначально разработанный Бланделом и реализованный в программе COMPOSER комплекса молекулярного моделирования SYBYL (TRIPOS, Inc.).

При построении трехмерной модели для новой аминокислотной последовательности эта полипептидная цепочка сначала вписывается в координаты, соответствующие остаткам гомологичного белка с расшифрованной пространственной структурой, а затем осуществляется минимизация внутримолекулярной энергии, чтобы убрать возможные напряжения в структуре. В дальнейшем методами молекулярной динамики моделируется Броуновское движение отдельных частей молекулы с целью уточнения расположения гибких участков. Качество полученной модели оценивают с использованием программы PROCHECK. Построенные таким способом модели были успешно использованы для конструирования, например: новых ингибиторов протеазы вируса иммунодефицита человека для лечения СПИДа; ингибиторов ренина, как средств лечения эссенциальной гипертензии; для белковой инженерии гибридных нейротрофных факторов; и т.д.

Сравнительная оценка различных подходов к предсказанию пространственной структуры белка по аминокислотной последовательности традиционно проводится в Асиломаре (Калифорния, США). При этом авторам методов предсказания предъявляются аминокислотные последовательности белков, пространственная структура которых будет расшифрована к моменту очередного рабочего совещания CASP (Critical Assessment of Structure Prediction). Предсказание, таким образом, делается вслепую, что позволяет объективно оценить его результаты. По итогам третьего совещания CASP было сделано заключение, что наилучшие предсказанные модели могут быть охарактеризованы величинами среднеквадратичного отклонения в расположении С атомов 0.2, 0.4, и 0.6 нм. Разрешение 0.2 нм может быть достаточным для использования таких моделей с целью исследования механизма функционирования макромолекул. Разрешение 0.4 нм позволяет определить, какие остатки расположены по одну сторону молекулы и может быть использовано в планировании экспериментов. Разрешение 0.6 нм – слишком грубое и не может применяться ни в планировании дальнейших экспериментов, ни в анализе структурно-функциональных соотношений (рис.1).

Второй подход, широко используемый в биоинформатике – это анализ биологических текстов как таковых с целью выяснения функции как целых молекул, так и их отдельных фрагментов. При этом используется только информация, содержащаяся в аминокислотной последовательности. Результаты такого рода работ оформляются в виде структурно-функциональных карт, на которых отмечены вероятные участки, участвующие в обеспечении каталитической активности, пространственной конформации, взаимодействии с белками-партнерами и т.п.

От последовательности – к структуре и функции

Рис. 1. Основные задачи компьютерного моделирования трехмерной структуры белка.

Стратегия предсказания функционально значимых фрагментов белка применима только при наличии группы белков, обладающих сходными каталитическими свойствами. Такая группа формируется на первом этапе с использованием поиска по гомологии (BLAST) и/или информации, известной из эксперимента. Далее, среди гомологов выделяются семейства и подсемейства при помощи методов кластерного анализа на основании результатов парного выравнивания. Выделение кластеров необходимо, чтобы избежать вырожденности, т.е. искусственного преобладания высокогомологичных последовательностей одной группы.

Следующий этап — иерархическое множественное выравнивание. Белки в каждой группе выравниваются и заменяются одной консенсусной последовательностью или строятся соответствующие частотные профили. Их можно рассматривать как гипотетические белки-прародители (БП) для данной группы. На следующем уровне иерархии уже производится выравнивание БП.

БП для группы функционально родственных белков анализируется статистическими методами. При этом переход от строки символов к нормально распределенной величине осуществляется при помощи статистического критерия Шермана. Последняя характеризует, насколько сгруппированы консервативные остатки вдоль БП.

На рис.2 представлен результат применения описанной стратегии к цитохромам Р450 семейства CYP51, катализирующих 14-деметилирование стероидных субстратов. Пики на рисунке соответствуют структурно-функциональным мотивам. Это подтверждается данными точечного мутагенеза и независимых полуэмпирических предсказаний. Остатки, входящие в найденные мотивы, по-видимому, играют роль в связывании с субстратом. Полученные данные совместно с результатами молекулярного моделирования можно использовать для модификации уже существующих противогрибковых препаратов с тем, чтобы получить лиганды – ингибиторы этого фермента, ген который был обнаружен в M.tuberculosis.

В качестве другого примера можно привести выполненный в НИИ биомедхимии РАМН анализ аминокислотных последовательностей оболочечных белков Е1 и Е2 различных штаммов вируса гепатита С человека. Путем множественного выравнивания 827 аминокислотных последовательностей (рис.3) были определены наиболее консервативные фрагменты и гипервариабельный участок. Эти данные являются основой для создания ингибиторов, блокирующих взаимодействие вируса с рецептором CD81; ингибиторов, блокирующих фолдинг белков вируса; синтеза антигенных детерминант; создания вакцин.

От последовательности – к структуре и функции

Рис. 2. Анализ консенсусной последовательности цитохромов Р450 семейства CYP51

Таким образом, наибольшей эффективности в анализе аминокислотных последовательностей можно добиться последовательно применяя различные методы биоинформатики. Стратегии такого рода настраиваются и апробируются на конкретных надсемействах, но общий принцип применим к белкам всех классов. Основное в подходе — это определение функционально значимых участков в последовательности, минуя стадию построения молекулярной модели.

От последовательности – к структуре и функции

Рис.3. Характеристика выровненных 827 последовательностей оболочечных белков E1 и E2 ВГС человека. Процентное содержание преобладающих остатков в позициях выравнивания; б) высоконсервативные участки (CR1 — CR6) и гипервариабельный участок HVR1.

Структуры данных: Правильные скобочные последовательности. Центр онлайн-обучения «Фоксфорд»


Похожие статьи.

Понравилась статья? Поделиться с друзьями: