WikiDer > CS23D
CS23D представляет собой веб-сервер для создания трехмерных структурных моделей на основе химических сдвигов ЯМР.[1] CS23D сочетает максимальную сборку фрагментов с нарезанием резьбы химическим сдвигом, de novo создание структуры, прогнозирование торсионного угла на основе химического сдвига и уточнение химического сдвига. CS23D использует RefDB и ShiftX.
CS23D входные форматы
CS23D принимает файлы химического сдвига в форматах SHIFTY или BMRB.
Варианты CS23D
Пользователь может
- Исключить белок из использования в качестве шаблона
- Игнорировать гомологи с высокой идентичностью в списке доступных шаблонов
- Измените количество моделей в финальном ансамбле
- Изменить количество шагов оптимизации модели
CS23D выход
Вывод CS23D состоит из набора из 10 PDB-координат с лучшими результатами. Также предоставляется гиперссылка на структуру единого лучшего результата. Отображаются общая оценка CS23D, оценка на основе знаний, оценка химического сдвига, статистика графика Рамачандрана, корреляции между наблюдаемыми и рассчитанными сдвигами до и после уточнения. Пользователю дается заключение о надежности конструкции.
CS23D протокол
Поиск гомологии: Последовательность запроса используется для поиска гомологичных белков или / или фрагментов белков в неизбыточной базе данных последовательностей PDB и вторичных структур PPT-DB с использованием ВЗРЫВ.
Гомологическое моделирование: Гомологическое моделирование выполняется программой Homodeller, которая является частью программы PROTEUS2.[2] Белки, которые идентифицируются на этапе поиска гомологии, используются в качестве шаблонов при моделировании гомологии.
Ссылка на химическую смену: На химические сдвиги ссылаются RefCor,[3] который является частью бэкэнда веб-сервера RCI.
Прогнозирование вторичной структуры по химическим сдвигам: Вторичная структура предсказывается по химическим сдвигам методом CSI.
Прогнозирование торсионного угла по химическим сдвигам: Углы кручения предсказываются на основе химических сдвигов PREDITOR.[4]
Нарезание резьбы с химическим сдвигом: Торсионные углы Phi и Psi позвоночника, предсказанные PREDITOR на основе химических сдвигов[4] отображаются в девяти различных областях в пространстве Рамачандрана, каждой из которых присвоены определенные буквы. Белок может быть представлен последовательностью этих девяти «букв торсионного угла». Thrifty использует эти последовательности букв торсионных углов для определения хороших шаблонов в базе данных, содержащей около 18 500 неизбыточных структур PDB, структуры которых преобразованы в девятибуквенный «алфавит» Рамачандрана.
Аналогичным образом, химический сдвиг потока дополнительно выполняется с использованием трехбуквенного алфавита вторичной структуры (H для спирали, B для бета-нити, C для спирали) и вторичной структуры, предсказанной на основе химических сдвигов программой CSI.
Сборка модели:Субфрагменты, идентифицированные гомологическим моделированием и этапами последовательного химического сдвига, собираются в исходные 3D-модели с использованием CS23D SFassembler (сборщик субфрагментов). Начальные модели оцениваются функцией скоринга GAFolder (см. Ниже), а лучшая модель дополнительно уточняется с помощью GAFolder (см. Дополнительную информацию о GAFolder ниже).
Сворачивание ab initio: Ab initio складывание выполнено Rosetta[5] когда на этапах моделирования гомологии и химического сдвига нити не был идентифицирован шаблон. Модели Rosetta оцениваются функцией скоринга GAFolder, а лучшие модели Rosetta уточняются с помощью GAFolder (см. Ниже).
Оптимизация модели: Оптимизация модели в CS23D выполняется с помощью минимизатора на основе торсионного угла GAfolder (папка Genetic Algorithm), который использует генетический алгоритм для выборки конформационного пространства. Метод аналогичен применяемому в GENFOLD.[5] GAFolder перемещает торсионные углы в пределах диапазонов, определяемых значениями и неопределенностями торсионных углов, предсказанными PREDITOR.[4] GAFolder оценивает модели белков с помощью функции оценки, описанной ниже.
Функция подсчета очков: Функция оценки GAFolder состоит из оценок на основе знаний и оценок химического сдвига.
Оценки, основанные на знаниях включают:
- радиус инерции балла,
- энергия водородной связи,
- количество водородных связей,
- оценка плохих контактов,
- оценка дисульфидной связи,
- модифицированная энергия заправки на основе потенциала Брайанта и Лоуренса.[6]
- Шкала Рамачандрана, оценивающая нормальность модельных торсионных углов Phi и Psi
- Оценка Омега, которая оценивает нормальность омега-углов кручения модели
- Оценка хи, основанная на ожидаемых значениях угла хи для различных комбинаций фи и пси.
Компонент химического сдвига функции оценки папки GA использует:
- взвешенные коэффициенты корреляции между экспериментальными химическими сдвигами (CA, CB, CO, N, HA, HN) и химическими сдвигами, рассчитанными с помощью SHIFTX 1.0.
- согласие между вторичной структурой модели и вторичной структурой, предсказанной CSI на основе экспериментальных химических сдвигов.
Подпрограммы CS23D
- CSI - предсказание вторичной структуры по химическим сдвигам
- BLAST - выравнивание последовательностей, поиск гомологии
- PROTEUS2 - моделирование гомологии[2]
- PREDITOR - предсказание торсионных углов по химическим сдвигам[4]
- Pepmake - построение моделей белков по торсионным углам и последовательности
- PPT-DB - база данных вторичной структуры
- Розетта - ab initio создание структуры[5]
- RCI- оценка неопределенности торсионных углов, предсказанных на основе химических сдвигов PREDITOR
- ShiftX 1.0 - используется для генерации коэффициентов корреляции между наблюдаемыми химическими сдвигами и сдвигами, предсказанными ShiftX на основе моделей белков.
- SFAssembler - сборка максимального фрагмента
- GAFolder - уточнение химического сдвига с помощью генетического алгоритма
- Thrifty - заправка резьбы с химическим сдвигом
- RefCor - референция химического сдвига
Зависимость CS23D от идентичности последовательности матрицы
CS23D - это метод на основе шаблона. Следовательно, его производительность зависит от идентичности последовательности выбранного шаблона (ов), см. Рисунок рядом. Точно так же Rosetta - это метод, ориентированный на фрагменты. Его производительность зависит от качества выбранных фрагментов. Качество фрагментов и, следовательно, производительность Rosetta можно улучшить, используя химические сдвиги на этапе выбора фрагмента (например, в протоколе CS-Rosetta). Для структурного решения, на которое не влияет шаблонная структура или структура фрагментов, можно рассмотреть возможность получения ограничений расстояния на основе NOE (8-10 на остаток) и их использование с GeNMR программа в ее ab initio режим.
Смотрите также
- Химический сдвиг
- ЯМР
- Спектроскопия ядерного магнитного резонанса
- Спектроскопия ядерного магнитного резонанса белков
- Динамика белков # Домены и гибкость белков
- Протеин
- GeNMR
- Индекс случайной катушки
- Прогнозирование химического сдвига белков
- Ссылка на химический сдвиг белка
- Вторичная структура белка
- Индекс химического сдвига
- ShiftX
- Прогноз структуры белка
Рекомендации
- ^ Вишарт Д.С., Арндт Д., Берджанский М., Тан П, Чжоу Дж., Лин Дж. (Июль 2008 г.). «CS23D: веб-сервер для быстрого создания структуры белка с использованием химических сдвигов ЯМР и данных последовательности». Исследования нуклеиновых кислот. 36 (Выпуск веб-сервера): W496–502. Дои:10.1093 / нар / gkn305. ЧВК 2447725. PMID 18515350.
- ^ а б Монтгомери С., Круз Дж. А., Шривастава С., Арндт Д., Берджанский М., Вишарт Д. С. (июль 2008 г.). «PROTEUS2: веб-сервер для всестороннего предсказания структуры белка и аннотации на основе структуры». Исследования нуклеиновых кислот. 36 (Выпуск веб-сервера): W202–9. Дои:10.1093 / нар / gkn255. ЧВК 2447806. PMID 18483082.
- ^ Берьанский М, Вишарт Д.С. (2006). «ЯМР: предсказание гибкости белка». Протоколы природы. 1 (2): 683–8. Дои:10.1038 / nprot.2006.108. PMID 17406296.
- ^ а б c d Берьянский М.В., Нил С., Вишарт Д.С. (июль 2006 г.). «PREDITOR: веб-сервер для прогнозирования ограничений на угол кручения белка». Исследования нуклеиновых кислот. 34 (Выпуск веб-сервера): W63–9. Дои:10.1093 / нар / gkl341. ЧВК 1538894. PMID 16845087.
- ^ а б c Rohl CA, Strauss CE, Misura KM, Baker D (2004). «Прогнозирование структуры белка с помощью Rosetta». Методы в энзимологии. 383: 66–93. Дои:10.1016 / S0076-6879 (04) 83004-0. PMID 15063647.
- ^ Брайант SH, Лоуренс CE (май 1993 г.). «Эмпирическая энергетическая функция для прохождения белковой последовательности через укладывающийся мотив». Белки. 16 (1): 92–112. Дои:10.1002 / prot.340160110. PMID 8497488.