WikiDer > Реконструкция предков
Реконструкция предков (также известен как Отображение персонажей или же Оптимизация персонажа) - это экстраполяция назад во времени измеренных характеристик людей (или популяций) на их общие предки. Это важное применение филогенетика, реконструкция и исследование эволюционный отношения между людьми, группами населения или разновидность своим предкам. В контексте эволюционная биологияреконструкция предков может использоваться для восстановления различных типов состояний предков организмов, которые жили миллионы лет назад.[1] Эти состояния включают генетическая последовательность (реконструкция наследственной последовательности), аминокислотная последовательность из белок, состав геном (например, порядок генов), измеримая характеристика организма (фенотип), а географический диапазон наследственной популяции или вида (реконструкция ареала предков). Это желательно, потому что это позволяет нам исследовать части филогенетические деревья соответствующий далекому прошлому, проясняющий эволюционную историю вида на дереве. Поскольку современные генетические последовательности по сути, являются вариациями древних, доступ к древним последовательностям может идентифицировать другие варианты и организмы, которые могли возникнуть из этих последовательностей.[2] В дополнение к генетическим последовательностям можно попытаться отследить изменение одной черты характера на другую, например, превращение плавников в ноги.
Небиологические приложения включают реконструкцию словаря или фонем древние языки,[3] и культурные особенности древних обществ, такие как устные традиции[4] или брачные практики.[5]
Реконструкция предков опирается на достаточно реалистичную статистический модель эволюции чтобы точно восстановить родовые состояния. Эти модели используют генетическую информацию, уже полученную с помощью таких методов, как филогенетика определить маршрут, по которому эволюция взяли и когда произошли эволюционные события.[6] Однако независимо от того, насколько хорошо модель приближается к реальной эволюционной истории, способность точно реконструировать предка ухудшается с увеличением времени эволюции между этим предком и его наблюдаемыми потомками. Кроме того, более реалистичные модели эволюции неизбежно становятся более сложными и трудными для расчета. Прогресс в области реконструкции предков во многом зависит от экспоненциальный рост вычислительной мощности и сопутствующее развитие эффективных вычислительные алгоритмы (например, динамическое программирование алгоритм для совместного максимальная вероятность реконструкция наследственных последовательностей).[7] Методы реконструкции предков часто применяются к данной филогенетическое дерево что уже было выведено из тех же данных. Этот подход удобен, но имеет тот недостаток, что его результаты зависят от точности одного филогенетического дерева. Напротив, некоторые исследователи[8] выступать за более интенсивные вычисления Байесовский подход, который учитывает неопределенность в реконструкции деревьев путем оценки наследственных реконструкций по многим деревьям.
История
Концепции реконструкции предков часто приписывают Эмиль Цукеркандль и Линус Полинг. По мотивам разработки методик определения первичная (аминокислотная) последовательность белков Фредерик Сэнгер в 1955 г.,[9] Цукеркандль и Полинг постулировали[10] что такие последовательности могут использоваться не только для вывода филогения связывая наблюдаемые белковые последовательности, а также предковую белковую последовательность в самой ранней точке (корне) этого дерева. Однако идея реконструкции предков по измеримым биологическим характеристикам уже развивалась в области кладистика, один из предшественников современной филогенетики. Кладистические методы, появившиеся еще в 1901 году, делают вывод об эволюционных взаимоотношениях видов на основе распределения общих характеристик, некоторые из которых, как предполагается, произошли от общих предков. Более того, Феодосей Добжанский и Альфред Стертевант сформулировал принципы реконструкции предков в филогенетическом контексте в 1938 году, делая вывод об эволюционной истории хромосомные инверсии в Drosophila pseudoobscura.[11]
Таким образом, реконструкция предков имеет свои корни в нескольких дисциплинах. Сегодня вычислительные методы реконструкции предков продолжают расширяться и применяться в самых разных условиях, так что предковые состояния выводятся не только по биологическим характеристикам и молекулярным последовательностям, но и по структуре.[12][13] или же каталитический характеристики[14] древних и современных белки, географическое положение популяций и видов (филогеография)[15][16] и структура геномов высшего порядка.[17]
Методы и алгоритмы
Любая попытка реконструкции предков начинается с филогения. В общем, филогения - это древовидная гипотеза о порядке, в котором популяции (называемые таксоны) происходят от общих предков. Наблюдаемые таксоны представлены чаевые или же конечные узлы дерева, которые постепенно соединяются ветвями со своими общими предками, которые представлены точками ветвления дерева, которые обычно называют наследственный или же внутренние узлы. В конце концов, все родословные сходятся к самый последний общий предок от всей выборки таксонов. В контексте реконструкции предков филогения часто рассматривается как известная величина (за исключением байесовских подходов). Поскольку может существовать огромное количество филогений, которые почти одинаково эффективны для объяснения данных, сокращение подмножества филогений, поддерживаемых данными, до единственной репрезентативной или точечной оценки может быть удобным, а иногда и необходимым упрощающим предположением.
Реконструкция предков может рассматриваться как прямой результат применения гипотетической модели эволюции к данной филогении. Когда модель содержит один или несколько свободных параметров, общая цель состоит в том, чтобы оценить эти параметры на основе измеренных характеристик среди наблюдаемых таксонов (последовательностей), которые произошли от общих предков. Экономия является важным исключением из этой парадигмы: хотя было показано, что есть обстоятельства, при которых это оценка максимального правдоподобия,[18] по сути, он просто основан на эвристическом предположении, что изменения состояния персонажа случаются редко, без попытки количественно оценить эту редкость.
Существует три различных класса методов реконструкции предков. В хронологическом порядке открытия это максимальная экономия, максимальная вероятность, и Байесовский вывод. Максимальная экономия считает все эволюционные события одинаково вероятными; максимальная вероятность объясняет различную вероятность определенных классов событий; а вывод Байейса связывает условную вероятность события с вероятностью дерева, а также степенью неопределенности, которая связана с этим деревом. Максимальная экономия и максимальная вероятность дают единственный наиболее вероятный результат, тогда как байесовский вывод учитывает неопределенности в данных и дает выборку возможных деревьев.
Максимальная экономия
Экономия, известная в просторечии как "бритва Оккама"относится к принципу выбора простейшей из конкурирующих гипотез. В контексте реконструкции предков экономия стремится найти распределение предковых состояний в данном дереве, которое минимизирует общее количество изменений состояния персонажа, которые могут потребоваться для объяснения состояния, наблюдаемые на кончиках дерева. Этот метод максимальная экономия[19] является одним из самых ранних формализованных алгоритмов восстановления состояний предков, а также одним из самых простых.[13]
Максимальную экономию можно реализовать одним из нескольких алгоритмов. Один из самых ранних примеров - Метод Fitch,[20] который назначает наследственные состояния характера путем экономии через два обхода корневого двоичное дерево. Первый этап - это обход после заказа который идет от кончиков к корню дерева, посещая дочерние (дочерние) узлы раньше своих родителей. Изначально мы определяем набор возможных состояний символа Sя для я-го предка на основе наблюдаемых состояний характера его потомков. Каждое задание - это установить пересечение состояний характера потомков предка; если пересечение - пустое множество, то это установить союз. В последнем случае подразумевается, что между предком и одним из двух его непосредственных потомков произошло изменение состояния символа. Каждое такое событие учитывается в функции стоимости алгоритма, которую можно использовать для различения альтернативных деревьев на основе максимальной экономии. Далее обход предварительного заказа дерева выполняется, начиная от корня к кончикам. Затем состояния персонажа назначаются каждому потомку в зависимости от того, какие состояния символа он разделяет со своим родителем. Поскольку у корня нет родительского узла, может потребоваться произвольно выбрать состояние символа, особенно когда в корне восстановлено более одного возможного состояния.
Например, рассмотрим филогению, полученную для рода растений, содержащего 6 видов A - F, где каждое растение опыляется либо «пчелой», «колибри», либо «ветром». Возникает очевидный вопрос: какие опылители в более глубоких узлах были в филогении этого рода растений. При максимальной экономии реконструкция предкового состояния для этой клады показывает, что «колибри» является наиболее экономным предковым состоянием для нижней клады (растения D, E, F), которое предки определяют для узлов в верхней кладе (растения A, B, C) двусмысленны и что опылители "колибри" и "пчелы" одинаково правдоподобны для состояния опыления в корне филогении. Предположим, что у нас есть веские доказательства из летописи окаменелостей, что корневое состояние - «колибри». Преобразование корня в «колибри» дало бы образец реконструкции предкового состояния, изображенный символами в узлах, при этом состояние, требующее наименьшего количества изменений, обведено кружком.
Методы экономии интуитивно привлекательны и очень эффективны, так что они все еще используются в некоторых случаях для засеивания алгоритмов оптимизации максимального правдоподобия исходной филогении.[21] Однако лежащее в основе предположение о том, что эволюция достигла определенного конечного результата как можно быстрее, неточно. Естественный отбор и эволюция не работают для достижения цели, они просто выбирают за или против случайно происходящих генетических изменений. Методы экономии предполагают шесть общих допущений: что филогенетическое дерево, которое вы используете, является правильным, что у вас есть все соответствующие данные, в которых не было сделано ошибок при кодировании, что все ветви филогенетического дерева с одинаковой вероятностью изменятся, что скорость эволюции низкая, и вероятность потери или получения характеристики одинакова.[1] В действительности предположения часто нарушаются, что приводит к нескольким проблемам:
- Различия в темпах эволюции. Метод Fitch предполагает, что изменения между всеми состояниями персонажа имеют одинаковую вероятность; таким образом, любое изменение требует одинаковых затрат для данного дерева. Это предположение часто нереалистично и может ограничивать точность таких методов.[8] Например, переходы имеют тенденцию происходить чаще, чем трансверсии в эволюции нуклеиновых кислот. Это предположение можно ослабить, назначив разную стоимость изменениям состояния конкретных символов, что приведет к взвешенному алгоритму экономии.[22]
- Быстрая эволюция. Результатом эвристики "минимальной эволюции", лежащей в основе таких методов, является то, что такие методы предполагают, что изменения редкий, и поэтому неуместны в случаях, когда изменение является нормой, а не исключением.[23][24]
- Разница во времени между родословными. Методы экономии неявно предполагают, что вдоль каждой ветви дерева прошло одинаковое количество эволюционного времени. Таким образом, они не учитывают различия в длине ветвей в дереве, которые часто используются для количественной оценки эволюционного или хронологического времени. Это ограничение заставляет методику делать вывод, что одно изменение произошло на очень короткой ветви, а не несколько изменений, например, на очень длинной ветви.[25] Кроме того, возможно, что некоторые ветви дерева могут подвергаться более высокому выбору и изменению, чем другие, возможно, из-за изменения факторов окружающей среды. Некоторые периоды времени могут представлять более быструю эволюцию, чем другие, когда это происходит, экономия становится неточной.[26] Этот недостаток устраняется методами, основанными на моделях (как методом максимального правдоподобия, так и байесовскими методами), которые выводят стохастический процесс эволюции по мере его развертывания вдоль каждой ветви дерева.[27]
- Статистическое обоснование. Без статистической модели, лежащей в основе метода, его оценки не имеют четко определенных неопределенностей.[23][25][28]
- Конвергентная эволюция. При рассмотрении состояния одного персонажа экономия автоматически предполагает, что два организма, которые разделяют эту характеристику, будут более тесно связаны между собой, чем те, которые не имеют. Например, то, что у собак и обезьян есть мех, не означает, что они более тесно связаны с людьми, чем обезьяны.
Максимальная вероятность
Максимальная вероятность (ML) методы реконструкции предкового состояния обрабатывают состояния персонажа во внутренних узлах дерева как параметры и пытаются найти значения параметров, которые максимизируют вероятность данных (наблюдаемые состояния персонажа) с учетом гипотезы (модель эволюции и филогенез, относящийся к наблюдаемым последовательностям или таксонам). Другими словами, этот метод предполагает, что предковые состояния - это те состояния, которые статистически наиболее вероятны с учетом наблюдаемых фенотипов. Некоторые из самых ранних подходов ML к реконструкции предков были разработаны в контексте эволюция генетической последовательности;[29][30] аналогичные модели были разработаны и для аналогичного случая эволюции дискретного характера.[31]
Использование модели эволюции объясняет тот факт, что не все события могут произойти с одинаковой вероятностью. Например, переход, который является типом точечной мутации от одного пурина к другому или от одного пиримидина к другому, с гораздо большей вероятностью, чем трансверсия, который представляет собой вероятность того, что пурин будет переключен на пиримидин, или наоборот. Эти различия не улавливаются максимальной экономией. Однако то, что одни события более вероятны, чем другие, не означает, что они всегда происходят. Мы знаем, что на протяжении истории эволюции были времена, когда существовал большой разрыв между тем, что могло произойти с наибольшей вероятностью, и тем, что произошло на самом деле. В этом случае максимальная экономия может быть более точной, потому что она более склонна к большим, маловероятным прыжкам, чем максимальная вероятность. Было показано, что максимальное правдоподобие достаточно надежно для реконструкции состояний характера, но оно не дает точных оценок стабильности белков. Максимальная вероятность всегда переоценивает стабильность белков, что имеет смысл, поскольку предполагает, что белки, которые были произведены и использованы, были наиболее стабильными и оптимальными.[13] Достоинства максимального правдоподобия были предметом споров, и некоторые пришли к выводу, что тест максимального правдоподобия представляет собой хорошее средство между точностью и скоростью.[32] Однако другие исследования жаловались, что максимальная вероятность требует слишком много времени и вычислительной мощности, чтобы быть полезной в некоторых сценариях.[33]
Эти подходы используют те же вероятностные рамки, что и для построения филогенетического дерева.[34] Короче говоря, эволюция генетической последовательности моделируется обратимым во времени непрерывным временем. Марковский процесс. В простейшем из них все символы претерпевают независимые переходы между состояниями (например, нуклеотидные замены) с постоянной скоростью во времени. Эта базовая модель часто расширяется, чтобы разрешить разные ставки для каждой ветви дерева. В действительности, частота мутаций также может меняться со временем (например, из-за изменений окружающей среды); это можно смоделировать, позволяя параметрам скорости развиваться по дереву за счет увеличения числа параметров. Модель определяет вероятности перехода из состояний я к j вдоль ветви длины т (в единицах эволюционного времени). Вероятность филогении вычисляется из вложенной суммы вероятностей перехода, которая соответствует иерархической структуре предложенного дерева. В каждом узле вероятность его потомков суммируется по всем возможным состояниям предкового символа в этом узле:
где мы вычисляем вероятность поддерево укорененный в узле Икс с прямыми потомками у и z, обозначает состояние символа я-й узел, длина ветви (время эволюции) между узлами я и j, и представляет собой набор всех возможных состояний символа (например, нуклеотиды A, C, G и T).[34] Таким образом, цель реконструкции предков - найти соответствие для всех Икс внутренние узлы, которые максимизируют вероятность наблюдаемых данных для данного дерева.
Предельная и совокупная вероятность
Вместо того, чтобы вычислять общую вероятность для альтернативных деревьев, задача реконструкции предков состоит в том, чтобы найти комбинацию состояний символов в каждом предковом узле с наивысшей предельной максимальной вероятностью. Вообще говоря, есть два подхода к этой проблеме. Во-первых, можно присвоить наиболее вероятное состояние характера каждому предку независимо от реконструкции всех других состояний предка. Этот подход называется маргинальная реконструкция. Это похоже на суммирование по всем комбинациям предковых состояний на всех других узлах дерева (включая корневой узел), кроме тех, для которых доступны данные. Маргинальная реконструкция - это нахождение состояния в текущем узле, которое максимизирует вероятность интегрирования по всем другим состояниям во всех узлах пропорционально их вероятности. Во-вторых, вместо этого можно попытаться найти совместную комбинацию состояний наследственных символов по всему дереву, что в совокупности максимизирует вероятность всего набора данных. Таким образом, такой подход называется совместной реконструкцией.[29] Неудивительно, что реконструкция сустава больше вычислительно сложный чем маргинальная реконструкция. Тем не менее, эффективные алгоритмы совместной реконструкции были разработаны с временной сложностью, которая обычно линейна с числом наблюдаемых таксонов или последовательностей.[7]
Методы реконструкции предков на основе ML имеют тенденцию обеспечивать большую точность, чем методы MP, при наличии вариаций в скорости эволюции между персонажами (или между участками генома).[35][36] Однако эти методы еще не способны учесть изменение скорости эволюции во времени, иначе известное как гетеротахия. Если скорость эволюции определенного персонажа увеличивается на ветви филогении, то степень эволюции, которая произошла на этой ветви, будет недооценена для данной длины ветви и при условии постоянной скорости эволюции этого персонажа. В дополнение к этому, трудно отличить гетеротахию от различий в скорости эволюции персонажей.[37]
Поскольку ML (в отличие от максимальной экономичности) требует от исследователя определения модели эволюции, на ее точность может повлиять использование совершенно неверной модели (неправильная спецификация модели). Кроме того, ML может обеспечить только однократную реконструкцию состояний персонажа (что часто называют «точечной оценкой») - когда поверхность правдоподобия сильно невыпуклая, содержащая несколько пиков (локальные оптимумы), то одноточечная оценка не может обеспечить адекватное представление, и байесовский подход может быть более подходящим.
Байесовский вывод
Байесовский вывод использует вероятность наблюдаемых данных, чтобы обновить мнение исследователя, или предварительное распространение, чтобы получить апостериорное распределение. В контексте реконструкции предков цель состоит в том, чтобы вывести апостериорные вероятности состояний предковых персонажей в каждом внутреннем узле данного дерева. Более того, можно проинтегрировать эти вероятности по апостериорным распределениям по параметрам эволюционной модели и пространству всех возможных деревьев. Это можно выразить как применение Теорема Байеса:
куда S представляет собой родовые государства, D соответствует наблюдаемым данным, а представляет собой как эволюционную модель, так и филогенетическое дерево. это вероятность наблюдаемых данных, которая может быть вычислена с помощью Алгоритм обрезки Фельзенштейна как указано выше. - априорная вероятность предковых состояний для данной модели и дерева. Ну наконец то, - это вероятность данных для данной модели и дерева, интегрированная по всем возможным наследственным состояниям.
Байесовский вывод - это метод, который, по мнению многих, является наиболее точным.[8] В общем, байесовские статистические методы позволяют исследователям комбинировать ранее существовавшую информацию с новой гипотезой. В случае эволюции он сочетает в себе вероятность наблюдаемых данных с вероятностью того, что события произошли в том порядке, в котором они произошли, с одновременным признанием возможности ошибки и неопределенности. В целом, это наиболее точный метод восстановления наследственных генетических последовательностей, а также стабильности белков.[25] В отличие от двух других методов, байесовский вывод дает распределение возможных деревьев, что позволяет получить более точные и легко интерпретируемые оценки дисперсии возможных результатов.[38]
Выше мы привели две формулировки, чтобы подчеркнуть два различных приложения теоремы Байеса, которые мы обсудим в следующем разделе.
Эмпирический и иерархический байесовский
Одна из первых реализаций байесовского подхода к реконструкции наследственной последовательности была разработана Янгом и его коллегами,[29] где оценки максимального правдоподобия эволюционной модели и дерева, соответственно, использовались для определения априорных распределений. Таким образом, их подход является примером эмпирический метод Байеса для вычисления апостериорных вероятностей состояний предков; Впервые этот метод был реализован в программном пакете PAML.[39] С точки зрения приведенной выше формулировки правила Байеса, эмпирический метод Байеса фиксирует к эмпирическим оценкам модели и дерева, полученным из данных, эффективно отбрасывая от апостериорного правдоподобия и предшествующих членов формулы. Более того, Ян с коллегами[29] использовали эмпирическое распределение паттернов сайтов (т. е. отнесение нуклеотидов к кончикам дерева) в их выравнивании наблюдаемых нуклеотидных последовательностей в знаменателе вместо исчерпывающего вычисления по всем возможным значениям S данный . С вычислительной точки зрения эмпирический метод Байеса сродни восстановлению предковых состояний с максимальной вероятностью, за исключением того, что вместо поиска присвоения состояний ML на основе их соответствующих распределений вероятностей в каждом внутреннем узле, сами распределения вероятностей сообщаются напрямую.
Эмпирические байесовские методы для реконструкции предков требуют, чтобы исследователь предположил, что параметры эволюционной модели и дерево известны без ошибок. Когда размер или сложность данных делают это предположение нереалистичным, может быть более благоразумным принять полностью иерархический байесовский подход и вывести совместное апостериорное распределение по состояниям предков, модели и дереву.[40] Huelsenbeck и Bollback впервые предложили[40] иерархический байесовский метод реконструкции предков с использованием Цепь Маркова Монте-Карло (MCMC) методы выборки предковых последовательностей из этого совместного апостериорного распределения. Аналогичный подход был также использован для реконструкции эволюции симбиоза с водорослями у видов грибов (лихенизация).[41] Например, Алгоритм Метрополиса-Гастингса для MCMC исследует совместное апостериорное распределение, принимая или отклоняя назначения параметров на основе отношения апостериорных вероятностей.
Проще говоря, эмпирический байесовский подход рассчитывает вероятности различных наследственных состояний для определенного дерева и модели эволюции. Выражая реконструкцию предковых состояний как набор вероятностей, можно напрямую количественно оценить неопределенность для присвоения какого-либо конкретного состояния предку. С другой стороны, иерархический байесовский подход усредняет эти вероятности по всем возможным деревьям и моделям эволюции пропорционально тому, насколько вероятны эти деревья и модели с учетом наблюдаемых данных.
Однако вопрос о том, дает ли иерархический байесовский метод существенное преимущество на практике, остается спорным.[42] Более того, этот полностью байесовский подход ограничен анализом относительно небольшого числа последовательностей или таксонов, потому что пространство все возможные деревья быстро становится слишком обширным, что делает его вычислительно невыполнимым для образцы цепи сходиться за разумное время.
Калибровка
Реконструкция предков может быть основана на наблюдаемых состояниях в исторических образцах известного возраста, таких как окаменелости или архивные образцы.Поскольку точность реконструкции предков обычно снижается с увеличением времени, использование таких образцов дает данные, которые ближе к реконструируемым предкам, и, скорее всего, улучшит анализ, особенно когда скорость изменения характера меняется со временем. Эта концепция была подтверждена экспериментальным эволюционным исследованием, в котором воспроизводятся популяции бактериофаг Т7 были размножены для создания искусственной филогении.[43] Пересматривая эти экспериментальные данные, Окли и Каннингем[44] обнаружили, что методы максимальной экономии не могут точно реконструировать известное наследственное состояние непрерывного персонажа (размер бляшки); эти результаты были подтверждены компьютерным моделированием. Эта неудача при реконструкции предков была приписана направленному смещению в эволюции размера бляшки (от большого к малому диаметру бляшки), что потребовало включения «окаменелых» образцов для устранения.
Исследования плотоядных млекопитающих[45] и рыбы[46] показали, что без включения данных об окаменелостях реконструированные оценки размеров тела предков нереально велики. Более того, Грэм Слейтер и его коллеги показали[47] с помощью плотоядные плотоядные что включение данных об окаменелостях в предыдущие распределения улучшило как байесовский вывод о предковых состояниях, так и выбор эволюционной модели по сравнению с анализом, использующим только современные данные.
Модели
Было разработано множество моделей для оценки состояния предков дискретных и непрерывных персонажей от существующих потомков.[48] Такие модели предполагают, что эволюция признака во времени может быть смоделирована как стохастический процесс. Для признаков с дискретными значениями (таких как «тип опылителя») этот процесс обычно рассматривается как Цепь Маркова; для признаков с непрерывным знаком (например, "размер мозга"), процесс часто рассматривается как Броуновское движение или Процесс Орнштейна-Уленбека. Используя эту модель в качестве основы для статистического вывода, теперь можно использовать максимальная вероятность методы или Байесовский вывод оценить исконные состояния.
Модели с дискретным состоянием
Предположим, что рассматриваемая черта может попасть в одну из государства, помеченные . Типичным средством моделирования эволюции этого признака является цепь Маркова с непрерывным временем, которую можно кратко описать следующим образом. Каждое состояние связано со скоростью перехода во все другие состояния. Эта черта моделируется как переход между состояния; когда он достигает заданного состояния, он запускает экспоненциальные «часы» для каждого из других состояний, в которые он может перейти. Затем он «гоняет» часы друг против друга и делает шаг к тому состоянию, часы которого звонят первыми. В такой модели параметрами являются скорости перехода , который может быть оценен с использованием, например, методов максимального правдоподобия, где один максимизирует набор всех возможных конфигураций состояний предковых узлов.
Чтобы восстановить состояние данного предкового узла в филогении (назовите этот узел ) по максимальному правдоподобию процедура: найти оценку максимального правдоподобия из ; затем вычислите вероятность каждого возможного состояния для кондиционирование ; наконец, выберите родовое государство, которое максимизирует это.[23] Можно также использовать эту модель замещения в качестве основы для процедуры байесовского вывода, которая будет учитывать апостериорную веру в состояние предкового узла при некотором предварительном выборе пользователем.
Потому что таких моделей может быть до параметры, переобучение может быть проблемой. Вот некоторые распространенные варианты, которые сокращают пространство параметров:
- Марков -состояние 1 параметр модели: эта модель обратного во времени -государственный аналог Юкс-Кантор модель. В этой модели все переходы имеют одинаковую скорость , независимо от их начального и конечного состояний. Некоторые переходы могут быть запрещены, заявив, что их скорость просто равна 0; это может иметь место, например, если определенные состояния не могут быть достигнуты из других состояний за один переход.
- Асимметричный Марков -состояние 2-параметрическая модель: в этой модели пространство состояний упорядочено (так, например, состояние 1 меньше, чем состояние 2, которое меньше состояния 3), и переходы могут происходить только между соседними состояниями. Эта модель содержит два параметра и : один для скорости увеличения состояния (например, от 0 до 1, от 1 до 2 и т. д.) и один для скорости уменьшения состояния (например, от 2 до 1, 1 до 0 и т. д.).
Пример: двоичная модель видообразования и исчезновения
Модель видообразования и исчезновения бинарных состояний[49] (BiSSE) - это модель в дискретном пространстве, которая не следует напрямую рамкам упомянутых выше. Это позволяет оценивать наследственные состояния двоичных символов совместно с темпы диверсификации связаны с разными состояниями персонажа; его также можно напрямую расширить до более общей модели с несколькими дискретными состояниями. В своей основной форме эта модель включает шесть параметров: две скорости видообразования (по одному для линий в состояниях 0 и 1); аналогично, два уровня вымирания; и две скорости смены характера. Эта модель позволяет проверять гипотезы о скорости видообразования / исчезновения / изменения характера за счет увеличения числа параметров.
Модели с непрерывным состоянием
В случае, когда признак принимает недискретные значения, нужно вместо этого обратиться к модели, в которой признак развивается как некоторый непрерывный процесс. Вывод предковых состояний с помощью максимального правдоподобия (или байесовских методов) будет происходить, как указано выше, но с вероятностями переходов в состоянии между соседними узлами, заданными некоторым другим непрерывным распределением вероятностей.
- Броуновское движение: в этом случае, если узлы и смежны в филогенезе (скажем, является предком ) и разделены ветвью длины вероятность перехода от находясь в состоянии к находясь в состоянии дается гауссовой плотностью со средним и дисперсия В этом случае есть только один параметр (), и модель предполагает, что признак свободно развивается без предвзятости в сторону увеличения или уменьшения, и что скорость изменения постоянна во всех ветвях филогенетического дерева.[50]
- Процесс Орнштейна-УленбекаКороче говоря, процесс Орнштейна-Уленбека - это непрерывный случайный процесс, который ведет себя как броуновское движение, но притягивается к некоторому центральному значению, где сила притяжения увеличивается с увеличением расстояния от этого значения.[51][52][53] Это полезно для моделирования сценариев, в которых признак подвержен стабилизирующий выбор вокруг определенного значения (скажем ). В рамках этой модели описанный выше переход находясь в состоянии к находясь в состоянии будет иметь вероятность, определяемую переходной плотностью процесса Орнштейна-Уленбека с двумя параметрами: , который описывает дисперсию ведущего броуновского движения, и , который описывает силу его притяжения к . В качестве как правило , процесс все меньше и меньше ограничивается его притяжением к и процесс становится броуновским движением. Из-за этого модели могут быть вложенными, и могут быть выполнены тесты отношения правдоподобия, позволяющие определить, какая из двух моделей является подходящей.[50]
- Стабильные модели непрерывной эволюции персонажа:[54] хотя броуновское движение привлекательно и поддается рассмотрению как модель непрерывной эволюции, оно не допускает ненейтральность в его основной форме и не предусматривает каких-либо изменений в скорости эволюции во времени. Вместо этого можно использовать стабильный процесс, значение которого в фиксированные моменты времени распределяется как стабильные дистрибутивы, чтобы смоделировать эволюцию черт. Стабильные процессы, грубо говоря, ведут себя как броуновские движения, которые также включают в себя прерывистые скачки. Это позволяет соответствующим образом моделировать сценарии, в которых ожидаются короткие всплески быстрой эволюции признаков. В этой ситуации методы максимального правдоподобия плохо подходят из-за неровной поверхности правдоподобия и из-за того, что вероятность может быть произвольно большой, поэтому байесовские методы более подходят.[54]
Приложения
Эволюция персонажа
Реконструкция предков широко используется для вывода экологических, фенотипических или биогеографических признаков, связанных с предковыми узлами на филогенетическом дереве. Все методы реконструкции наследственных признаков имеют подводные камни, поскольку они используют математические модели для прогнозирования того, как черты изменились при большом количестве недостающих данных. Эти недостающие данные включают состояние вымерших видов, относительные скорости эволюционных изменений, знание начальных состояний признаков и точность филогенетических деревьев. Во всех случаях, когда используется реконструкция наследственных признаков, результаты должны быть подтверждены анализом биологических данных, которые подтверждают выводы, основанные на модели. Гриффит О.В. и другие.[55]
Реконструкция предков позволяет изучать эволюционные пути, адаптивный отбор, экспрессия генов развития,[56][57] и функциональная дивергенция эволюционного прошлого. Для обзора биологических и вычислительных методов реконструкции предков см. Chang. и другие..[58] Критику методов вычисления реконструкции предков см. В Williams P.D. и другие..[13]
Поведение и эволюция истории жизни
В рогатом ящерицы (род Фриносома), живородство (живорождение) эволюционировала несколько раз на основе методов реконструкции предков.[59]
Реконструкция диеты галапагосских вьюрков
Имеются как филогенетические, так и характерные данные об излучении зяблики населяющий Галапагосские острова. Эти данные позволяют проверить гипотезы относительно времени и порядка изменений состояния персонажа во времени посредством реконструкции предкового состояния. В сухой сезон рационы 13 видов Галапагосские зяблики могут быть разделены на три широкие диетические категории, первая из которых предполагает потребление зерновых продуктов "зерноядные животные", те, кто глотает членистоногих, называются"насекомоядные"и те, которые потребляют растительность, классифицируются как"фоливоры".[23] Реконструкция диетического предкового состояния с использованием максимальной экономии восстанавливает 2 основных перехода от состояния насекомоядных: один - к зернистости, а другой - к фоливору. Реконструкция предкового состояния с максимальной вероятностью дает в целом аналогичные результаты с одним существенным отличием: общий предок древесного вьюрка (Camarhynchus) и земляной зяблик (Геоспиза) клады скорее зерноядные, чем насекомоядные (судя по бережливости). В этом случае разница между предковыми состояниями, возвращаемыми максимальной экономностью и максимальной вероятностью, вероятно, происходит в результате того факта, что оценки ML учитывают длины ветвей филогенетического дерева.[23]
Эволюция морфологических и физиологических признаков
Фриносоматид ящерицы демонстрируют замечательное морфологическое разнообразие, в том числе в относительной мышечной тип волокна состав в задних конечностях мышцы. Реконструкция предка на основе экономии квадратов (эквивалент максимальной вероятности при Броуновское движение эволюция персонажа[60]) указывает, что рогатые ящерицы, один из трех основных субкладов этой линии, претерпел значительное эволюционное увеличение доли быстроокисляющих гликолитических волокон в их подвздошно-фибулярных мышцах.[61]
Масса тела млекопитающих
При анализе массы тела 1,679 плацентарное млекопитающее видов, сравнивающих стабильные модели непрерывной эволюции характера с Броуновское движение модели, Эллиот и Мурс[54] показали, что эволюционный процесс, описывающий эволюцию массы тела млекопитающих, лучше всего характеризуется стабильная модель непрерывной эволюции характера, которая допускает редкие изменения большой величины. Согласно стабильной модели, предковые млекопитающие сохранили низкую массу тела за счет ранней диверсификации, причем значительное увеличение массы тела совпало с происхождением нескольких отрядов крупных видов с массой тела (например, копытных). Напротив, моделирование в рамках модели броуновского движения восстановило менее реалистичную, на порядок большую массу тела у предковых млекопитающих, что потребовало значительного уменьшения размера тела до эволюции Орденов, демонстрирующих небольшой размер тела (например, Rodentia). Таким образом, стабильные модели восстанавливают более реалистичную картину эволюции массы тела млекопитающих, допуская большие преобразования в небольшом подмножестве ветвей.[54]
Филогенетические сравнительные методы (выводы, сделанные путем сравнения родственных таксонов) часто используются для определения биологических характеристик, которые не развиваются независимо, что может выявить лежащую в основе зависимость. Например, эволюция формы клюва зяблика может быть связана с его поведением в поисках пищи. Однако не рекомендуется искать эти ассоциации путем прямого сравнения измерений или генетических последовательностей, потому что эти наблюдения не являются независимыми из-за их происхождения от общих предков. Для дискретных символов эта проблема была сначала решена в рамках максимальной экономии путем оценки того, имеют ли два символа тенденцию к изменению на одних и тех же ветвях дерева.[62][63] Фельзенштейн определили эту проблему для непрерывной эволюции характера и предложили решение, подобное реконструкции предков, в котором филогенетическая структура данных была приспособлена статистически, направляя анализ через вычисление «независимых контрастов» между узлами дерева, связанными неперекрывающимися ветвями.[28]
Молекулярная эволюция
На молекулярном уровне аминокислотные остатки в разных местах белка могут развиваться независимо, потому что они имеют прямое физико-химическое взаимодействие, или косвенно, за счет взаимодействия с общим субстратом или через дальнодействующие взаимодействия в структуре белка. Напротив, сложенная структура белка потенциально может быть выведена из распределения взаимодействий остатков.[64] Одно из самых ранних применений реконструкции предков для предсказания трехмерная структура белка через остаточные контакты, был опубликован Шиндяловым и его коллегами.[65] Филогении, относящиеся к 67 различным семействам белков, были созданы методом дистанционной кластеризации (невзвешенный парно-групповой метод со средним арифметическим, UPGMA), а предковые последовательности реконструированы методом экономии. Авторы сообщили о слабой, но значимой тенденции совместно развивающийся пары остатков должны быть совмещены в известной трехмерной структуре белков.
Реконструкция древних белков и последовательностей ДНК только недавно стала важной научной задачей. Развитие обширных баз данных геномных последовательностей в сочетании с достижениями в области биотехнологии и методов филогенетического вывода сделало реконструкцию предков дешевой, быстрой и практичной с научной точки зрения. Эта концепция была применена для идентификации коэволюционирующих остатков в белковых последовательностях с использованием более продвинутых методов реконструкции филогении и предковых последовательностей. Например, реконструкция предков использовалась для идентификации коэволюционирующих остатков в белках, кодируемых геномами РНК-вирусов, особенно в ВИЧ.[66][67][68]
Предки белок и ДНК Реконструкция позволяет воссоздать эволюцию белков и ДНК в лаборатории, чтобы их можно было изучать напрямую.[58] Что касается белков, это позволяет исследовать эволюцию современной молекулярной структуры и функции. Кроме того, реконструкция предкового белка может привести к открытию новых биохимических функций, которые были утрачены в современных белках.[69][70] Это также позволяет получить представление о биологии и экологии вымерших организмов.[71] Хотя большинство реконструкций предков касалось белков, они также использовались для проверки эволюционных механизмов на уровне бактериальных геномов.[72] и последовательности генов приматов.[73]
Дизайн вакцины
РНК-вирусы, такие как Вирус иммунодефицита человека (ВИЧ) развиваются чрезвычайно быстро, на несколько порядков быстрее, чем млекопитающие или птицы. Для этих организмов реконструкция предков может применяться в гораздо более коротком временном масштабе; например, чтобы реконструировать глобального или регионального прародителя эпидемия это длилось десятилетия, а не миллионы лет. Команда вокруг Брайана Гашена предложила[74] чтобы такие реконструированные штаммы использовались в качестве мишеней для вакцина усилия по дизайну, в отличие от последовательностей, изолированных от пациентов в настоящее время. Поскольку ВИЧ чрезвычайно разнообразен, вакцина, разработанная для вирусной популяции одного пациента, может не работать для другого пациента, потому что эволюционное расстояние между этими двумя вирусами может быть большим. Однако их последний общий предок ближе к каждому из двух вирусов, чем друг к другу. Таким образом, вакцина, разработанная для общего предка, могла бы иметь больше шансов быть эффективной для большей части циркулирующих штаммов. Другая команда пошла дальше этой идеи, разработав метод реконструкции центра дерева для создания последовательности, общее эволюционное расстояние которой до современных штаммов как можно меньше.[75] Строго говоря, этого метода не было. наследственный реконструкция, поскольку последовательность центра дерева (COT) не обязательно представляет собой последовательность, которая когда-либо существовала в истории эволюции вируса. Однако Роллан и его коллеги обнаружили, что в случае ВИЧ вирус COT был функциональным при синтезе. Подобные эксперименты с синтетическими предковыми последовательностями, полученными методом максимальной вероятности реконструкции, также показали, что эти предки являются функциональными и иммуногенными,[76][77] придавая некоторое доверие к этим методам. Кроме того, реконструкция предков потенциально может быть использована для вывода генетической последовательности переданных вариантов ВИЧ, которые привели к возникновению следующей инфекции, с целью определения отличительных характеристик этих вариантов (как неслучайный выбор переданной популяции вирусы), которые могут стать мишенью для разработки вакцины.[78]
Перестройки генома
Вместо того, чтобы делать выводы о последовательности ДНК предков, можно интересоваться крупномасштабной молекулярной структурой и содержанием генома предков. К этой проблеме часто подходят в комбинаторных рамках, моделируя геномы как перестановки генов или гомологичных областей. С этими перестановками разрешены различные операции, такие как инверсия (сегмент перестановки переворачивается на месте), удаление (сегмент удален), транспозиция (сегмент удаляется из одной части перестановки и вставляется где-то еще), или получение генетического содержимого через рекомбинация, дублирование или же горизонтальный перенос генов. «Проблема перестройки генома», впервые поставленная Уоттерсоном и его коллегами,[17] спрашивает: учитывая два генома (перестановки) и набор допустимых операций, какова самая короткая последовательность операций, которая преобразует один геном в другой? Обобщением этой проблемы применительно к реконструкции предков является «проблема множественной перестройки генома»:[79] учитывая набор геномов и набор допустимых операций, найдите (i) бинарное дерево с заданными геномами в качестве его листьев и (ii) назначение геномов внутренним узлам дерева, так что общее количество операций по всему дереву сведена к минимуму. Этот подход похож на экономию, за исключением того, что дерево выводится вместе с наследственными последовательностями. К сожалению, даже проблема перестройки одного генома NP-жесткий,[80] хотя ему уделялось много внимания в математике и информатике (обзор см. в Fertin et al.[81]).
Реконструкция геномов предков также называется кариотип реконструкция. Хромосомная роспись в настоящее время является основным экспериментальным методом.[82][83] Недавно исследователи разработали вычислительные методы для реконструкции наследственного кариотипа, используя преимущества сравнительная геномика.[84][85] Кроме того, сравнительная геномика и реконструкция генома предков были применены для идентификации древних событий горизонтального переноса генов у последнего общего предка линии (например, Candidatus Аккумулибактер фосфатис[86]), чтобы определить эволюционную основу приобретения признаков.
Пространственные приложения
Миграция
Реконструкция предков не ограничивается биологическими признаками. Пространственное расположение также является признаком, и методы реконструкции предков позволяют сделать вывод о местонахождении предков рассматриваемых индивидов. Такие методы использовали Леми и его коллеги.[16] географически проследить предков 192 Птичий грипп A-H5N1 штаммов, отобранных из двадцати населенных пунктов Европы и Азии, и из 101 вирус бешенства последовательности взяты из двенадцати африканских стран.
Рассмотрение местоположений как дискретных состояний (страны, города и т. Д.) Позволяет применять модели дискретных состояний, описанные выше. Однако, в отличие от модели, где пространство состояний для признака невелико, мест может быть много, и переходы между определенными парами состояний могут происходить редко или никогда не происходить; например, миграция между удаленными местами может никогда не произойти напрямую, если воздушное сообщение между этими двумя местами не существует, поэтому такие миграции должны сначала проходить через промежуточные регионы. Это означает, что в модели может быть много параметров, равных нулю или близких к нулю. С этой целью Леми и его коллеги использовали байесовскую процедуру не только для оценки параметров и предковых состояний, но и для выбора того, какие параметры миграции не равны нулю; их работа предполагает, что эта процедура действительно приводит к более эффективному использованию данных. Они также исследуют использование предшествующих распределений, которые включают географическую структуру или гипотезы о динамике миграции, обнаруживая, что те, которые они рассматривали, мало повлияли на результаты.
Используя этот анализ, команда Леми обнаружила, что наиболее вероятным центром распространения A-H5N1 является Гуандун, с Гонконг также получает заднюю поддержку. Кроме того, их результаты подтверждают гипотезу о длительном присутствии африканского бешенства в Западная Африка.
Ареалы видов
Вывод исторического биогеографический закономерности часто требуют реконструкции ареалов предков видов на филогенетических деревьях.[87] Например, хорошо разрешенная филогения видов растений в роде Киртандра[87] использовалась вместе с информацией об их географических ареалах для сравнения четырех методов реконструкции ареалов предков. Команда сравнила экономию Fitch,[20] (FP; экономия) стохастическое отображение[88] (SM; максимальная вероятность), расселение-викарианс анализ[89] (DIVA; экономия) и расселение-вымирание-кладогенез[15][90] (DEC; максимальная вероятность). Результаты показали, что оба метода экономии работают плохо, что, вероятно, связано с тем, что методы экономии не учитывают длину ветвей. Оба метода максимального правдоподобия работают лучше; однако анализ DEC, который дополнительно позволяет включать геологические априорные значения, дал более реалистичные выводы об эволюции ареала в Киртандра относительно других методов.[87]
Другой метод максимального правдоподобия восстанавливает филогеографическую историю гена.[91] путем реконструкции местонахождения предков отобранных таксонов. Этот метод предполагает пространственно явную модель случайного блуждания миграции, чтобы восстановить местонахождение предков с учетом географических координат людей, представленных кончиками филогенетического дерева. Применительно к филогенетическому дереву хоровых лягушек Pseudacris feriarumэтот метод позволил восстановить недавнюю экспансию на север, более высокую дальность расселения по поколениям в недавно колонизированном регионе, нецентральное родовое местоположение и направленную миграцию.[91]
Первое рассмотрение проблемы множественной перестройки генома задолго до ее формализации в терминах перестановок было представлено Стуртевантом и Добжанским в 1936 году.[92] Они исследовали геномы нескольких штаммов плодовая муха из разных географических мест, и заметил, что одна конфигурация, которую они назвали «стандартной», была наиболее распространенной во всех изученных областях. Примечательно, что они также заметили, что четыре разных штамма могут быть получены из стандартной последовательности с помощью одной инверсии, а два других могут быть связаны с помощью второй инверсии. Это позволило им выдвинуть гипотезу о филогенезе последовательностей и сделать вывод, что стандартная последовательность, вероятно, также была предковой.
Лингвистическая эволюция
Реконструкции слов и явлений древних протоязыки Такие как Протоиндоевропейский были выполнены на основе наблюдаемых аналогов в современных языках. Обычно эти анализы проводят вручную с использованием «сравнительного метода».[93] Во-первых, слова из разных языков с общей этимологией (родственники) идентифицируются в современных изучаемых языках, аналогично идентификации ортологичный биологические последовательности. Во-вторых, идентифицируются соответствия между отдельными звуками в родственных словах - шаг, подобный биологическому. выравнивание последовательностей, хотя выполняется вручную. Наконец, вероятные звуки предков выдвигаются путем ручной проверки и различных эвристических методов (например, тот факт, что в большинстве языков есть и носовые и неназальные гласные).[93]
Программного обеспечения
Доступно множество программных пакетов, которые могут выполнять реконструкцию состояния предков. Как правило, эти программные пакеты были разработаны и поддерживаются усилиями ученых в смежных областях и выпущены под лицензии на бесплатное программное обеспечение. Следующая таблица не предназначена для исчерпывающего перечисления всех доступных пакетов, но представляет собой репрезентативную выборку обширного разнообразия пакетов, которые реализуют методы реконструкции предков с различными возможностями и функциями.
Имя | Методы | Платформа | Входы | ! Типы персонажей | Непрерывные (C) или дискретные символы (D) | Лицензия на программное обеспечение |
---|---|---|---|---|---|---|
PAML | Максимальное правдоподобие | Unix, Mac, Win | ФИЛИП, НЕКСУС, ФАСТА | Нуклеотид, Белок | D | Стандартная общественная лицензия GNU, версия 3 |
ЗВЕРЬ | Байесовский | Unix, Mac, Win | NEXUS, ЗВЕРЬ XML | Нуклеотид, Белок, География | CD | Стандартная общественная лицензия ограниченного применения GNU |
фитинструменты | Максимальное правдоподобие | Unix, Mac, Win | newick, nexus | Качественные и количественные признаки | CD | Стандартная общественная лицензия GNU |
Обезьяна | Максимальное правдоподобие | Unix, Mac, Win | NEXUS, FASTA, CLUSTAL | Нуклеотид, Белок | CD | Стандартная общественная лицензия GNU |
Диверситри | Максимальное правдоподобие | Unix, Mac, Win | NEXUS | Качественные и количественные признаки, Географические | CD | Стандартная общественная лицензия GNU, версия 2 |
HyPhy | Максимальное правдоподобие | Unix, Mac, Win | МЕГА, НЕКСУС, ФАСТА, ФИЛИП | Нуклеотид, белок (настраиваемый) | D | Лицензия свободной документации GNU 1.3 |
Байесовский | Байесовский | Unix, Mac, Win | TSV или таблица с разделителями-пробелами. Строки - это виды, столбцы - признаки. | Качественные и количественные признаки | CD | Лицензия Creative Commons Attribution |
Лагранж | Максимальное правдоподобие | Linux, Mac, Win | TSV / CSV регионов вида. Строки - это виды, а столбцы - географические регионы. | Географический | - | Стандартная общественная лицензия GNU, версия 2 |
Мескитовый | Экономия, максимальная вероятность | Unix, Mac, Win | Fasta, NBRF, Genbank, PHYLIP, CLUSTAL, TSV | Нуклеотид, белок, Географический | CD | Лицензия Creative Commons Attribution 3.0 |
Филомаппер | Максимальное правдоподобие, байесовское (начиная с версии 2) | Unix, Mac, Win | NEXUS | Географическая, экологическая ниша | CD | - |
Предки | Максимальное правдоподобие | Интернет | Fasta | Нуклеотид (инделы) | D | - |
Фирекс | Максимальная экономия | Linux | Fasta | Экспрессия гена | CD | Проприетарный |
SIMMAP | Стохастическое отображение | Mac | XML-подобный формат | Нуклеотид, качественные признаки | D | Проприетарный |
MrBayes | Байесовский | Unix, Mac, Win | NEXUS | Нуклеотид, Белок | D | Стандартная общественная лицензия GNU |
PARANA | Максимальная экономия | Unix, Mac, Win | Newick | Биологические сети | D | Лицензия Apache |
PHAST (ПРЕДКВЕЛ) | Максимальное правдоподобие | Unix, Mac, Win | Множественное выравнивание | Нуклеотид | D | Лицензия BSD |
РАСП | Максимальное правдоподобие, байесовский | Unix, Mac, Win | Newick | Географический | D | - |
VIP | Максимальная экономия | Linux, Win | Newick | Географический | D (сетка) | GPL Creative Commons |
FastML | Максимальное правдоподобие | Интернет, Unix | Fasta | Нуклеотид, Белок | D | Авторские права |
MLGO | Максимальная вероятность | Интернет | Обычай | Перестановка порядка генов | D | GNU |
БАДЖЕР | Байесовский | Unix, Mac, Win | Обычай | Перестановка порядка генов | D | GNU GPL версии 2 |
СЧИТАТЬ | Максимальная экономия, максимальная вероятность | Unix, Mac, Win | Текстовый файл с разделителями-табуляторами, содержащий строки для таксонов и данных подсчета в столбцах. | Подсчет (числовых) данных (например, размер семейства гомологов) | D | BSD |
МЕГА | Максимальная экономия, максимальная вероятность. | Mac, Win | МЕГА | Нуклеотид, Белок | D | Проприетарный |
УГЛЫ | Местная экономия | Unix | Обычай | Карты генома | D | Стандартная общественная лицензия GNU, версия 3 |
РАСШИФРОВАТЕЛЬ | Максимальное правдоподобие | Unix, Mac, Win | ФАСТА, ГенБанк | Нуклеотид | D | Стандартная общественная лицензия GNU, версия 3 |
EREM | Максимальная вероятность. | Модуль Win, Unix, Matlab | Пользовательский текстовый формат для параметров модели, дерева, наблюдаемых значений символов. | Двоичный | D | Не указано, хотя сайт указывает, что программное обеспечение находится в свободном доступе. |
Описание пакетов
Молекулярная эволюция
Большинство этих программных пакетов предназначены для анализа данных генетической последовательности. Например, PAML[94] представляет собой набор программ для филогенетического анализа выравнивания последовательностей ДНК и белков по максимальной вероятности. Реконструкция предков может быть выполнена с помощью codeml программа. Кроме того, LAZARUS - это коллекция Python скрипты, которые включают в себя функции наследственной реконструкции PAML для пакетной обработки и большей простоты использования.[95] Программные пакеты, такие как МЕГА, HyPhy и Mesquite также выполняют филогенетический анализ данных о последовательностях, но они разработаны так, чтобы быть более модульными и настраиваемыми. HyPhy[96] реализует совместный метод максимального правдоподобия реконструкции наследственной последовательности[7] который может быть легко адаптирован для восстановления более обобщенного диапазона дискретных состояний предков, таких как географические местоположения, путем указания индивидуализированной модели на языке пакета. Мескитовый[97] предоставляет методы реконструкции состояния предков как для дискретных, так и для непрерывных символов с использованием методов максимальной экономии и максимального правдоподобия. Он также предоставляет несколько инструментов визуализации для интерпретации результатов реконструкции предков. МЕГА[98] также является модульной системой, но в ней больше внимания уделяется простоте использования, чем настройке анализов. Начиная с версии 5, MEGA позволяет пользователю реконструировать родовые состояния, используя методы максимальной экономии, максимального правдоподобия и эмпирические байесовские методы.[98]
Байесовский анализ генетических последовательностей может придать большую надежность ошибочной спецификации модели. MrBayes[99] позволяет сделать вывод о предковых состояниях в предковых узлах с использованием полного иерархического байесовского подхода. Программа PREQUEL, распространяемая в пакете PHAST.[100] выполняет сравнительную эволюционную геномику с использованием реконструкции наследственной последовательности. SIMMAP[101] стохастически отображает мутации на филогении. Байесовский[31] анализирует дискретные или непрерывные символы в байесовской структуре для оценки моделей эволюции, реконструкции предков и обнаружения коррелированной эволюции между парами признаков.
Другие типы персонажей
Другие программные пакеты больше ориентированы на анализ качественных и количественных признаков (фенотипы). Например, обезьяна упаковка[102] в среде статистических вычислений р также предоставляет методы для реконструкции состояния предков как для дискретных, так и для непрерывных символов через 'туз', включая максимальное правдоподобие. Phyrex реализует алгоритм на основе максимальной экономии для восстановления профилей экспрессии предковых генов в дополнение к методу максимального правдоподобия для восстановления наследственных генетических последовательностей (путем обертывания функции baseml в PAML).[103]
Несколько программных пакетов также реконструируют филогеография. ЗВЕРЬ (Байесовский эволюционный анализ по деревьям выборки)[104] предоставляет инструменты для восстановления географических местоположений предков из наблюдаемых последовательностей, аннотированных данными местоположения с использованием байесовского MCMC методы отбора проб. Диверситри[105] представляет собой пакет R, предоставляющий методы для реконструкции состояния предков в Mk2 (a марковская модель с непрерывным временем эволюции двоичных символов).[106] и модели BiSSE (двоичное состояние видообразования и исчезновения). Лагранж проводит анализ реконструкции эволюции ареала на филогенетических деревьях.[15] Филомаппер[91] представляет собой статистическую основу для оценки исторических закономерностей потока генов и географических местонахождений предков. РАСП[107] выводит наследственные состояния с использованием статистического анализа дисперсии-викариантности, методов Лагранжа, Байеса-Лагранжа, BayArea и BBM. VIP[108] делает вывод об исторической биогеографии, исследуя разрозненные географические распределения.
Перестройки генома дают ценную информацию в сравнительная геномика между видами. УГНЕНИЯ[109] сравнивает существующие родственные геномы посредством наследственной реконструкции генетических маркеров. БАДЖЕР[110] использует байесовский подход к изучению истории перестройки генов. Считать[111] реконструирует эволюцию размера семейств генов. EREM[112] анализирует усиление и потерю генетических признаков, кодируемых двоичными символами. PARANA[113] выполняет логический вывод о наследственных биологических сетях, представляющих потерю и дупликацию генов.
Веб-приложения
Наконец, существует несколько приложений на базе веб-сервера, которые позволяют исследователям использовать методы максимального правдоподобия для реконструкции предков различных типов персонажей без установки какого-либо программного обеспечения. Например, предки[114] веб-сервер для реконструкции генома предков путем идентификации и размещения синтенический регионы. FastML[115] - это веб-сервер для вероятностной реконструкции наследственных последовательностей по максимальной вероятности, который использует модель символа пробела для восстановления индель вариация. MLGO[116] - это веб-сервер для анализа порядка генов максимального правдоподобия.
Будущие направления
Разработка и применение вычислительных алгоритмов для реконструкции предков продолжает оставаться активной областью исследований в различных дисциплинах. Например, реконструкция вставок и удалений последовательностей (инделек) отставала от более простого применения моделей замен. Бушар-Коте и Джордан недавно описали новую модель (процесс Пуассона-Инделя).[117] который представляет собой важный шаг вперед по сравнению с архетипической моделью индел-эволюции Торна-Кишино-Фельзенштейна.[118] Кроме того, эта область продвигается вперед благодаря быстрым достижениям в области секвенирование следующего поколения технология, при которой последовательности генерируются из миллионов матриц нуклеиновых кислот путем обширного распараллеливания реакций секвенирования в специализированном устройстве. Эти достижения позволили создать "глубокий" снимок генетического состава быстро развивающейся популяции, такой как РНК-вирусы[119] или опухолевые клетки,[120] в относительно короткие сроки. В то же время огромное количество данных и профилей ошибок секвенирования для конкретных платформ создало новые биоинформатические проблемы для обработки этих данных для реконструкции предковой последовательности.
Смотрите также
Рекомендации
Эта статья была адаптирована из следующего источника под CC BY 4.0 лицензия (2015) (отчеты рецензента): "Реконструкция предков", PLOS вычислительная биология, 12 (7): e1004763, 12 июля 2016 г., Дои:10.1371 / JOURNAL.PCBI.1004763, ISSN 1553-734X, ЧВК 4942178, PMID 27404731, Викиданные Q28596371
- ^ а б Омланд, Кевин Э. (1999). «Предположения и вызовы реконструкции родового государства». Систематическая биология. 48 (3): 604–611. Дои:10.1080/106351599260175. ISSN 1063-5157.
- ^ Цай, Вэй; Пей, Чимин; Гришин, Ник V (2004). «Реконструкция предковых белковых последовательностей и ее применения». BMC Эволюционная биология. 4 (1): 33. Дои:10.1186/1471-2148-4-33. ISSN 1471-2148. ЧВК 522809. PMID 15377393.
- ^ Платник, Норман I .; Кэмерон, Х. Дон (1977). «Кладистические методы текстового, лингвистического и филогенетического анализа». Систематическая зоология. 26 (4): 380. Дои:10.2307/2412794. ISSN 0039-7989. JSTOR 2412794.
- ^ Бентли, Р. Александр; Тегерани, Джамшид Дж. (2013). "Филогения Красной Шапочки". PLOS ONE. 8 (11): e78871. Bibcode:2013PLoSO ... 878871T. Дои:10.1371 / journal.pone.0078871. ISSN 1932-6203. ЧВК 3827309. PMID 24236061.
- ^ Михалак, Павел; Уокер, Роберт С .; Hill, Kim R .; Флинн, Марк V .; Эллсуорт, Райан М. (2011). "Эволюционная история практики брака охотников и собирателей". PLOS ONE. 6 (4): e19066. Bibcode:2011PLoSO ... 619066W. Дои:10.1371 / journal.pone.0019066. ISSN 1932-6203. ЧВК 3083418. PMID 21556360.
- ^ Брукс, Дэниел Р. (1999). «Филогении и сравнительный метод поведения животных, под редакцией Эмиджи П. Мартинс, Oxford University Press, 1996. X + 415 стр.». Поведенческие процессы. 47 (2): 135–136. Дои:10.1016 / S0376-6357 (99) 00038-8. ISBN 978-0-19-509210-3. ISSN 0376-6357. PMID 24896936. S2CID 9872907.
- ^ а б c Пупко, Т .; Pe, I .; Шамир, Р .; Граур, Д. (2000). «Быстрый алгоритм совместной реконструкции аминокислотных последовательностей предков». Молекулярная биология и эволюция. 17 (6): 890–896. Дои:10.1093 / oxfordjournals.molbev.a026369. ISSN 0737-4038. PMID 10833195.
- ^ а б c Пагель, Марк; Мид, Эндрю; Баркер, Дэниел (2004). "Байесовская оценка состояний наследственных признаков по филогении". Систематическая биология. 53 (5): 673–684. Дои:10.1080/10635150490522232. ISSN 1063-5157. PMID 15545248.
- ^ Sanger, F .; Томпсон, Э. О. П .; Китаи, Рут (1955). «Амидные группы инсулина». Биохимический журнал. 59 (3): 509–518. Дои:10.1042 / bj0590509. ISSN 0264-6021. ЧВК 1216278. PMID 14363129.
- ^ Полинг, Линус; Цукеркандль, Эмиль; Хенриксен, Тормод; Левстад, Рольф (1963). "Химическая палеогенетика. Молекулярные" исследования восстановления "вымерших форм жизни". Acta Chemica Scandinavica. 17 прилаг .: 9–16. Дои:10.3891 / acta.chem.scand.17s-0009. ISSN 0904-213X.
- ^ а б Добжанский, Феодосий; Стертевант, Альфред (1938). «Инверсии хромосом Drosophila pseudoobscura». Генетика. 23 (1): 28–64. ЧВК 1209001. PMID 17246876.
- ^ Хармс, Майкл Дж; Торнтон, Джозеф В. (2010). «Анализ структуры и функции белков с использованием реконструкции предковых генов». Текущее мнение в структурной биологии. 20 (3): 360–366. Дои:10.1016 / j.sbi.2010.03.005. ISSN 0959-440X. ЧВК 2916957. PMID 20413295.
- ^ а б c d Уильямс, Пол Д .; Поллок, Дэвид Д.; Блэкберн, Бенджамин П .; Гольдштейн, Ричард А. (2006). «Оценка точности методов реконструкции белков предков». PLOS вычислительная биология. 2 (6): e69. Bibcode:2006PLSCB ... 2 ... 69 Вт. Дои:10.1371 / journal.pcbi.0020069. ISSN 1553-734X. ЧВК 1480538. PMID 16789817.
- ^ Ронквист, Ф (2004). «Байесовский вывод эволюции характера». Тенденции в экологии и эволюции. 19 (9): 475–481. Дои:10.1016 / j.tree.2004.07.002. ISSN 0169-5347. PMID 16701310.
- ^ а б c Ree, R.H .; Смит, С. А. (2008). "Максимально вероятный вывод эволюции географического ареала по рассредоточению, локальному вымиранию и кладогенезу". Систематическая биология. 57 (1): 4–14. Дои:10.1080/10635150701883881. ISSN 1063-5157. PMID 18253896.
- ^ а б Фрейзер, Кристоф; Лемей, Филипп; Рамбаут, Андрей; Драммонд, Алексей Дж .; Сушард, Марк А. (2009). «Байесовская филогеография находит свои корни». PLOS вычислительная биология. 5 (9): e1000520. Bibcode:2009PLSCB ... 5E0520L. Дои:10.1371 / journal.pcbi.1000520. ISSN 1553-7358. ЧВК 2740835. PMID 19779555.
- ^ а б Watterson, G.A .; Ewens, W.J .; Hall, T.E .; Морган, А. (1982). «Проблема инверсии хромосом». Журнал теоретической биологии. 99 (1): 1–7. Дои:10.1016/0022-5193(82)90384-8. ISSN 0022-5193.
- ^ Таффли, Крис; Сталь, Майк (1997). «Связь между максимальной вероятностью и максимальной экономией при простой модели подмены сайта». Вестник математической биологии. 59 (3): 581–607. Дои:10.1007 / BF02459467. ISSN 0092-8240. PMID 9172826. S2CID 189885872.
- ^ Swofford, Дэвид Л .; Мэддисон, Уэйн П. (1987). «Реконструкция наследственных состояний характера при экономичности Вагнера». Математические биологические науки. 87 (2): 199–229. Дои:10.1016/0025-5564(87)90074-5. ISSN 0025-5564.
- ^ а б Фитч, Уолтер М. (1971). «На пути к определению хода эволюции: минимальные изменения для конкретной топологии дерева». Систематическая зоология. 20 (4): 406–416. Дои:10.2307/2412116. ISSN 0039-7989. JSTOR 2412116.
- ^ Стаматакис, А. (2006). «RAxML-VI-HPC: филогенетический анализ на основе максимального правдоподобия с тысячами таксонов и смешанных моделей» (PDF). Биоинформатика. 22 (21): 2688–2690. Дои:10.1093 / биоинформатика / btl446. ISSN 1367-4803. PMID 16928733.
- ^ Санкофф, Дэвид (1975). «Минимальные деревья мутаций последовательностей». Журнал SIAM по прикладной математике. 28 (1): 35–42. CiteSeerX 10.1.1.665.9596. Дои:10.1137/0128004. ISSN 0036-1399.
- ^ а б c d е Шлютер, Дольф; Прайс, Тревор; Mooers, Arne O .; Людвиг, Дональд (1997). «Вероятность состояний предков в адаптивной радиации». Эволюция. 51 (6): 1699. Дои:10.2307/2410994. ISSN 0014-3820. JSTOR 2410994. PMID 28565128.
- ^ Фельзенштейн, Джозеф (1973). «Методы максимального правдоподобия и минимальных шагов для оценки эволюционных деревьев по данным о дискретных признаках». Систематическая зоология. 22 (3): 240–249. Дои:10.2307/2412304. ISSN 0039-7989. JSTOR 2412304.
- ^ а б c Каннингем, Клиффорд В .; Омланд, Кевин Э .; Окли, Тодд Х. (1998). «Реконструкция наследственных состояний характера: критическая переоценка». Тенденции в экологии и эволюции. 13 (9): 361–366. Дои:10.1016 / S0169-5347 (98) 01382-2. ISSN 0169-5347. PMID 21238344.
- ^ Шлютер, Арне О. Мурс, Дольф (1999). «Реконструкция состояний предков с максимальной вероятностью: поддержка одно- и двухскоростных моделей». Систематическая биология. 48 (3): 623–633. CiteSeerX 10.1.1.594.175. Дои:10.1080/106351599260193. ISSN 1063-5157.
- ^ Ли, Гуолян; Сталь, Майк; Чжан, Лусинь (2008). «Больше таксонов не обязательно лучше для реконструкции состояний предков». Систематическая биология. 57 (4): 647–653. arXiv:0803.0195. Дои:10.1080/10635150802203898. ISSN 1063-5157. PMID 18709600. S2CID 1373201.
- ^ а б Фельзенштейн, Джозеф (1985). «Филогении и сравнительный метод». Американский натуралист. 125 (1): 1–15. Дои:10.1086/284325. ISSN 0003-0147.
- ^ а б c d Ян, Цзихэн; Кумар, Судхир; Неи, Масатоши (1995). «Новый метод определения наследственных нуклеотидных и аминокислотных последовательностей». Генетика. 141 (4): 1641–50. ЧВК 1206894. PMID 8601501.
- ^ Коши, Джеффри М .; Гольдштейн, Ричард А. (1996). «Вероятностная реконструкция предковых белковых последовательностей». Журнал молекулярной эволюции. 42 (2): 313–320. Bibcode:1996JMolE..42..313K. CiteSeerX 10.1.1.1031.2646. Дои:10.1007 / BF02198858. ISSN 0022-2844. PMID 8919883. S2CID 15997589.
- ^ а б Пагель, Марк (1999). «Подход максимального правдоподобия к восстановлению состояний предков отдельных персонажей на филогенезах». Систематическая биология. 48 (3): 612–622. Дои:10.1080/106351599260184. ISSN 1063-5157.
- ^ Гиндон, Стефан; Гаскуэль, Оливье (2003). «Простой, быстрый и точный алгоритм для оценки крупных филогений по максимальному правдоподобию». Систематическая биология. 52 (5): 696–704. Дои:10.1080/10635150390235520. ISSN 1063-5157. PMID 14530136.
- ^ Доорник, Юрген А .; Оомс, Мариус (2003). «Вычислительные аспекты оценки максимального правдоподобия авторегрессионных частично интегрированных моделей скользящего среднего». Вычислительная статистика и анализ данных. 42 (3): 333–348. Дои:10.1016 / S0167-9473 (02) 00212-8. ISSN 0167-9473.
- ^ а б Фельзенштейн, Джозеф (1981). «Эволюционные деревья из последовательностей ДНК: подход максимального правдоподобия». Журнал молекулярной эволюции. 17 (6): 368–376. Bibcode:1981JMolE..17..368F. Дои:10.1007 / BF01734359. ISSN 0022-2844. PMID 7288891. S2CID 8024924.
- ^ Эйр-Уокер, Адам (1998). «Проблемы экономичности последовательностей необъективного базового состава». Журнал молекулярной эволюции. 47 (6): 686–690. Bibcode:1998JMolE..47..686E. Дои:10.1007 / PL00006427. ISSN 0022-2844. PMID 9847410. S2CID 26128712.
- ^ Пупко, Т .; Pe'er, I .; Hasegawa, M .; Graur, D .; Фридман, Н. (2002). «Алгоритм ветвления и привязки для вывода наследственных аминокислотных последовательностей, когда скорость замены варьируется между сайтами: приложение к эволюции пяти семейств генов». Биоинформатика. 18 (8): 1116–1123. Дои:10.1093 / биоинформатика / 18.8.1116. ISSN 1367-4803. PMID 12176835.
- ^ Gruenheit, N .; Lockhart, P.J .; Сталь, М .; Мартин, В. (2008). «Трудности в тестировании коварионоподобных свойств последовательностей при смешивающем влиянии изменения пропорций переменных сайтов» (PDF). Молекулярная биология и эволюция. 25 (7): 1512–1520. Дои:10.1093 / molbev / msn098. ISSN 0737-4038. PMID 18424773.
- ^ Huelsenbeck, J. P .; Ронквист, Ф. (2001). "MRBAYES: Байесовский вывод филогенетических деревьев". Биоинформатика. 17 (8): 754–755. Дои:10.1093 / биоинформатика / 17.8.754. ISSN 1367-4803. PMID 11524383.
- ^ Ян, Цзихэн (1997). «PAML: программный комплекс для филогенетического анализа максимального правдоподобия». Биоинформатика. 13 (5): 555–556. Дои:10.1093 / биоинформатика / 13.5.555. ISSN 1367-4803. PMID 9367129.
- ^ а б Huelsenbeck, John P .; Боллбэк, Джонатан П. (2001). «Эмпирическая и иерархическая байесовская оценка наследственных состояний». Систематическая биология. 50 (3): 351–366. CiteSeerX 10.1.1.319.4271. Дои:10.1080/106351501300317978. ISSN 1076-836X. PMID 12116580.
- ^ Лутцони, Франсуа; Пагель, Марк; Риб, Валери (2001). «Основные грибковые линии происходят от симбиотических предков лишайников». Природа. 411 (6840): 937–940. Bibcode:2001Натура.411..937Л. Дои:10.1038/35082053. ISSN 0028-0836. PMID 11418855. S2CID 4414913.
- ^ Hanson-Smith, V .; Kolaczkowski, B .; Торнтон, Дж. У. (2010). «Устойчивость реконструкции наследственной последовательности к филогенетической неопределенности». Молекулярная биология и эволюция. 27 (9): 1988–1999. Дои:10.1093 / molbev / msq081. ISSN 0737-4038. ЧВК 2922618. PMID 20368266.
- ^ Hillis, D .; Bull, J .; Белый, М .; Badgett, M .; Molineux, I. (1992). «Экспериментальная филогенетика: порождение известной филогении». Наука. 255 (5044): 589–592. Bibcode:1992Sci ... 255..589H. Дои:10.1126 / science.1736360. ISSN 0036-8075. PMID 1736360.
- ^ Окли, Тодд Х .; Каннингем, Клиффорд В. (2000). «Независимые контрасты успешны там, где реконструкция предка терпит неудачу в известной филогении бактериофага». Эволюция. 54 (2): 397–405. Дои:10.1554 / 0014-3820 (2000) 054 [0397: ICSWAR] 2.0.CO; 2. ISSN 0014-3820. PMID 10937216.
- ^ Finarelli, John A .; Флинн, Джон Дж. (2006). «Реконструкция состояния предков размеров тела у Caniformia (Carnivora, Mammalia): влияние включения данных из летописи окаменелостей». Систематическая биология. 55 (2): 301–313. Дои:10.1080/10635150500541698. ISSN 1063-5157. PMID 16611601.
- ^ Альберт, Джеймс С .; Джонсон, Дерек М .; Knouft, Джейсон Х. (2009). «Окаменелости позволяют лучше оценить размер тела предков, чем существующие таксоны рыб». Acta Zoologica. 90: 357–384. Дои:10.1111 / j.1463-6395.2008.00364.x. ISSN 0001-7272.
- ^ Слейтер, Грэм Дж .; Хармон, Люк Дж .; Альфаро, Майкл Э. (2012). «Объединение окаменелостей с молекулярными филогенезами улучшает вывод об эволюции признаков». Эволюция. 66 (12): 3931–3944. Дои:10.1111 / j.1558-5646.2012.01723.x. ISSN 0014-3820. PMID 23206147. S2CID 24390146.
- ^ Вебстер, А. Дж .; Первис, А. (2002). «Проверка точности методов восстановления предковых состояний непрерывных персонажей». Труды Королевского общества B: биологические науки. 269 (1487): 143–149. Дои:10.1098 / rspb.2001.1873. ISSN 0962-8452. ЧВК 1690869. PMID 11798429.
- ^ Мэддисон, Уэйн; Мидфорд, Питер; Отто, Сара (2007). «Оценка влияния двоичного символа на видообразование и исчезновение». Систематическая биология. 56 (5): 701–710. Дои:10.1080/10635150701607033. ISSN 1063-5157. PMID 17849325.
- ^ а б Мартинс, Эмилия П. (1994). "'Оценка скорости фенотипической эволюции по сравнительным данным ». Американский натуралист. 144 (2): 193–209. Дои:10.1086/285670.
- ^ Фельзенштейн, J (1988). «Филогении и количественные признаки». Ежегодный обзор экологии и систематики. 19: 445–471. Дои:10.1146 / annurev.ecolsys.19.1.445.
- ^ Garland, T. Jr .; Дикерман, А. В .; Janis, C.M .; Джонс, Дж. А. (1993). «Филогенетический анализ ковариации с помощью компьютерного моделирования». Систематическая биология. 42 (3): 265–292. Дои:10.1093 / sysbio / 42.3.265.
- ^ Купер Н., Г. Х. Томас, К. Вендитти, А. Мид и Р. П. Фреклтон. 2015. Предупреждение об использовании моделей Орнштейна Уленбека в макроэволюционных исследованиях. Биологический журнал Линнеевского общества.
- ^ а б c d Эллиот, Майкл Дж; Муерс, Арне Ø (2014). «Вывод о наследственных состояниях без предположения о нейтралитете или постепенности с использованием стабильной модели непрерывной эволюции характера». BMC Эволюционная биология. 14 (1): 226. Дои:10.1186 / s12862-014-0226-8. ISSN 1471-2148. ЧВК 4266906. PMID 25427971.
- ^ Гриффит, Оливер В .; Блэкберн, Дэниел Дж .; Брэндли, Мэтью С .; Ван Дайк, Джеймс У .; Уиттингтон, Камилла М .; Томпсон, Майкл Б. (2015). «Реконструкции состояния предков требуют биологических доказательств для проверки эволюционных гипотез: тематическое исследование, изучающее эволюцию репродуктивного режима у чешуекрылых рептилий». Журнал экспериментальной зоологии, часть B: Молекулярная эволюция и эволюция развития. 324 (6): 493–503. Дои:10.1002 / jez.b.22614. ISSN 1552-5007. PMID 25732809.
- ^ Erkenbrack, E.M .; Ako-Asare, K .; Miller, E .; Текеленбург, С .; Томпсон, Дж. Р .; Романо, Л. (2016). «Реконструкция предкового состояния путем сравнительного анализа ядра GRN, действующего у иглокожих». Гены развития и эволюция. 226 (1): 37–45. Дои:10.1007 / s00427-015-0527-у. ISSN 0949-944X. PMID 26781941. S2CID 6067524.
- ^ Erkenbrack, E.M .; Томпсон, Дж. Р. (2019). «Филогенетика клеточного типа информирует об эволюционном происхождении личинок иглокожих скелетогенных клеток». Биология коммуникации. 2: 160. Дои:10.1038 / с42003-019-0417-3. ISSN 2399-3642. ЧВК 6499829. PMID 31069269.
- ^ а б Chang, Belinda S.W .; Ugalde, Juan A .; Мац, Михаил В. (2005). «Применение реконструкции предкового белка для понимания функции белка: GFP-подобные белки». Методы в энзимологии. 395: 652–670. Дои:10.1016 / S0076-6879 (05) 95034-9. ISBN 9780121828004. ISSN 0076-6879. PMID 15865989.
- ^ Ходжес, В. Л. (2004). «Эволюция живорождения у рогатых ящериц (Фриносома): проверка гипотезы холодного климата ». Журнал эволюционной биологии. 17 (6): 1230–1237. Дои:10.1111 / j.1420-9101.2004.00770.x. PMID 15525408. S2CID 25069395.
- ^ Мэддисон, У. П. (1991). "Квадрат-изменение экономичных реконструкций предковых состояний для непрерывных знаков на филогенетическом дереве". Систематическая биология. 40 (3): 304–314. Дои:10.1093 / sysbio / 40.3.304.
- ^ Бонин, К. Э. (2005). «Вариации типа мышечных волокон у ящериц (Squamata) и филогенетическая реконструкция предполагаемых предковых состояний». Журнал экспериментальной биологии. 208 (23): 4529–4547. Дои:10.1242 / jeb.01903. PMID 16339872.
- ^ Ридли, Марк (1983). Объяснение органического разнообразия: сравнительный метод и приспособления для спаривания. Оксфорд: Clarendon Press.
- ^ Мэддисон, Уэйн П. (1990). «Метод проверки коррелированной эволюции двух бинарных символов: прибыль или убыток сосредоточены на определенных ветвях филогенетического дерева?». Эволюция. 44 (3): 539–557. Дои:10.2307/2409434. ISSN 0014-3820. JSTOR 2409434. PMID 28567979.
- ^ Гебель, Ульрике; Сандер, Крис; Шнайдер, Рейнхард; Валенсия, Альфонсо (1994). «Коррелированные мутации и контакты остатков в белках». Белки: структура, функции и генетика. 18 (4): 309–317. Дои:10.1002 / prot.340180402. ISSN 0887-3585. PMID 8208723. S2CID 14978727.
- ^ Шиндялов, И.Н .; Колчанов, Н.А .; Сандер, К. (1994). «Можно ли предсказать трехмерные контакты в белковых структурах с помощью анализа коррелированных мутаций?». Белковая инженерия, дизайн и отбор. 7 (3): 349–358. Дои:10.1093 / белок / 7.3.349. ISSN 1741-0126. PMID 8177884.
- ^ Корбер, Б. Т .; Farber, R.M .; Wolpert, D. H .; Лаапедес, А. С. (1993). «Ковариация мутаций в петле V3 белка оболочки вируса иммунодефицита человека типа 1: теоретико-информационный анализ». Труды Национальной академии наук. 90 (15): 7176–7180. Bibcode:1993ПНАС ... 90,7176К. Дои:10.1073 / пнас.90.15.7176. ISSN 0027-8424. ЧВК 47099. PMID 8346232.
- ^ Шапиро, Б. (2006). «Филогенетический метод обнаружения положительного эпистаза в генных последовательностях и его применение для эволюции РНК-вируса». Молекулярная биология и эволюция. 23 (9): 1724–1730. Дои:10.1093 / molbev / msl037. ISSN 0737-4038. PMID 16774976.
- ^ Poon, Art F. Y .; Льюис, Фрейзер I .; Пруд, С. Л. Косаковский; Фрост, Саймон Д. В. (2007). «Модель эволюционной сети выявляет стратифицированные взаимодействия в петле V3 оболочки ВИЧ-1». PLOS вычислительная биология. 3 (11): e231. Bibcode:2007PLSCB ... 3..231P. Дои:10.1371 / journal.pcbi.0030231. ISSN 1553-734X. ЧВК 2082504. PMID 18039027.
- ^ Jermann, Thomas M .; Opitz, Jochen G .; Стэкхаус, Джозеф; Беннер, Стивен А. (1995). «Реконструкция эволюционной истории надсемейства парнокопытных рибонуклеаз». Природа. 374 (6517): 57–59. Bibcode:1995 Натур.374 ... 57J. Дои:10.1038 / 374057a0. ISSN 0028-0836. PMID 7532788. S2CID 4315312.
- ^ Sadqi, M .; de Alba, E .; Perez-Jimenez, R .; Sanchez-Ruiz, J.M .; Муньос, В. (2009). «Разработанный белок как экспериментальная модель первичного сворачивания». Труды Национальной академии наук. 106 (11): 4127–4132. Bibcode:2009ПНАС..106.4127С. Дои:10.1073 / pnas.0812108106. ISSN 0027-8424. ЧВК 2647338. PMID 19240216.
- ^ Chang, B. S. W .; Jonsson, K .; Kazmi, M. A .; Донохью, М. Дж .; Сакмар, Т. П. (2002). «Воссоздание функционального визуального пигмента архозавра предков». Молекулярная биология и эволюция. 19 (9): 1483–1489. Дои:10.1093 / oxfordjournals.molbev.a004211. ISSN 0737-4038. PMID 12200476.
- ^ Zhang, C .; Zhang, M .; Ju, J .; Nietfeldt, J .; Wise, J .; Терри, П. М .; Олсон, М .; Качман, С.Д .; Wiedmann, M .; Самадпур, М .; Бенсон, А. К. (2003). «Диверсификация генома в филогенетических линиях I и II Listeria monocytogenes: идентификация сегментов, уникальных для популяций линии II». Журнал бактериологии. 185 (18): 5573–5584. Дои:10.1128 / JB.185.18.5573-5584.2003. ISSN 0021-9193. ЧВК 193770. PMID 12949110.
- ^ Кришнан, Н. М. (2004). «Реконструкция наследственной последовательности в митохондриальной ДНК приматов: смещение состава и влияние на функциональные выводы». Молекулярная биология и эволюция. 21 (10): 1871–1883. Дои:10.1093 / молбев / мш198. ISSN 0737-4038. PMID 15229290.
- ^ Гашен, Б. (2002). «Разнообразие соображений при выборе вакцины против ВИЧ-1». Наука. 296 (5577): 2354–2360. Bibcode:2002Наука ... 296.2354G. Дои:10.1126 / science.1070441. ISSN 0036-8075. PMID 12089434. S2CID 39452987.
- ^ Rolland, M .; Jensen, M.A .; Nickle, D.C .; Yan, J .; ЖЖ, Г. Х .; Heath, L .; Weiner, D .; Маллинз, Дж. И. (2007). «Реконструкция и функция древних белков вируса иммунодефицита человека типа 1». Журнал вирусологии. 81 (16): 8507–8514. Дои:10.1128 / JVI.02683-06. ISSN 0022-538X. ЧВК 1951385. PMID 17537854.
- ^ Kothe, Denise L .; Ли, Иньин; Декер, Джули М .; Bibollet-Ruche, Фредерик; Zammit, Kenneth P .; Салазар, Мария Г .; Чен, Ялу; Вен, Чжипин; Уивер, Эрик А .; Гао, Фэн; Haynes, Barton F .; Шоу, Джордж М .; Korber, Bette T.M .; Хан, Беатрис Х. (2006). «Предковые и консенсусные иммуногены оболочки для ВИЧ-1 подтипа C». Вирусология. 352 (2): 438–449. Дои:10.1016 / j.virol.2006.05.011. ISSN 0042-6822. PMID 16780913.
- ^ Mullins, J. I .; Хейгвуд, Н.; Barnett, S.W .; Монтефиори, Д .; Эдмонсон, П. Ф .; McLaughlin, S .; Hensel, M.T .; Mahalanabis, M .; Ли, Ф. (1 сентября 2005 г.). «Белок предковой оболочки вируса иммунодефицита человека типа 1, подтипа B, является функциональным и вызывает нейтрализующие антитела у кроликов, аналогичные тем, которые вызываются циркулирующей оболочкой подтипа B». Журнал вирусологии. 79 (17): 11214–11224. Дои:10.1128 / JVI.79.17.11214-11224.2005. ISSN 0022-538X. ЧВК 1193599. PMID 16103173.
- ^ McCloskey, R.M .; Liang, R.H .; Harrigan, P.R .; Brumme, Z. L .; Пун, А. Ф. Я. (2014). «Оценка филогенетических методов восстановления вариантов передаваемого ВИЧ с использованием данных продольной клональной последовательности ВИЧ». Журнал вирусологии. 88 (11): 6181–6194. Дои:10.1128 / JVI.00483-14. ISSN 0022-538X. ЧВК 4093844. PMID 24648453.
- ^ Борке, Гийом; Певзнер, Павел А. (2012). «Эволюция в масштабе генома: реконструкция генных порядков у видов-предков». Геномные исследования. 12 (1): 26–36. ЧВК 155248. PMID 11779828.
- ^ Даже, S; Goldreich, O (1981). «Задача последовательности генератора минимальной длины является NP-сложной». Журнал алгоритмов. 2 (3): 311–313. Дои:10.1016/0196-6774(81)90029-8. ISSN 0196-6774.
- ^ Фертин, Гийом; Лабарр, Энтони; Русу, Ирена; Танье, Эрик; Виалетт, Стефан (2009). Комбинаторика перестроек генома. MIT Press. Дои:10.7551 / mitpress / 9780262062824.001.0001. ISBN 9780262258753.
- ^ Винберг, Йоханнес (2004). «Эволюция человеческих хромосом». Текущее мнение в области генетики и развития. 14 (6): 657–666. Дои:10.1016 / j.gde.2004.10.001. ISSN 0959-437X. PMID 15531161.
- ^ Froenicke, Lutz; Гарсия Кальдес, Монтсеррат; Графодацкий Александр; Мюллер, Стефан; Лайонс, Лесли; Робинсон, Теренс; Воллет, Марианна; Ян, Фэнтан; Винберг, Йоханнес (2006). «Предлагают ли молекулярная цитогенетика и биоинформатика расходящиеся модели геномов предковых млекопитающих?». Геномные исследования. 16 (3): 306–310. Дои:10.1101 / гр.3955206. ISSN 1088-9051. ЧВК 1415215. PMID 16510895.
- ^ Мерфи, У. Дж. (2005). «Динамика эволюции хромосом млекопитающих по данным сравнительных карт разных видов». Наука. 309 (5734): 613–617. Bibcode:2005Наука ... 309..613М. Дои:10.1126 / science.1111387. ISSN 0036-8075. PMID 16040707. S2CID 32314883.
- ^ Ma, J .; Zhang, L .; Suh, B. B .; Raney, B.J .; Burhans, R.C .; Kent, W. J .; Blanchette, M .; Haussler, D .; Миллер, В. (2006). «Реконструкция смежных областей наследственного генома». Геномные исследования. 16 (12): 1557–1565. Дои:10.1101 / гр.5383506. ISSN 1088-9051. ЧВК 1665639. PMID 16983148.
- ^ Oyserman, Ben O .; Мойя, Франсиско; Лоусон, Кристофер Э .; Гарсия, Антонио Л .; Фогт, Марк; Хеффернен, Митчелл; Noguera, Daniel R .; МакМахон, Кэтрин Д. (29 апреля 2016 г.). «Реконструкция генома предков определяет эволюционную основу приобретения признаков у бактерий, накапливающих полифосфаты». Журнал ISME. 10 (12): 2931–2945. Дои:10.1038 / ismej.2016.67. ISSN 1751-7370. ЧВК 5148189. PMID 27128993.
- ^ а б c Кларк, Джон; Ри, Ричард; Альфаро, Майкл; Кинг, Мэтью; Вагнер, Уоррен; Роалсон, Эрик (2008). «Сравнительное исследование методов реконструкции ареала предков: повторение неопределенных историй островных родословных». Систематическая биология. 57 (5): 693–707. Дои:10.1080/10635150802426473. ISSN 1063-5157. PMID 18853357.
- ^ Huelsenbeck, John P .; Нильсен, Расмус; Боллбэк, Джонатан П. (2003). «Стохастическое отображение морфологических признаков». Систематическая биология. 52 (2): 131–158. Дои:10.1080/10635150390192780. ISSN 1063-5157. PMID 12746144.
- ^ Ронквист, Фредрик (1996). «DIVA версия 1.1».
Компьютерная программа и руководство доступны по анонимному FTP из Уппсальского университета
[постоянная мертвая ссылка] - ^ Ри, Ричард Х .; Мур, Брайан Р .; Уэбб, Кэмпбелл O .; Донохью, Майкл Дж. (2005). «Вероятностная структура для вывода эволюции географического ареала на филогенетических деревьях». Эволюция. 59 (11): 2299–2311. Дои:10.1111 / j.0014-3820.2005.tb00940.x. ISSN 0014-3820. PMID 16396171. S2CID 23245573.
- ^ а б c Леммон, Алан; Леммон, Эмили Мориарти (2008). «Схема вероятности оценки филогеографической истории на сплошном ландшафте». Систематическая биология. 57 (4): 544–561. Дои:10.1080/10635150802304761. ISSN 1063-5157. PMID 18686193.
- ^ а б Sturtevant, A.H .; Добжанский, Т. (1936). «Инверсии в третьей хромосоме диких рас Drosophila Pseudoobscura и их использование в изучении истории видов» (PDF). Труды Национальной академии наук. 22 (7): 448–450. Bibcode:1936ПНАС ... 22..448С. Дои:10.1073 / pnas.22.7.448. ISSN 0027-8424. ЧВК 1076803. PMID 16577723.
- ^ а б Кэмпбелл, Лайл (1998). Историческая лингвистика: введение. Эдинбург: Издательство Эдинбургского университета.
- ^ Ян, З. (2007). «PAML 4: Филогенетический анализ по максимальному правдоподобию». Молекулярная биология и эволюция. 24 (8): 1586–1591. CiteSeerX 10.1.1.322.1650. Дои:10.1093 / молбев / msm088. ISSN 0737-4038. PMID 17483113.
- ^ «Lazarus: программный инструмент для реконструкции наследственных белковых последовательностей». markov.uoregon.edu. Архивировано из оригинал на 2015-03-07. Получено 2019-03-07.
- ^ Пруд, С. Л. К .; Frost, S. D. W .; Муза, С. В. (2004). «HyPhy: проверка гипотез с использованием филогении». Биоинформатика. 21 (5): 676–679. Дои:10.1093 / биоинформатика / bti079. ISSN 1367-4803. PMID 15509596.
- ^ Maddison, W. P .; Мэддисон, Д. Р. (2015). «Мескит: модульная система для эволюционного анализа. Версия 2.75».
- ^ а б Тамура, К .; Stecher, G .; Peterson, D .; Филипски, А .; Кумар, С. (2013). "MEGA6: молекулярно-эволюционный генетический анализ, версия 6.0". Молекулярная биология и эволюция. 30 (12): 2725–2729. Дои:10.1093 / molbev / mst197. ISSN 0737-4038. ЧВК 3840312. PMID 24132122.
- ^ Ронквист, Ф .; Хюльзенбек, Дж. П. (2003). «MrBayes 3: байесовский филогенетический вывод в смешанных моделях». Биоинформатика. 19 (12): 1572–1574. Дои:10.1093 / биоинформатика / btg180. ISSN 1367-4803. PMID 12912839.
- ^ Hubisz, M. J .; Поллард, К. С .; Зипель, А. (2010). «PHAST и RPHAST: филогенетический анализ с пространственно-временными моделями». Брифинги по биоинформатике. 12 (1): 41–51. Дои:10.1093 / bib / bbq072. ISSN 1467-5463. ЧВК 3030812. PMID 21278375.
- ^ Боллбэк, Джонатан П. (2006). «SIMMAP: стохастическое отображение отдельных признаков на филогении». BMC Bioinformatics. 7 (1): 88. Дои:10.1186/1471-2105-7-88. ISSN 1471-2105. ЧВК 1403802. PMID 16504105.
- ^ Паради, Эммануэль (2012). Анализ филогенетики и эволюции с помощью R. Нью-Йорк: Springer-Verlag.
- ^ Росснес, Роальд; Эйдхаммер, Ингвар; Либерлес, Дэвид А (2005). «Филогенетическая реконструкция состояний предковых признаков для экспрессии генов и данных сплайсинга мРНК». BMC Bioinformatics. 6 (1): 127. Дои:10.1186/1471-2105-6-127. ISSN 1471-2105. ЧВК 1166541. PMID 15921519.
- ^ Драммонд, А. Дж .; Suchard, M. A .; Xie, D .; Рамбаут, А. (2012). "Байесовская филогенетика с BEAUti and the BEAST 1.7". Молекулярная биология и эволюция. 29 (8): 1969–1973. Дои:10.1093 / molbev / mss075. ISSN 0737-4038. ЧВК 3408070. PMID 22367748.
- ^ ФитцДжон, Ричард Г. (2012). «Диверситри: сравнительный филогенетический анализ диверсификации в R». Методы в экологии и эволюции. 3 (6): 1084–1092. Дои:10.1111 / j.2041-210X.2012.00234.x. ISSN 2041–210X.
- ^ Пагель, М. (1994). «Обнаружение коррелированной эволюции по филогенезам: общий метод сравнительного анализа дискретных признаков». Труды Королевского общества B: биологические науки. 255 (1342): 37–45. Bibcode:1994RSPSB.255 ... 37P. Дои:10.1098 / rspb.1994.0006. ISSN 0962-8452. S2CID 85903564.
- ^ Ю, Ян; Harris, A.J .; Он, Xingjin (2010). «S-DIVA (Статистический анализ дисперсии-викариантности): инструмент для вывода биогеографических историй». Молекулярная филогенетика и эволюция. 56 (2): 848–850. Дои:10.1016 / j.ympev.2010.04.011. ISSN 1055-7903. PMID 20399277.
- ^ Ариас, Дж. Сальвадор; Szumik, Claudia A .; Голобов, Пабло А. (2011). «Пространственный анализ наместничества: метод использования прямой географической информации в исторической биогеографии». Кладистика. 27 (6): 617–628. Дои:10.1111 / j.1096-0031.2011.00353.x. ISSN 0748-3007. S2CID 85747431.
- ^ Jones, B.R .; Rajaraman, A .; Tannier, E .; Чов, К. (2012). «УГЛЫ: реконструкция карт АНЦЕСТРАЛЬНЫХ ГЕНОМОВ». Биоинформатика. 28 (18): 2388–2390. Дои:10.1093 / биоинформатика / bts457. ISSN 1367-4803. PMID 22820205.
- ^ Ларже, Брет; Кадане, Джозеф Б .; Саймон, Дональд Л. (2005). «Байесовский подход к оценке предков генома». Молекулярная филогенетика и эволюция. 36 (2): 214–223. Дои:10.1016 / j.ympev.2005.03.026. ISSN 1055-7903. PMID 15893477.
- ^ Чуос, М. (2010). «Граф: эволюционный анализ филогенетических профилей с экономией и правдоподобием». Биоинформатика. 26 (15): 1910–1912. Дои:10.1093 / биоинформатика / btq315. ISSN 1367-4803. PMID 20551134.
- ^ Кармель, Лиран; Волк, Юрий I .; Рогозин, Игорь Б .; Кунин, Евгений В. (2010). "EREM: оценка параметров и реконструкция предков с помощью алгоритма максимизации ожиданий для вероятностной модели эволюции геномных двоичных символов". Достижения в биоинформатике. 2010: 1–4. Дои:10.1155/2010/167408. ISSN 1687-8027. ЧВК 2866244. PMID 20467467.
- ^ Патро, Роб; Сефер, Эмре; Малин, Джастин; Марсе, Гийом; Навлаха, Сакет; Кингсфорд, Карл (2012). «Экономная реконструкция эволюции сети». Алгоритмы молекулярной биологии. 7 (1): 25. Дои:10.1186/1748-7188-7-25. ISSN 1748-7188. ЧВК 3492119. PMID 22992218.
- ^ Диалло, А. Б .; Макаренков, В .; Бланшетт, М. (2009). «Ancestors 1.0: веб-сервер для реконструкции последовательности предков». Биоинформатика. 26 (1): 130–131. Дои:10.1093 / биоинформатика / btp600. ISSN 1367-4803. PMID 19850756.
- ^ Ашкенази, H .; Penn, O .; Дорон-Файгенбойм, А .; Cohen, O .; Cannarozzi, G .; Зомер, О .; Пупко Т. (2012). «FastML: веб-сервер для вероятностной реконструкции наследственных последовательностей». Исследования нуклеиновых кислот. 40 (W1): W580 – W584. Дои:10.1093 / нар / gks498. ISSN 0305-1048. ЧВК 3394241. PMID 22661579.
- ^ Ху, Фэй; Лин, Ю; Тан, Цзицзюнь (2014). «MLGO: реконструкция филогении и вывод о предках на основе данных о порядке генов». BMC Bioinformatics. 15 (1): 354. Дои:10.1186 / s12859-014-0354-6. ISSN 1471-2105. ЧВК 4236499. PMID 25376663.
- ^ Bouchard-Cote, A .; Иордания, М. И. (2012). «Эволюционный вывод с помощью процесса Пуассона-Инделя». Труды Национальной академии наук. 110 (4): 1160–1166. arXiv:1207.6327. Bibcode:2013ПНАС..110.1160Б. Дои:10.1073 / pnas.1220450110. ISSN 0027-8424. ЧВК 3557041. PMID 23275296.
- ^ Торн, Джеффри Л .; Кишино, Хирохиса; Фельзенштейн, Джозеф (1991). «Эволюционная модель максимального правдоподобия выравнивания последовательностей ДНК». Журнал молекулярной эволюции. 33 (2): 114–124. Bibcode:1991JMolE..33..114T. Дои:10.1007 / BF02193625. ISSN 0022-2844. PMID 1920447. S2CID 13333056.
- ^ Фрейзер, Кристоф; Poon, Art F. Y .; Свенсон, Люк С .; Bunnik, Evelien M .; Эдо-Матас, Диана; Schuitemaker, Hanneke; van 't Wout, Angélique B .; Харриган, П. Ричард (2012). «Реконструкция динамики развития ВИЧ внутри хостов на основе данных последовательной глубокой последовательности». PLOS вычислительная биология. 8 (11): e1002753. Bibcode:2012PLSCB ... 8E2753P. Дои:10.1371 / journal.pcbi.1002753. ISSN 1553-7358. ЧВК 3486858. PMID 23133358.
- ^ Беренвинкель, Нико; Schwarz, Roland F .; Трин, Энн; Сипос, Ботонд; Брентон, Джеймс Д .; Гольдман, Ник; Марковец, Флориан (2014). «Филогенетическая оценка внутриопухолевой гетерогенности». PLOS вычислительная биология. 10 (4): e1003535. arXiv:1306.1685. Bibcode:2014PLSCB..10E3535S. Дои:10.1371 / journal.pcbi.1003535. ISSN 1553-7358. ЧВК 3990475. PMID 24743184.