WikiDer > Байесовский инструмент для анализа метилирования

Bayesian tool for methylation analysis

Байесовский инструмент для анализа метилирования, также известный как БЭТМЕН, это статистический инструмент для анализа иммунопреципитация метилированной ДНК (MeDIP) профили. Его можно применить к большим наборам данных, созданным с использованием либо олигонуклеотид массивы (MeDIP-чип) или секвенирование следующего поколения (MeDIP-seq), обеспечивающий количественную оценку абсолютного метилирование состояние в интересующем регионе.[1]

Рабочий процесс Бэтмена

Теория

MeDIP (иммунопреципитация метилированной ДНК) - экспериментальный метод, используемый для оценки ДНК уровни метилирования с помощью антитело для выделения метилированных последовательностей ДНК. Выделенные фрагменты ДНК либо гибридизуют с микрочипом (MeDIP-chip), либо секвенируют с помощью секвенирования следующего поколения (MeDIP-seq). Хотя это говорит вам, какие области геном метилированы, он не дает абсолютных уровней метилирования. Представьте себе две разные области генома, А и B. Область, край А имеет шесть CpG (метилирование ДНК у млекопитающих соматические клетки обычно возникает при CpG динуклеотиды[2]), три из которых метилированы. Область, край B имеет три CpG, все из которых метилированы. Поскольку антитело просто распознает метилированная ДНК, он будет связывать обе эти области в равной степени, и поэтому последующие шаги будут показывать одинаковые сигналы для этих двух областей. Это не дает полной картины метилирования в этих двух регионах (в регионе А только половина CpG метилирована, тогда как в области B все CpG метилированы). Следовательно, чтобы получить полную картину метилирования для данной области, вы должны нормализовать сигнал, который вы получаете от эксперимента MeDIP, на количество CpG в регионе, и это то, что Бэтмен алгоритм делает. Анализ сигнала MeDIP в приведенном выше примере дал бы Бэтмену оценку 0,5 для региона. А (т.е. регион метилирован на 50%) и 1 для региона B (т.е. область на 100% метилирована). Таким образом, Бэтмен преобразует сигналы экспериментов MeDIP в абсолютные уровни метилирования.

Развитие Бэтмена

Основной принцип алгоритма Бэтмена состоит в моделировании эффектов различной плотности динуклеотидов CpG и их влияния на обогащение фрагментов ДНК MeDIP. Основные предположения Бэтмена:

  1. Почти все метилирование ДНК в млекопитающие бывает у динуклеотидов CpG.
  2. Большинство регионов с низким содержанием CpG метилированы конститутивно, тогда как большинство участков с высоким содержанием CpG (островков CpG) конститутивно неметилированы.[3]
  3. В эксперименте MeDIP нет фрагментных смещений (примерный диапазон размеров фрагментов ДНК составляет 400–700 п.н.).
  4. Ошибки на микрочип нормально распределяются с точностью.
  5. Только метилированные CpG вносят вклад в наблюдаемый сигнал.
  6. Состояние метилирования CpG обычно сильно коррелирует по сотням оснований,[4] поэтому CpG, сгруппированные вместе в окнах размером 50 или 100 п.н., будут иметь одинаковое состояние метилирования.

Основные параметры в Бэтмене:

  1. Ccp: коэффициент связи между зондом p и динуклеотидом CpG c, определяется как доля ДНК молекулы гибридизация с зондом п которые содержат CpGc.
  2. Cмалыш : общий параметр влияния CpG, определяется как сумма факторов связи для любого данного зонда, которая обеспечивает меру локальной плотности CpG
  3. мc : статус метилирования в позиции c, что представляет собой долю хромосомы в образце, в котором он метилирован. мc рассматривается как непрерывная переменная поскольку большинство образцов, используемых в исследованиях MeDIP, содержат несколько типов клеток.

Исходя из этих предположений, сигнал от канала MeDIP в MeDIP-чипе или эксперименте MeDIP-seq зависит от степени обогащения фрагментов ДНК, перекрывающих этот зонд, что, в свою очередь, зависит от количества связывание антители, следовательно, к количеству метилированных CpG на этих фрагментах. В модели Бэтмена полный набор данных из эксперимента MeDIP / чип, A, может быть представлен статистической моделью в форме следующего распределение вероятностей:

куда (Икс|μσ2) это Гауссовский функция плотности вероятности. Стандарт Байесовский методы могут использоваться для вывода ж(м|А), то есть распределение вероятных состояний метилирования с учетом одного или нескольких наборов выходов MeDIP-chip / MeDIP-seq. Чтобы решить эту проблему вывода, Бэтмен использует вложенная выборка (http://www.inference.phy.cam.ac.uk/bayesys/) для генерации 100 независимых выборок из ж(м|А) для каждой мозаичной области генома, затем суммирует наиболее вероятное состояние метилирования в окнах размером 100 п.н., подбирая бета-распределения для этих образцов. Режимы наиболее вероятных бета-версии были использованы как окончательные вызовы метилирования.

Ограничения

При рассмотрении вопроса об использовании Бэтмена может быть полезно принять во внимание следующие моменты:

  1. Бэтмен - это не часть программного обеспечения; это алгоритм, выполняемый с использованием командная строка. Как таковой, он не особенно удобен для пользователя и представляет собой довольно сложный в вычислительном отношении процесс.
  2. Поскольку это некоммерческий подход, при использовании Бэтмена очень мало поддержки, кроме того, что указано в руководстве.
  3. Это довольно трудоемко (анализ одной хромосомы может занять несколько дней). (Примечание: в одной правительственной лаборатории запуск Бэтмена на наборе из 100 массивов Agilent для метилирования человеческой ДНК (около 250 000 зондов на массив) занял менее часа в программном обеспечении Agilent Genomic Workbench. Наш компьютер имел процессор 2 ГГц, 24 ГБ ОЗУ , 64-битная Windows 7.)
  4. Копировать вариант номера (CNV) необходимо учитывать. Например, оценка для региона с Значение CNV 1,6 дюйма рак (потеря 0,4 по сравнению с нормальной) должна быть умножена на 1,25 (= 2 / 1,6), чтобы компенсировать потерю.
  5. Одно из основных предположений Бэтмена состоит в том, что все метилирование ДНК происходит в динуклеотидах CpG. Хотя это обычно так позвоночное животное соматических клеток, бывают ситуации, когда широко распространено метилирование не-CpG, например, в клетках растений и эмбриональные стволовые клетки.[5][6]

Рекомендации

  1. ^ Вниз, Т.А. и другие. Байесовская стратегия деконволюции для анализа метиломов ДНК на основе иммунопреципитации. Природа Биотехнологии 26, 779–85 (2008).
  2. ^ Листер, Р. и другие. ДНК человека метиломы в базовом разрешении показать широко распространенное эпигеномный различия. Природа 462, 315–22 (2009).
  3. ^ Берд А. Паттерны метилирования ДНК и эпигенетическая память. Гены и развитие 16, 6–21 (2002).
  4. ^ Экхардт, Ф. и другие. Профилирование ДНК метилирования хромосом человека 6, 20 и 22. Природа Генетика 38, 1378–85 (2006).
  5. ^ Додж Дж. Э., Рамсахой Б. Х., Ву З. Г., Окано М. и Ли Е. De novo метилирование провируса MMLV в эмбриональных стволовых клетках: CpG по сравнению с метилированием не-CpG. Ген 289, 41–8 (2002)
  6. ^ Ванюшин, Б.Ф. Метилирование ДНК у растений. Актуальные темы микробиологии и иммунологии 301, 67–122 (2006)