WikiDer > BrownBoost
BrownBoost это повышение алгоритм, который может быть устойчивым к зашумленным наборам данных. BrownBoost - это адаптивная версия поднять большинством алгоритм. Как и все повышение алгоритмов BrownBoost используется в сочетании с другими машинное обучение методы. BrownBoost был представлен Йоав Фройнд в 2001.[1]
Мотивация
AdaBoost хорошо работает с различными наборами данных; однако можно показать, что AdaBoost плохо работает с зашумленными наборами данных.[2] Это результат того, что AdaBoost сосредоточил внимание на примерах, которые часто ошибочно классифицируются. Напротив, BrownBoost эффективно «отказывается» от примеров, которые неоднократно ошибочно классифицируются. Основное предположение BrownBoost состоит в том, что зашумленные примеры будут неоднократно ошибочно помечены слабыми гипотезами, а бесшумные примеры будут правильно помечены достаточно часто, чтобы «от них нельзя было отказываться». Таким образом, "откажутся от" только шумных примеров, тогда как бесшумные примеры внесут свой вклад в окончательный классификатор. В свою очередь, если окончательный классификатор извлекается из нешумных примеров, ошибка обобщения окончательного классификатора может быть намного лучше, чем если бы он учился на зашумленных и не зашумленных примерах.
Пользователь алгоритма может установить допустимое количество ошибок в обучающем наборе. Таким образом, если обучающий набор зашумлен (предположим, что 10% всех примеров имеют неправильную маркировку), бустеру можно сказать, что он принимает 10% ошибок. Поскольку шумные примеры можно игнорировать, только истинные примеры будут способствовать процессу обучения.
Описание алгоритма
BrownBoost использует невыпуклую функцию потенциальных потерь, поэтому она не вписывается в AdaBoost рамки. Невыпуклая оптимизация позволяет избежать переобучения зашумленных наборов данных. Однако, в отличие от алгоритмов повышения, которые аналитически минимизируют выпуклую функцию потерь (например, AdaBoost и LogitBoost) BrownBoost решает систему двух уравнений и двух неизвестных, используя стандартные численные методы.
Единственный параметр BrownBoost ( в алгоритме) - это «время» работы алгоритма. Теория BrownBoost утверждает, что каждая гипотеза требует разного времени ( в алгоритме), что напрямую связано с весом, присвоенным гипотезе . Параметр времени в BrownBoost аналогичен количеству итераций. в AdaBoost.
Большее значение означает, что BrownBoost будет обрабатывать данные так, как если бы они были менее шумными, и поэтому откажется от меньшего количества примеров. И наоборот, меньшее значение означает, что BrownBoost будет рассматривать данные как более шумные и откажется от большего количества примеров.
Во время каждой итерации алгоритма выбирается гипотеза с некоторым преимуществом перед случайным угадыванием. Вес этой гипотезы и «количество прошедшего времени» во время итерации одновременно решаются в системе двух нелинейных уравнений (1. некоррелированная гипотеза с примерами весов и 2. удержание потенциальной постоянной) с двумя неизвестными (вес гипотезы и прошло время ). Это может быть решено делением пополам (как реализовано в JBoost программный пакет) или Метод Ньютона (как описано в оригинальной статье Фройнда). После решения этих уравнений поля каждого примера ( в алгоритме) и количество оставшегося времени обновляются соответствующим образом. Этот процесс повторяется до тех пор, пока не кончится время.
Начальный потенциал определяется как . Поскольку ограничение каждой итерации заключается в том, что потенциал остается постоянным, конечный потенциал равен . Таким образом, последняя ошибка скорее всего быть рядом . Однако конечная потенциальная функция не является функцией ошибок потерь 0-1. Чтобы окончательная ошибка была точно , дисперсия функции потерь должна линейно уменьшаться относительно время для формирования функции потерь 0-1 в конце итераций повышения. Это еще не обсуждается в литературе и не входит в определение алгоритма ниже.
Последний классификатор представляет собой линейную комбинацию слабых гипотез и оценивается так же, как и большинство других алгоритмов повышения.
Определение алгоритма обучения BrownBoost
Вход:
- примеры обучения куда
- Параметр
Инициализировать:
- . (Значение это количество времени, оставшееся в игре)
- . Значение маржа на итерации Например .
Пока :
- Установите вес каждого примера: , куда это край примера
- Найдите классификатор такой, что
- Найдите значения которые удовлетворяют уравнению:
.
(Обратите внимание, что это похоже на условие изложено Schapire и Singer.[3] В этом случае мы численно находим такой, что .)
На это обновление распространяется ограничение
,
куда потенциальный убыток для точки с маржей - Обновите поля для каждого примера:
- Обновите оставшееся время:
Выход:
эмпирические результаты
В предварительных экспериментальных результатах с зашумленными наборами данных BrownBoost превзошел AdaBoostошибка обобщения; тем не мение, LogitBoost выполняется так же хорошо, как и BrownBoost.[4] Реализацию BrownBoost можно найти в программном обеспечении с открытым исходным кодом. JBoost.
Рекомендации
- ^ Йоав Фройнд. Адаптивная версия алгоритма повышения по большинству. Машинное обучение, 43 (3): 293-318, июнь 2001 г.
- ^ Диттерих, Т. Г. (2000). Экспериментальное сравнение трех методов построения ансамблей деревьев решений: бэггинг, бустинг и рандомизация. Машинное обучение, 40 (2) 139-158.
- ^ Роберт Шапир и Йорам Сингер. Улучшенный рост с использованием уверенных прогнозов. Журнал машинного обучения, том 37 (3), страницы 297-336. 1999 г.
- ^ Росс А. Макдональд, Дэвид Дж. Хэнд, Идрис А. Экли. Эмпирическое сравнение трех алгоритмов усиления на реальных наборах данных с искусственным классовым шумом. Системы множественных классификаторов, Серийные конспекты лекций по информатике, страницы 35-44, 2003.