WikiDer > Групповое тестирование

Group testing

Иллюстрация проблемы с лампочкой, когда человек ищет сломанную лампочку среди шести лампочек. Здесь первые три подключены к источнику питания, и они загораются (A). Это означает, что сломанная лампа должна быть одной из трех последних (B). Если бы вместо этого лампочки не загорелись, можно было быть уверенным, что сломанная лампочка была среди первых трех. Продолжая эту процедуру, можно найти сломанную лампу не более чем в трех тестах, по сравнению с максимум шестью тестами, если лампы проверяются по отдельности.

В статистика и комбинаторная математика, групповое тестирование это любая процедура, которая разбивает задачу идентификации определенных объектов на тесты по группам пунктов, а не по отдельным. Впервые изучено Роберт Дорфман В 1943 году групповое тестирование - это относительно новая область прикладной математики, которая может применяться в широком диапазоне практических приложений и является активной областью исследований сегодня.

Знакомый пример группового тестирования включает цепочку последовательно соединенных лампочек, при этом известно, что одна из ламп сломана. Цель состоит в том, чтобы найти сломанную лампочку с помощью наименьшего количества тестов (где тест - это когда некоторые из лампочек подключены к источнику питания). Простой подход - проверить каждую лампочку индивидуально. Однако при большом количестве луковиц гораздо эффективнее объединять луковицы в группы. Например, подключив первую половину ламп сразу, можно определить, в какой половине разбитая лампочка, исключив половину ламп всего за один тест.

Схемы для проведения группового тестирования могут быть простыми или сложными, и тесты, используемые на каждом этапе, могут быть разными. Схемы, в которых тесты для следующего этапа зависят от результатов предыдущих этапов, называются адаптивные процедуры, а схемы, построенные так, чтобы все тесты были известны заранее, называются неадаптивные процедуры. Структура схемы тестов, участвующих в неадаптивной процедуре, известна как объединение дизайна.

Групповое тестирование имеет множество приложений, включая статистику, биологию, информатику, медицину, инженерию и кибербезопасность. Современный интерес к этим схемам тестирования возродился благодаря Проект "Геном человека".[1]

Основное описание и термины

В отличие от многих областей математики, истоки группового тестирования можно проследить до одного отчета.[2] написано одним человеком: Роберт Дорфман.[3] Мотивация возникла во время Второй мировой войны, когда Служба общественного здравоохранения США и Выборочный сервис приступили к масштабному проекту по отсеиванию всех сифилитический мужчин призвали на индукцию. Тестирование человека на сифилис включает взятие у него образца крови, а затем анализ этого образца для определения наличия или отсутствия сифилиса. В то время выполнение этого теста было дорогостоящим, а тестирование каждого солдата в отдельности было бы очень дорогим и неэффективным.[3]

Предположим, есть солдат, этот метод тестирования приводит к отдельные тесты. Если большая часть людей инфицирована, этот метод будет разумным. Однако в более вероятном случае, когда инфицирована лишь очень небольшая часть мужчин, может быть реализована гораздо более эффективная схема тестирования. Возможность создания более эффективной схемы тестирования зависит от следующего свойства: солдат можно объединять в группы, и в каждой группе образцы крови можно объединять. Затем объединенный образец можно проверить, чтобы проверить, есть ли по крайней мере один солдат в группе сифилисом. Это центральная идея группового тестирования. Если один или несколько солдат в этой группе болеют сифилисом, то тест считается бесполезным (необходимо провести дополнительные тесты, чтобы определить, какой это солдат (-а)). С другой стороны, если ни у кого в пуле нет сифилиса, многие тесты сохраняются, так как каждый солдат в этой группе может быть уничтожен только одним тестом.[3]

Пункты, которые вызывают положительный результат теста в группе, обычно называются дефектные товары (это сломанные лампочки, сифилитики и др.). Часто общее количество предметов обозначается как и представляет количество дефектов, если предполагается, что оно известно.[3]

Классификация задач группового тестирования

Существует две независимые классификации задач группового тестирования; каждая проблема группового тестирования является либо адаптивной, либо неадаптивной, либо вероятностной, либо комбинаторной.[3]

В вероятностных моделях предполагается, что дефектные элементы следуют некоторым распределение вероятностей и цель - свести к минимуму ожидается количество тестов, необходимых для выявления дефектов каждого элемента. С другой стороны, при комбинаторном групповом тестировании цель состоит в том, чтобы минимизировать количество тестов, необходимых в «наихудшем сценарии», т. Е. Создать алгоритм minmax - и никаких сведений о распределении дефектов не предполагается.[3]

Другая классификация, адаптивность, касается того, какую информацию можно использовать при выборе элементов для группировки в тест. Как правило, выбор элементов для тестирования может зависеть от результатов предыдущих тестов, как в случае с лампочкой выше. An алгоритм который продолжается путем выполнения теста, а затем использования результата (и всех прошлых результатов) для решения, какой следующий тест выполнить, называется адаптивным. И наоборот, в неадаптивных алгоритмах все тесты решаются заранее. Эту идею можно обобщить на многоступенчатые алгоритмы, где тесты разделены на этапы, и каждый тест на следующем этапе должен быть решен заранее, только с учетом результатов тестов на предыдущих этапах. Хотя адаптивные алгоритмы предлагают гораздо больше свободы в выборе. При проектировании известно, что алгоритмы адаптивного группового тестирования не улучшают неадаптивные алгоритмы более чем на постоянный коэффициент в количестве тестов, необходимых для выявления набора дефектных элементов.[4][3] В дополнение к этому, неадаптивные методы часто полезны на практике, поскольку можно продолжить последовательные тесты без предварительного анализа результатов всех предыдущих тестов, что позволяет эффективно распределить процесс тестирования.

Варианты и расширения

Есть много способов расширить проблему группового тестирования. Один из самых важных называется шумный групповое тестирование и имеет дело с большим предположением об исходной проблеме: это тестирование безошибочно. Проблема группового тестирования называется зашумленной, если есть некоторая вероятность того, что результат группового теста будет ошибочным (например, будет положительным, если тест не содержит дефектов). В Модель шума Бернулли предполагает, что эта вероятность является некоторой постоянной, , но в целом это может зависеть от истинного количества дефектов в тесте и количества проверенных элементов.[5] Например, эффект разбавления можно смоделировать, сказав, что положительный результат более вероятен, когда в тесте присутствует больше дефектов (или больше дефектов в виде доли от числа протестированных).[6] Шумный алгоритм всегда будет иметь ненулевую вероятность ошибки (то есть неправильной маркировки элемента).

Групповое тестирование можно расширить, рассматривая сценарии, в которых существует более двух возможных результатов теста. Например, тест может иметь результаты и , что соответствует отсутствию дефектов, единственному дефекту или неизвестному количеству дефектов больше единицы. В более общем плане можно считать, что набор результатов теста для некоторых .[3]

Другое расширение - рассмотрение геометрических ограничений на то, какие множества можно тестировать. Вышеупомянутая проблема с лампочкой является примером такого ограничения: только лампочки, которые появляются последовательно, могут быть проверены. Аналогичным образом элементы могут быть расположены по кругу или, в общем, в виде сети, где тесты представляют собой доступные пути на графе. Другой вид геометрического ограничения - максимальное количество элементов, которые могут быть протестированы в группе.[а] или размер группы может быть одинаковым и так далее. Подобным образом может быть полезно рассмотреть ограничение, согласно которому любой заданный элемент может появляться только в определенном количестве тестов.[3]

Есть бесконечное количество способов продолжить переделывать основную формулу группового тестирования. Следующие уточнения дадут представление о некоторых из наиболее экзотических вариантов. В модели «хорошо – посредственно – плохо» каждый элемент является одним из «хорошо», «посредственно» или «плохо», а результат теста является типом «худшего» элемента в группе. При пороговом групповом тестировании результат теста положительный, если количество дефектных элементов в группе превышает некоторое пороговое значение или пропорцию.[7] Групповое тестирование с ингибиторами - это вариант с приложениями в молекулярной биологии. Здесь есть третий класс элементов, называемых ингибиторами, и результат теста положительный, если он содержит хотя бы один дефект и не содержит ингибиторов.[8]

История и развитие

Изобретение и начальный прогресс

Концепция группового тестирования была впервые представлена ​​Робертом Дорфманом в 1943 году в кратком отчете.[2] опубликовано в разделе "Примечания" Анналы математической статистики.[3][b] Отчет Дорфмана - как и все ранние работы по групповому тестированию - был сосредоточен на вероятностной проблеме и был направлен на использование новой идеи группового тестирования, чтобы сократить ожидаемое количество тестов, необходимых для отсеивания всех сифилитических мужчин в данном пуле солдат. Метод был прост: разделите солдат на группы определенного размера и используйте индивидуальное тестирование (тестирование предметов в группах размера один) на положительных группах, чтобы определить, какие из них были инфицированы. Дорфман свел в таблицу оптимальные размеры групп для этой стратегии в зависимости от распространенности дефективности в популяции.[2]

После 1943 года групповые испытания оставались практически неизменными в течение ряда лет. Затем в 1957 году Стерретт усовершенствовал процедуру Дорфмана.[10] Этот новый процесс начинается с повторного индивидуального тестирования положительных групп, но останавливается, как только обнаруживается дефект. Затем остальные элементы в группе проверяются вместе, поскольку очень вероятно, что ни один из них не является дефектным.

Первое тщательное рассмотрение группового тестирования было дано Собелем и Гроллом в их формирующей статье 1959 года по этому вопросу.[11] Они описали пять новых процедур - в дополнение к обобщениям для случаев, когда уровень распространенности неизвестен - и для наиболее оптимальной из них они предоставили явную формулу для ожидаемого количества тестов, которые она будет использовать. В документе также была установлена ​​связь между групповым тестированием и теория информации впервые, а также обсуждает несколько обобщений проблемы группового тестирования и предоставляет некоторые новые приложения теории.

Комбинаторное групповое тестирование

Групповое тестирование было впервые изучено в комбинаторном контексте Ли в 1962 г.[12] с введением Ли -этапный алгоритм.[3] Ли предложил расширить «двухэтапный алгоритм» Дорфмана до произвольного числа этапов, не требующих более тесты, чтобы гарантированно найти или меньше дефектных среди Идея заключалась в том, чтобы удалить все элементы в отрицательных тестах, а оставшиеся элементы разделить на группы, как это было сделано с исходным пулом. Это должно было быть сделано раз перед проведением индивидуального тестирования.

Комбинаторное групповое тестирование в целом было позже более полно изучено Катоной в 1973 году.[13] Катона представила матричное представление неадаптивного группового тестирования и разработал процедуру поиска дефекта в случае неадаптивного 1 дефекта не более чем в тесты, которые он тоже оказался оптимальным.

В общем, найти оптимальные алгоритмы для адаптивного комбинаторного группового тестирования сложно, и хотя вычислительная сложность группового тестирования не определено, предположительно жесткий в каком-то классе сложности.[3] Однако в 1972 году произошел важный прорыв с появлением обобщенный алгоритм двоичного расщепления.[14] Обобщенный алгоритм двоичного разбиения работает путем выполнения бинарный поиск на группах, которые дали положительный результат, и представляет собой простой алгоритм, который находит один дефект не более чем в нижняя граница информации количество тестов.

В сценариях, где есть два или более дефекта, обобщенный алгоритм двоичного разделения по-прежнему дает почти оптимальные результаты, требуя не более тесты выше информационной нижней границы, где количество бракованных.[14] В 2013 году компания Allemann внесла значительные улучшения в этот процесс, в результате чего необходимое количество тестов стало меньше над нижней границей информации, когда и .[15] Это было достигнуто путем изменения двоичного поиска в алгоритме двоичного разбиения на сложный набор подалгоритмов с перекрывающимися тестовыми группами. Таким образом, проблема адаптивного комбинаторного группового тестирования - с известным числом или верхней границей количества дефектов - по существу решена, и есть мало возможностей для дальнейшего улучшения.

Остается открытым вопрос, когда проводится индивидуальное тестирование. мин Макс. Ху, Хван и Ван показали в 1981 году, что индивидуальное тестирование минимально, когда , и что это не minmax, когда .[16] В настоящее время предполагается, что эта граница является точной: то есть индивидуальное тестирование является минимальным тогда и только тогда, когда .[17][c] Некоторый прогресс был достигнут в 2000 году Риччио и Колборном, которые показали, что в целом , индивидуальное тестирование минимально, когда .[18]

Неадаптивное и вероятностное тестирование

Одним из ключевых выводов неадаптивного группового тестирования является то, что значительный выигрыш может быть получен за счет устранения требования о том, что процедура группового тестирования обязательно будет успешной («комбинаторная» проблема), а скорее позволит ей иметь некоторые низкие, но не - нулевая вероятность неправильной маркировки каждого предмета («вероятностная» проблема). Известно, что по мере того, как количество дефектных элементов приближается к общему количеству элементов, точные комбинаторные решения требуют значительно большего количества тестов, чем вероятностные решения - даже вероятностные решения допускают только асимптотически малая вероятность ошибки.[4][d]

В этом ключе Чан и другие. (2011) представил КОМП, вероятностный алгоритм, требующий не более тесты, чтобы найти до дефекты в элементы с вероятностью ошибки не более .[5] Это в пределах постоянного коэффициента нижняя граница.[4]

Чан и другие. (2011) также представили обобщение COMP до простой шумной модели и аналогичным образом получили явную границу производительности, которая снова была только константой (зависящей от вероятности неудачного теста) выше соответствующей нижней границы.[4][5] В общем, количество тестов, требуемых в случае шума Бернулли, на постоянный коэффициент больше, чем в случае отсутствия шума.[5]

Олдридж, Балдассини и Джонсон (2014) разработали расширение алгоритма COMP, добавляющее дополнительные шаги постобработки.[19] Они показали, что производительность этого нового алгоритма, называемого DD, строго превышает таковой для COMP, и этот DD является «существенно оптимальным» в сценариях, где , сравнивая его с гипотетическим алгоритмом, определяющим разумный оптимум. Производительность этого гипотетического алгоритма предполагает, что есть возможности для улучшения, когда , а также предположить, насколько это может быть улучшено.[19]

Формализация комбинаторного группового тестирования

В этом разделе формально определены понятия и термины, относящиеся к групповому тестированию.

  • В входной вектор, , определяется как двоичный вектор длины (это, ), с j-й вызываемый элемент дефектный если и только если . Кроме того, любой исправный товар называется «хорошим».

предназначен для описания (неизвестного) набора дефектных элементов. Ключевое свойство в том, что это неявный ввод. Другими словами, нет прямого знания о том, какие записи есть, кроме тех, которые могут быть выведены с помощью некоторой серии «тестов». Это приводит к следующему определению.

  • Позволять быть входным вектором. Множество, называется тестовое задание. Когда тестирование бесшумный, результат теста положительный когда существует такой, что , и результат отрицательный в противном случае.

Следовательно, цель группового тестирования - предложить метод выбора «короткой» серии тестов, позволяющих должны быть определены либо точно, либо с высокой степенью уверенности.

  • Говорят, что алгоритм группового тестирования ошибка если он неправильно маркирует элемент (т. е. маркирует любой дефектный элемент как недефектный или наоборот). Это не то же самое, что и неправильный результат группового теста. Алгоритм называется нулевая ошибка если вероятность того, что он сделает ошибку, равна нулю.[e]
  • обозначает минимальное количество тестов, необходимых, чтобы всегда находить дефектные среди элементы с нулевой вероятностью ошибки по любому алгоритму группового тестирования. Для того же количества, но с ограничением, что алгоритм не адаптивен, обозначение используется.

Общие границы

Поскольку всегда можно прибегнуть к индивидуальному тестированию, установив для каждого , должно быть, что . Кроме того, поскольку любая процедура неадаптивного тестирования может быть записана как адаптивный алгоритм, просто выполняя все тесты без учета их результата, . Наконец, когда , есть хотя бы один предмет, дефектность которого должна быть определена (хотя бы одним тестом), и поэтому .

В итоге (при допущении ), .[f]

Нижняя граница информации

Нижнюю границу количества необходимых тестов можно описать с помощью понятия образец пространства, обозначенный , который представляет собой просто набор возможных мест размещения дефектов. Для любой задачи группового тестирования с пробелом и любого алгоритма группового тестирования можно показать, что , где - минимальное количество тестов, необходимых для выявления всех дефектов с нулевой вероятностью ошибки. Это называется нижняя граница информации.[3] Эта оценка выводится из того факта, что после каждого теста разбивается на два непересекающихся подмножества, каждое из которых соответствует одному из двух возможных результатов теста.

Однако сама нижняя граница информации обычно недостижима даже для небольших задач.[3] Это потому, что расщепление не является произвольным, поскольку оно должно быть реализовано с помощью некоторого теста.

Фактически, нижняя граница информации может быть обобщена на случай, когда существует ненулевая вероятность того, что алгоритм совершит ошибку. В этой форме теорема дает нам верхнюю границу вероятности успеха, основанную на количестве тестов. Для любого алгоритма группового тестирования, который выполняет тесты, вероятность успеха, , удовлетворяет . Это можно усилить: .[5][20]

Представление неадаптивных алгоритмов

Диаграмма, показывающая матрицу группового тестирования вместе со связанными векторами x и y.
Типичная установка для группового тестирования. Неадаптивный алгоритм сначала выбирает матрицу , а затем задается вектор y. Тогда проблема состоит в том, чтобы найти оценку для Икс.

Алгоритмы неадаптивного группового тестирования состоят из двух отдельных фаз. Во-первых, решается, сколько тестов выполнить и какие элементы включить в каждый тест. На втором этапе, который часто называют этапом декодирования, результаты каждого группового теста анализируются, чтобы определить, какие элементы могут быть дефектными. Первая фаза обычно кодируется в матрице следующим образом.[5]

  • Предположим, что процедура неадаптивного группового тестирования предметы состоят из тестов для некоторых . В матрица тестирования для этой схемы двоичная матрица, , где если и только если (в противном случае - ноль).

Таким образом, каждый столбец представляет элемент, а каждая строка представляет тест с в запись, указывающая, что тест включал пункт и указывая иное.

Как и вектор (длины ), который описывает неизвестный дефектный набор, обычно вводят вектор результатов, который описывает результаты каждого теста.

  • Позволять быть количеством тестов, выполненных неадаптивным алгоритмом. В вектор результата, , - двоичный вектор длины (это, ) такие, что тогда и только тогда, когда результат тест был положительным (т.е. содержал хотя бы один дефектный).[г]

С этими определениями неадаптивная проблема может быть перефразирована следующим образом: сначала выбирается матрица тестирования, , после чего вектор возвращается. Тогда проблема в том, чтобы проанализировать чтобы найти некоторую оценку для .

В простейшем зашумленном случае, когда есть постоянная вероятность, , что групповой тест даст ошибочный результат, рассматривается случайный двоичный вектор, , где каждая запись имеет вероятность быть , и является в противном случае. Возвращаемый вектор тогда , с обычным добавлением на (эквивалентно это поэлементный XOR операция). Шумный алгоритм должен оценивать с помощью (то есть без прямого знания ).[5]

Границы для неадаптивных алгоритмов

Матричное представление позволяет доказать некоторые ограничения на неадаптивное групповое тестирование. Этот подход отражает подход многих детерминированных проектов, где -разделимые матрицы рассматриваются, как определено ниже.[3]

  • Бинарная матрица, , называется -разделимый если каждая логическая сумма (логическое ИЛИ) любого его столбцов отличны. Кроме того, обозначение -разделимый указывает, что каждая сумма любого из вплоть до из колонки различны. (Это не то же самое, что будучи -отъемный для каждого .)

Когда матрица тестирования, свойство быть -разделимый (-сепарабельность) эквивалентна способности различать (до) бракованные. Однако это не гарантирует, что это будет просто. Более сильное свойство, называемое -разъединенность делает.

  • Бинарная матрица, называется -разъединить если логическая сумма любого столбцы не содержат других столбцов. (В этом контексте говорят, что столбец A содержит столбец B, если для каждого индекса, где B имеет 1, A также имеет 1).

Полезное свойство Матрицы проверки несвязанности - это то, что, до с дефектами, каждый исправный элемент будет обнаружен хотя бы в одном тесте с отрицательным результатом. Это означает, что существует простая процедура поиска дефектов: просто удалите все элементы, обнаруженные при отрицательном результате теста.

Используя свойства -разделимые и -разъединить матрицы можно показать следующее для задачи идентификации дефектные среди всего пунктов.[4]

  1. Количество тестов, необходимое для асимптотически малого средний вероятность ошибки масштабируется как .
  2. Количество тестов, необходимое для асимптотически малого максимум вероятность ошибки масштабируется как .
  3. Количество тестов, необходимых для нуль вероятность ошибки масштабируется как .

Обобщенный алгоритм двоичного расщепления

Иллюстрация обобщенного алгоритма двоичного разбиения с 8 дефектами и 135 всего элементами. Вот, , и первый тест дает отрицательный результат, поэтому каждый элемент считается исправным. Следовательно, осталось 119 элементов, так что . Эта вторая группа дает положительный результат, поэтому для поиска дефекта используется двоичный поиск. Как только это будет сделано, весь процесс повторяется, вычисляя новый с использованием только тех предметов, дефектность которых не установлена.

Обобщенный алгоритм двоичного разбиения - это, по сути, оптимальный алгоритм адаптивного группового тестирования, который находит или меньше дефектных среди следующие пункты:[3][14]

  1. Если , протестируйте предметы индивидуально. В противном случае установите и .
  2. Проверить размер группы . Если результат отрицательный, каждый элемент в группе объявляется исправным; набор и переходите к шагу 1. В противном случае используйте бинарный поиск для выявления одного неисправного и неуказанного номера, вызываемого , исправных изделий; набор и . Переходите к шагу 1.

Обобщенный алгоритм двоичного разбиения требует не более тесты, где.[3]

Для большой, можно показать, что ,[3] что выгодно отличается от тесты, необходимые для Ли -этапный алгоритм. Фактически, алгоритм обобщенного двоичного разбиения близок к оптимальному в следующем смысле. Когда можно показать, что , где - информационная нижняя граница.[3][14]

Неадаптивные алгоритмы

Алгоритмы неадаптивного группового тестирования обычно предполагают, что количество дефектов или, по крайней мере, их хорошая верхняя граница известна.[5] Эта величина обозначается в этой секции. Если границы не известны, существуют неадаптивные алгоритмы с низкой сложностью запроса, которые могут помочь оценить .[21]

Комбинаторное преследование ортогонального соответствия (COMP)

Иллюстрация алгоритма COMP. COMP определяет элемент а как дефектный и товар б как исправные. Однако он неправильно маркирует c как дефектный, поскольку он «скрывается» дефектными предметами в каждом тесте, в котором он появляется.

Combinatorial Orthogonal Matching Pursuit, или COMP, представляет собой простой неадаптивный алгоритм группового тестирования, который формирует основу для более сложных алгоритмов, которые следуют в этом разделе.

Сначала выбирается каждая запись матрицы тестирования. i.i.d. быть с вероятностью и в противном случае.

Этап декодирования выполняется по столбцам (то есть по элементам). Если все тесты, в которых появляется товар, являются положительными, то товар объявляется дефектным; в противном случае предполагается, что товар исправен. Или, что эквивалентно, если элемент появляется в любом тесте с отрицательным результатом, элемент объявляется исправным; в противном случае предполагается, что товар неисправен. Важным свойством этого алгоритма является то, что он никогда не создает ложные отрицанияхотя ложно положительный происходит, когда все локации с единицами в j-й столбец (соответствует исправному элементу j) «скрыты» колонками из других столбцов, соответствующих дефектным изделиям.

Для алгоритма COMP требуется не более тесты на вероятность ошибки меньше или равной .[5] Это находится в пределах постоянного коэффициента нижней границы для указанной выше средней вероятности ошибки.

В случае зашумления можно ослабить требование в исходном алгоритме COMP, чтобы набор местоположений единиц в любом столбце соответствующие положительному элементу полностью содержатся в наборе местоположений единиц в векторе результата. Вместо этого допускается определенное количество «несовпадений» - это количество несовпадений зависит как от количества единиц в каждом столбце, так и от параметра шума, . Этот шумный алгоритм COMP требует не более тесты для достижения максимальной вероятности ошибки .[5]

Определенные дефекты (DD)

Метод определенных дефектов (DD) является расширением алгоритма COMP, который пытается удалить любые ложные срабатывания. Было доказано, что гарантии производительности для DD строго превышают таковые для COMP.[19]

На этапе декодирования используется полезное свойство алгоритма COMP: каждый элемент, который COMP объявляет исправным, безусловно, исправен (то есть нет ложноотрицательных результатов). Происходит это следующим образом.

  1. Сначала запускается алгоритм COMP, и все исправные дефекты, которые он обнаруживает, удаляются. Все оставшиеся элементы теперь «возможно неисправны».
  2. Затем алгоритм просматривает все положительные тесты. Если элемент обнаруживается как единственный «возможный дефект» в тесте, то он должен быть дефектным, поэтому алгоритм объявляет его дефектным.
  3. Предполагается, что все остальные элементы не имеют дефектов. Обоснование этого последнего шага исходит из предположения, что количество дефектов намного меньше, чем общее количество элементов.

Обратите внимание, что шаги 1 и 2 никогда не допускают ошибок, поэтому алгоритм может допустить ошибку только в том случае, если он объявляет дефектный элемент исправным. Таким образом, алгоритм DD может создавать только ложноотрицательные результаты.

Последовательный COMP (SCOMP)

SCOMP (Sequential COMP) - это алгоритм, который использует тот факт, что DD не допускает ошибок до последнего шага, где предполагается, что оставшиеся элементы исправны. Пусть набор заявленных дефектов будет . Положительный тест называется объяснил от если он содержит хотя бы один элемент в . Ключевое наблюдение с помощью SCOMP состоит в том, что набор дефектов, обнаруженных DD, не может объяснить каждый положительный тест, и что каждый необъяснимый тест должен содержать скрытый дефект.

Алгоритм работает следующим образом.

  1. Выполните шаги 1 и 2 алгоритма DD, чтобы получить , первоначальная оценка набора дефектов.
  2. Если объясняет каждый положительный тест, завершите алгоритм: - окончательная оценка набора дефектов.
  3. Если есть какие-либо необъяснимые тесты, найдите «возможный дефект», который появляется в наибольшем количестве необъяснимых тестов, и объявите его дефектным (то есть добавьте его в набор ). Переходите к шагу 2.

В ходе моделирования было показано, что SCOMP работает близко к оптимальному.[19]

Примеры приложений

Обобщенность теории группового тестирования дает ей множество разнообразных приложений, включая скрининг клонов, обнаружение коротких замыканий;[3] высокоскоростные компьютерные сети;[22] медицинское обследование, количественный поиск, статистика;[16] машинное обучение, секвенирование ДНК;[23] криптография;[24][25] и судебная экспертиза данных.[26] В этом разделе представлен краткий обзор небольшой подборки этих приложений.

Каналы множественного доступа

Иллюстрация канала с множественным доступом, показывающая успешное сообщение и конфликт сообщений.

А канал с множественным доступом это канал связи, который соединяет сразу много пользователей. Каждый пользователь может слушать и передавать по каналу, но если несколько пользователей осуществляют передачу одновременно, сигналы сталкиваются и превращаются в неразборчивый шум. Каналы множественного доступа важны для различных реальных приложений, особенно для беспроводных компьютерных сетей и телефонных сетей.[27]

Важная проблема с каналами множественного доступа состоит в том, как назначать время передачи пользователям, чтобы их сообщения не конфликтовали. Простой метод - предоставить каждому пользователю свой собственный временной интервал для передачи, что потребует слоты. (Это называется мультиплексирование с временным разделением, или TDM.) Однако это очень неэффективно, поскольку оно будет назначать слоты передачи пользователям, у которых может не быть сообщения, и обычно предполагается, что только несколько пользователей захотят передавать в любой момент времени - в противном случае канал с множественным доступом не практично во-первых.

В контексте группового тестирования эта проблема обычно решается путем разделения времени на «эпохи» следующим образом.[3] Пользователь называется «активным», если у него есть сообщение в начале эпохи. (Если сообщение создается в течение эпохи, пользователь становится активным только в начале следующей.) Эпоха заканчивается, когда каждый активный пользователь успешно передал свое сообщение. Тогда проблема состоит в том, чтобы найти всех активных пользователей в заданную эпоху и запланировать для них время передачи (если они еще не сделали это успешно). Здесь тест на группе пользователей соответствует тем пользователям, которые пытаются выполнить передачу. Результаты теста - это количество пользователей, которые пытались передать, и , что соответствует, соответственно, отсутствию активных пользователей, ровно одному активному пользователю (сообщение успешно) или более чем одному активному пользователю (конфликт сообщения). Следовательно, используя алгоритм адаптивного группового тестирования с результатами , можно определить, какие пользователи хотят передавать в эпоху. Затем любому пользователю, который еще не осуществил успешную передачу, теперь может быть назначен интервал для передачи без расточительного назначения времени неактивным пользователям.

Машинное обучение и сжатое зондирование

Машинное обучение это область информатики, которая имеет множество программных приложений, таких как классификация ДНК, обнаружение мошенничества и таргетированная реклама. Одним из основных подразделов машинного обучения является проблема «обучения на примерах», где задача состоит в том, чтобы аппроксимировать некоторую неизвестную функцию, когда ей задано ее значение в ряде конкретных точек.[3] Как указано в этом разделе, эту проблему обучения функциям можно решить с помощью подхода группового тестирования.

В простом варианте задачи есть какая-то неизвестная функция, где , и (с использованием логической арифметики: сложение - логическое ИЛИ, а умножение - логическое И). Вот является ' sparse ', что означает, что самое большее его записей . Цель состоит в том, чтобы построить приближение к с помощью точечные оценки, где как можно меньше.[4] (Точно восстанавливается соответствует алгоритмам с нулевой ошибкой, тогда как аппроксимируется алгоритмами с ненулевой вероятностью ошибки.)

В этой проблеме восстанавливается эквивалентно поиску . Более того, если и только если есть какой-то индекс, , где . Таким образом, эта проблема аналогична задаче группового тестирования с бракованные и всего пунктов. Записи это предметы, которые являются дефектными, если они , указывает тест, и тест является положительным тогда и только тогда, когда .[4]

На самом деле, вас часто будут интересовать более сложные функции, такие как , снова где . Сжатое зондирование, которое тесно связано с групповым тестированием, может быть использовано для решения этой проблемы.[4]

В сжатом зондировании цель состоит в том, чтобы восстановить сигнал, , выполнив ряд измерений. Эти измерения моделируются как скалярное произведение с выбранным вектором.[час] Цель состоит в том, чтобы использовать небольшое количество измерений, хотя это, как правило, невозможно, если не предполагается что-то о сигнале. Одно из таких предположений (распространенное[30][31]) заключается в том, что только небольшое количество записей находятся существенный, что означает, что они имеют большую величину. Поскольку измерения являются скалярными произведениями , уравнение держит, где это матрица, описывающая набор выбранных измерений и - набор результатов измерений. Эта конструкция показывает, что сжатое зондирование является разновидностью «непрерывного» группового тестирования.

Основная трудность при сжатии данных - это определение значимых записей.[30] Как только это будет сделано, существует множество методов для оценки фактических значений записей.[32] К этой задаче идентификации можно подойти с помощью простого группового тестирования. Здесь групповой тест дает комплексное число: сумму проверенных записей. Результат теста называется положительным, если он дает комплексное число с большой величиной, что при допущении, что значимые записи редки, указывает на то, что в тесте содержится по крайней мере одна значимая запись.

Для этого типа комбинаторного алгоритма поиска существуют явные детерминированные конструкции, требующие измерения.[33] Однако, как и в случае с групповым тестированием, они не оптимальны, и случайные конструкции (например, COMP) часто могут восстанавливать сублинейно в .[32]

Дизайн мультиплексного анализа для тестирования COVID19

Во время пандемии, такой как вспышка COVID-19 в 2020 году, тесты на обнаружение вирусов иногда проводятся с использованием неадаптивных групповых тестов.[34][35] Один из примеров был предоставлен проектом Origami Assays, который выпустил проекты группового тестирования с открытым исходным кодом для запуска на лабораторном стандартном 96-луночном планшете.[36]

Шаблон бумаги для анализа оригами для дизайна группового тестирования

В лабораторных условиях одна из проблем групповых испытаний заключается в том, что создание смесей может занять много времени, и его трудно точно выполнить вручную. Анализы Origami предоставили обходной путь для этой проблемы строительства, предоставив бумажные шаблоны, чтобы помочь техническому специалисту распределять образцы пациентов по лункам.[37]

Используя самый большой дизайн группового тестирования (XL3), можно было протестировать 1120 образцов пациентов в 94 аналитических лунках. Если количество истинно положительных результатов было достаточно низким, то дополнительное тестирование не требовалось.

Смотрите также: Список стран, реализующих стратегию пулового тестирования на COVID-19.

Криминалистика данных

Криминалистика данных - это область, посвященная поиску методов сбора цифровых доказательств преступлений. Такие преступления обычно связаны с изменением злоумышленником данных, документов или баз данных жертвы, например, с изменением налоговой отчетности, вирусом, скрывающим свое присутствие, или кражей личных данных, изменяющей личные данные.[26]

Распространенным инструментом судебной экспертизы данных является односторонний криптографический хеш. Это функция, которая принимает данные и с помощью процедуры, которую трудно изменить, производит уникальный номер, называемый хешем.[я] Хэши, которые часто намного короче, чем данные, позволяют нам проверять, были ли данные изменены, без необходимости расточительно хранить полные копии информации: хэш для текущих данных можно сравнить с прошлым хешем, чтобы определить, есть ли какие-либо изменения произошло. Прискорбным свойством этого метода является то, что, хотя легко определить, были ли данные изменены, невозможно определить, как именно: то есть невозможно восстановить, какая часть данных была изменена.[26]

Один из способов обойти это ограничение - сохранить больше хэшей - теперь уже подмножеств структуры данных - чтобы сузить область, где произошла атака. Однако, чтобы найти точное место атаки с помощью наивного подхода, хэш должен быть сохранен для каждого элемента данных в структуре, что в первую очередь приведет к поражению точки хешей. (Можно также хранить обычную копию данных.) Групповое тестирование можно использовать для значительного уменьшения количества хэшей, которые необходимо сохранить. Тест становится сравнением сохраненных и текущих хэшей, которое считается положительным при несоответствии. Это указывает на то, что по крайней мере одна отредактированная база данных (которая считается дефектной в этой модели) содержится в группе, которая сгенерировала текущий хэш.[26]

Фактически, количество необходимых хэшей настолько мало, что они вместе с матрицей тестирования, к которой они относятся, могут даже храниться в организационной структуре самих данных. Это означает, что что касается памяти, тест можно проводить «бесплатно». (Это верно за исключением мастер-ключа / пароля, который используется для тайного определения функции хеширования.)[26]

Заметки

  1. ^ Первоначальная проблема, которую изучал Дорфман, имела этот характер (хотя он не принимал во внимание это), поскольку на практике только определенное количество сывороток крови могло быть объединено до того, как процедура тестирования стала ненадежной. Это была основная причина того, что в то время процедура Дорфмана не применялась.[3]
  2. ^ Однако, как это часто бывает в математике, с тех пор групповое тестирование неоднократно изобреталось заново, часто в контексте приложений. Например, Хейс независимо выступил с идеей опрашивать группы пользователей в контексте протоколов множественного доступа в 1978 году.[9]
  3. ^ Иногда это называют гипотезой Ху-Хванга-Ванга.
  4. ^ Количество тестов, , должен масштабироваться как для детерминированного дизайна по сравнению с для проектов, допускающих сколь угодно малые вероятности ошибки (как и ).[4]
  5. ^ Нужно быть внимательным, чтобы различать, когда тест дает ложный результат, и когда процедура группового тестирования терпит неудачу в целом. Возможно как сделать ошибку, если нет некорректных тестов, так и не сделать ошибку с некоторыми некорректными тестами. Большинство современных комбинаторных алгоритмов имеют некоторую ненулевую вероятность ошибки (даже при отсутствии ошибочных тестов), поскольку это значительно уменьшает количество необходимых тестов.
  6. ^ На самом деле можно добиться большего. Например, Ли -этапный алгоритм дает явную конструкцию .
  7. ^ Альтернативно можно определить уравнением , где умножение логическое И () и сложение логическое ИЛИ (). Вот, будет на позиции если и только если и оба для любого . То есть, если и только если хотя бы один бракованный товар был включен в тестовое задание.
  8. ^ Этот вид измерения используется во многих приложениях. Например, некоторые виды цифровых фотоаппаратов[28] или аппараты МРТ,[29] где временные ограничения требуют выполнения лишь небольшого количества измерений.
  9. ^ Более формально у хэшей есть свойство, называемое сопротивлением столкновениям, которое заключается в том, что вероятность того, что один и тот же хэш в результате разных входных данных очень мала для данных подходящего размера. На практике вероятность того, что два разных входа могут дать один и тот же хэш, часто игнорируется.

использованная литература

Цитаты

  1. ^ Колборн, Чарльз Дж .; Диниц, Джеффри Х. (2007), Справочник комбинаторных схем (2-е изд.), Бока-Ратон: Chapman & Hall / CRC, п. 574, Раздел 46: Объединение проектов, ISBN 978-1-58488-506-1
  2. ^ а б c Дорфман, Роберт (декабрь 1943 г.), «Выявление дефектных членов больших популяций», Анналы математической статистики, 14 (4): 436–440, Дои:10.1214 / aoms / 1177731363, JSTOR 2235930
  3. ^ а б c d е ж г час я j k л м п о п q р s т ты v ш Дин-Чжу, Ду; Хван, Фрэнк К. (1993). Комбинаторное групповое тестирование и его приложения. Сингапур: World Scientific. ISBN 978-9810212933.
  4. ^ а б c d е ж г час я Атия, Джордж Камаль; Салиграма, Венкатеш (март 2012 г.). «Булево сжатое зондирование и шумное групповое тестирование». IEEE Transactions по теории информации. 58 (3): 1880–1901. arXiv:0907.1061. Дои:10.1109 / TIT.2011.2178156.
  5. ^ а б c d е ж г час я j Чун Лам Чан; Пак Хоу Че; Джагги, Сидхартх; Салиграма, Венкатеш (1 сентября 2011 г.), «49-я ежегодная конференция Аллертона по коммуникациям, управлению и вычислениям, 2011 г. (Аллертон)», 49-я ежегодная конференция Allerton по коммуникациям, управлению и вычислениям, стр. 1832–1839, arXiv:1107.4540, Дои:10.1109 / Allerton.2011.6120391, ISBN 978-1-4577-1817-5
  6. ^ Hung, M .; Ласточка, Уильям Х. (март 1999 г.). «Робастность группового тестирования при оценке пропорций». Биометрия. 55 (1): 231–237. Дои:10.1111 / j.0006-341X.1999.00231.x. PMID 11318160.
  7. ^ Чен, Хун-Бин; Фу, Хун-Линь (апрель 2009 г.). «Неадаптивные алгоритмы порогового группового тестирования». Дискретная прикладная математика. 157 (7): 1581–1585. Дои:10.1016 / j.dam.2008.06.003.
  8. ^ Де Бонис, Анналиса (20 июля 2007 г.). «Новые комбинаторные структуры с приложениями для эффективного группового тестирования с ингибиторами». Журнал комбинаторной оптимизации. 15 (1): 77–94. Дои:10.1007 / s10878-007-9085-1.
  9. ^ Хейс, Дж. (Август 1978 г.). «Адаптивный метод локального распространения». Транзакции IEEE по коммуникациям. 26 (8): 1178–1186. Дои:10.1109 / TCOM.1978.1094204.
  10. ^ Стерретт, Эндрю (декабрь 1957 г.). «Об обнаружении дефектных представителей больших популяций». Анналы математической статистики. 28 (4): 1033–1036. Дои:10.1214 / aoms / 1177706807.
  11. ^ Собел, Милтон; Гролл, Филлис А. (сентябрь 1959 г.). «Групповое тестирование для эффективного устранения всех дефектов в биномиальном образце». Технический журнал Bell System. 38 (5): 1179–1252. Дои:10.1002 / j.1538-7305.1959.tb03914.x.
  12. ^ Ли, Чжоу Сюн (июнь 1962 г.). «Последовательный метод отбора экспериментальных переменных». Журнал Американской статистической ассоциации. 57 (298): 455–477. Дои:10.1080/01621459.1962.10480672.
  13. ^ Катона, Дьюла О. (1973). «Обзор комбинаторной теории». Комбинаторные задачи поиска. Северная Голландия, Амстердам: 285–308.
  14. ^ а б c d Хван, Фрэнк К. (сентябрь 1972 г.). «Метод выявления всех дефектных членов популяции путем группового тестирования». Журнал Американской статистической ассоциации. 67 (339): 605–608. Дои:10.2307/2284447. JSTOR 2284447.
  15. ^ Аллеманн, Андреас (2013). «Эффективный алгоритм комбинаторного группового тестирования». Теория информации, комбинаторика и теория поиска: 569–596.
  16. ^ а б Hu, M. C .; Hwang, F.K .; Ван, Цзюй Квей (июнь 1981 г.). «Граничная задача для группового тестирования». Журнал SIAM по алгебраическим и дискретным методам. 2 (2): 81–87. Дои:10.1137/0602011.
  17. ^ Лей, Мин-Гуан (28 октября 2008 г.). «Заметка о гипотезе Ху – Хванга – Ванга для групповой проверки». Журнал ANZIAM. 49 (4): 561. Дои:10.1017 / S1446181108000175.
  18. ^ Риччио, Лаура; Колборн, Чарльз Дж. (1 января 2000 г.). «Более точные границы в адаптивном групповом тестировании». Тайваньский математический журнал. 4 (4): 669–673. Дои:10.11650 / twjm / 1500407300.
  19. ^ а б c d Олдридж, Мэтью; Бальдассини, Леонардо; Джонсон, Оливер (июнь 2014 г.). «Алгоритмы группового тестирования: границы и моделирование». IEEE Transactions по теории информации. 60 (6): 3671–3687. arXiv:1306.6438. Дои:10.1109 / TIT.2014.2314472.
  20. ^ Baldassini, L .; Johnson, O .; Олдридж, М. (1 июля 2013 г.), «Международный симпозиум IEEE 2013 г. по теории информации», Международный симпозиум IEEE по теории информации, стр. 2676–2680, arXiv:1301.7023, CiteSeerX 10.1.1.768.8924, Дои:10.1109 / ISIT.2013.6620712, ISBN 978-1-4799-0446-4
  21. ^ Собел, Милтон; Елашов, Р. М. (1975). «Групповое тестирование с новой целью, оценка». Биометрика. 62 (1): 181–193. Дои:10.1093 / biomet / 62.1.181. HDL:11299/199154.
  22. ^ Бар-Ной, А .; Hwang, F.K .; Кесслер, I .; Куттен, С. (1 мая 1992 г.). Новый соревновательный алгоритм группового тестирования. Одиннадцатая ежегодная совместная конференция компьютерных и коммуникационных обществ IEEE. 2. С. 786–793. Дои:10.1109 / ИНФКОМ.1992.263516. ISBN 978-0-7803-0602-8.
  23. ^ Дамашке, Питер (2000). «Адаптивное и неадаптивное обучение с эффективностью атрибутов». Машинное обучение. 41 (2): 197–215. Дои:10.1023 / А: 1007616604496.
  24. ^ Стинсон, Д. Р .; ван Трунг, Тран; Вэй, Р. (май 2000 г.). «Безопасные защищенные от фреймов коды, шаблоны распределения ключей, алгоритмы группового тестирования и связанные структуры». Журнал статистического планирования и вывода. 86 (2): 595–617. CiteSeerX 10.1.1.54.6212. Дои:10.1016 / S0378-3758 (99) 00131-7.
  25. ^ Colbourn, C.J .; Dinitz, J. H .; Стинсон, Д. Р. (1999). «Связь, криптография и сети». Обзоры по комбинаторике. 3 (267): 37–41. Дои:10.1007 / BF01609873.
  26. ^ а б c d е Гудрич, Майкл Т .; Аталлах, Михаил Дж .; Тамассия, Роберто (7 июня 2005 г.). Информация об индексировании для криминалистики данных. Прикладная криптография и сетевая безопасность. Конспект лекций по информатике. 3531. С. 206–221. CiteSeerX 10.1.1.158.6036. Дои:10.1007/11496137_15. ISBN 978-3-540-26223-7.
  27. ^ Хлебус, Б.С. (2001). «Рандомизированная связь в радиосетях». В: Pardalos, P. M .; Rajasekaran, S .; Reif, J .; Ролим, Дж. Д. П. (ред.), Справочник по рандомизированным вычислениям, Vol. I, с.401–456. Kluwer Academic Publishers, Дордрехт.
  28. ^ Тахар, Д .; Laska, J. N .; Wakin, M. B .; Дуарте, М. Ф .; Барон, Д.; Sarvotham, S .; Келли, К. Ф .; Баранюк, Р. Г. (февраль 2006 г.). «Новая архитектура камеры сжатия изображений с использованием сжатия в оптической области». Электронное изображение. Вычислительная визуализация IV. 6065: 606509–606509–10. Bibcode:2006SPIE.6065 ... 43T. CiteSeerX 10.1.1.114.7872. Дои:10.1117/12.659602.
  29. ^ Кандес, Э. Дж. (2014). «Математика разреженности (и еще кое-что)». Материалы Международного конгресса математиков. Сеул, Южная Корея.
  30. ^ а б Gilbert, A.C .; Iwen, M. A .; Штраус, М. Дж. (Октябрь 2008 г.). «Групповое тестирование и восстановление разреженных сигналов». 42-я конференция Asilomar по сигналам, системам и компьютерам: 1059–1063. Институт инженеров по электротехнике и радиоэлектронике.
  31. ^ Райт, С. Дж .; Новак, Р. Д .; Фигейредо, М.А.Т. (июль 2009 г.). «Разреженная реконструкция разделимым приближением». Транзакции IEEE при обработке сигналов. 57 (7): 2479–2493. Bibcode:2009ITSP ... 57.2479W. CiteSeerX 10.1.1.142.749. Дои:10.1109 / TSP.2009.2016892.
  32. ^ а б Berinde, R .; Gilbert, A.C .; Indyk, P .; Karloff, H .; Штраус, М. Дж. (Сентябрь 2008 г.). Сочетание геометрии и комбинаторики: единый подход к восстановлению разреженных сигналов. 46-я ежегодная конференция Allerton по коммуникациям, управлению и вычислениям. С. 798–805. arXiv:0804.4666. Дои:10.1109 / ALLERTON.2008.4797639. ISBN 978-1-4244-2925-7.
  33. ^ Индик, Петр (1 января 2008 г.). «Явные конструкции для сжатого измерения разреженных сигналов». Материалы девятнадцатого ежегодного симпозиума ACM-SIAM по дискретным алгоритмам: 30–33.
  34. ^ Остин, Дэвид. «Столбец характеристик AMS - стратегии объединения для тестирования COVID-19». Американское математическое общество. Получено 2020-10-03.
  35. ^ Прасанна, Дирадж. «Объединение гобеленов». Tapestry-pooling.herokuapp.com. Получено 2020-10-03.
  36. ^ «Оригами». Оригами. 2 апреля 2020 г.. Получено 7 апреля, 2020.
  37. ^ «Оригами». Оригами. 2 апреля 2020 г.. Получено 7 апреля, 2020.

Общие ссылки

  • Дин-Чжу, Ду; Хван, Фрэнк К. (1993). Комбинаторное групповое тестирование и его приложения. Сингапур: World Scientific. ISBN 978-9810212933.
  • Курс Атри Рудры по кодам с исправлением ошибок: комбинаторика, алгоритмы и приложения (весна 2007 г.), лекции 7.
  • Курс Атри Рудры по кодам с исправлением ошибок: комбинаторика, алгоритмы и приложения (весна 2010 г.), лекции 10, 11, 28, 29
  • Ду Д. и Хван Ф. (2006). Объединение дизайнов и неадаптивное групповое тестирование. Бостон: Twayne Publishers.
  • Олдридж, М., Джонсон, О. и Скарлетт, Дж. (2019), Групповое тестирование: перспектива теории информации, Основы и тенденции® в теории коммуникации и информации: Vol. 15: No. 3-4, pp 196-392. Дои:10.1561/0100000099
  • Эли Порат, Амир Ротшильд: явные неадаптивные комбинаторные схемы группового тестирования. ИКАЛП (1) 2008: 748–759
  • Каган, Евгений; Бен-гал, Ирад (2014), "Алгоритм группового тестирования с онлайн-информационным обучением", IIE транзакции, 46 (2): 164–184, Дои:10.1080 / 0740817X.2013.803639, ISSN 0740-817X

Смотрите также