Теорема Бейза и тестирование на наркотики

Бейз

Бейз

Постоянно говорят о необходимости тестирования людей на наркотики. Вот  Медведев “одобрил идею обязательного тестирования молодёжи на наркозависимость”. В этой статье, Олег Зыков, Президент Общероссийского общественного благотворительного Фонда  “Российский благотворительный фонд “Нет алкоголизму и наркомании”” (РБФНАН), пояснил, что дело это методически сложное. “Так, в 2008 году в Татарстане провели тестирование всего детского населения, а это порядка 300 тысяч человек, из которых выявили 415 детей со следами наркотического вещества. То есть стоимость одного выявленного потенциального наркомана обошлось бюджету в сумму порядка 70 тысяч рублей. “И при этом, – подчеркивает Олег Зыков, – эффективность составила 0,14 процента”.

То есть он говорит, что число людей, показавших положительный результат на наркотики, составило 0,14 процентов. И в чем недовльство – в том, что мало положительных результатов? Не касаясь даже вопроса о том, что, вообще-то, это нарушает права человека, создавая ограничения, по сути, не отличающиеся от ограничений по полу, возрасту или национальности. Можно ли допустить, что человек не хочет сдавать свои биологические жидкости для такого теста, и его отказ не должен препятствовать учиться или работать в месте, где ему нравится. Разумеется, кроме работ, связанных с повышенной опасностью.

Мне вспомнилась Теорема Бейза, которая отлично иллюстрирует ситуацию, неизбежно возникающую при тестировании. Теорема Бейза – одна из основных в теории вероятности, которая позволяет определить вероятность того, что произошло какое-либо событие (гипотеза) при наличии лишь косвенных тому подтверждений (данных), которые могут быть неточны.

Тест на наркотики

Вот есть тест на наркотики, например, как на картинке. Его достоверность, по заверениям производителя, равна 99%. Этот тест в 99 случаях из 100 покажет позитивный результат, если человек употреблял наркотики. И в 99 случаях из 100 определит “чистого”, если тест выходит отрицательный.

Кажется вполне надежный тест, не так ли? И вот рьяный чиновник берется проверять, например, студентов. Предположим, что 0,5% студентов действительно употребляют наркотики. Назовем их D, а тех, кто не употребляет – N. Плюсом мы обозначит факт положительного теста на наркотики. А вот, собственно, и теорема (формула) Байеса:

Теорема Бейза

P(D) – вероятность того, что студент употребляет наркотики, равна 0.005,  потому что 0.5% популяции употребляют.

формула Бейза

P(N) – вероятность, что студент не употребляет наркотики = 1- P(D) = 0.995.

P(+|D) – вероятность, что тест позитивный и студент употребляет наркотики. Она, как мы знаем, равна 0.99, потому что достоверность теста 99%.

P(+|N) – вероятность того, что тест положительный, а студент наркотики не употребляет. Мы знаем, что таких случаев 1%, то есть вероятность равна 0.01.

P(+) – вероятность положительного теста вне зависимости от другой информации. Высчитывается как P(+|D) P(D) + P(+|N) P(N) и равна 0.0149.

Подставляем значения и получаем:

формула БейзаЧто мы видим? Несмотря на высокую достоверность теста, вероятность того, что студент, который показал положительный тест, на самом деле употребляет наркотики, равна 33%, то есть гораздо более вероятно (более чем в два раза), что положительный тест говорит о том, что он не употребляет наркотики! Это происходит от того, что условия, которые мы тестируем, довольно редки, и результат позитивного теста будет чаще ошибочно позитивный.

Если бы 10% студентов употребляли наркотики, P(D) = 0.1.
P(N) = 1-0.1 = 0.9, то мы получили бы другую вероятность, равную 92%. Это уже что-то. Тем не менее, 8% людей могут быть ошибочно обвинены в употреблении. Эта цифра практически равна цифре употребляющих. Кого мы в таком случае ищем и кого найдем?

Слышал, что специалисты оценивают число употребляющих наркотики в России в 1,7%. Подставляя значения в формулу, получаем точность положительного теста в 63%, при таком числе употребляющих. Выше случайности, но все равно огромное число ложно-положительных результатов.

Вопрос: сколько нужно сделать тестов одному человеку, чтобы сказать со 100% точностью, что он употреблял наркотики? :)

В заметке использованы материалы из книги Гигерензера про интуицию (2007). Фото теста на наркотики отсюда.

Gigerenzer, G. (2007). Gut feelings: the intelligence of the unconscious. New York: Viking.

3 thoughts on “Теорема Бейза и тестирование на наркотики

  1. Нужно прологарифмировать вероятность получения ложноположительного срабатывания. То есть, если вероятность получения ложноположительного срабатывания 0.25 (25%), а нам необходимо быть уверенным в результате теста на 90% то надо высчитать логарифм от 0.1 (100%-90%) по основанию 0.25. В данном случае это будет 2.

Добавить комментарий