Tag Archives: статистика

Маленькая убойная история из Дании

старушкаВ начале 2000-х было проведено одно исследование в области здоровья пожилых, показавшее, что их участие в образовательных программах вроде как снижает смертность. Было решено провести исследование с большим количеством людей, и ученые начали его планировать. Для этого они отобрали 860 пожилых людей, и разделили их на две группы – контрольную и экспериментальную, путем случайного распределения, при этом сами участники эксперимента не знали, в какой группе оказались. Они вообще и не знали, что их поделили на группы. Сделав это распределение, ученые продолжили готовить исследование, а через полтора года решили обратить внимание на состояние готовности групп к эксперименту.

Выяснилось, что в экспериментальной группе смертность была значимо выше в сравнении с контрольной группой (p=0.003). Напомню, что с участниками исследования не делали ровным счетом ничего. Они даже и не знали, что там у ученых происходит. Но если бы ученые применяли в экспериментальной группе что угодно, результаты показали бы, что это убийственно плохо.

Ученые сами обалдели от такого результата, назвав его каким-то методологическим невезением, глюком, причин которого, впрочем, выяснить им не удалось.

Очаровательная история, на мой взгляд, которую стоит вспоминать, когда начинает казаться, что в чем-то уверен на 100%.

Vass, M. (2010). Prevention of functional decline in older people: The Danish randomised intervention trial on preventive home visits. København: Museum Tusculanum.


Как и когда вы умрете

как вы умретеНатан Яу, автор сайта FlowingData и нескольких книг, статистик по профессии, представляет любопытные интерактивные графики, построенные на статистических данных.

На первом – показана вероятная причина смерти от различных причин (данные американские, поэтому могут отличаться от причин российского происхождения).

Вот, например, белая женщина, которой сегодня 45 лет и причина ее смерти, допустим, в 95 лет – сердечно-сосудистое заболевание, на первом месте, и рак, на втором. Только 7% ее ровесниц доживет до такого возраста.

график причины смертности

А вот белый мужчина 21 года, который, если и умрет в 32 года, то, с очень большой вероятностью, – от внешних причин.

причина смерти на графике

Вы сами можете поиграться со своими данными здесь.

Напоминание о смерти (mortality salience) – неплохо изученный вопрос в психологии, и в умеренных дозах вполне полезен для психического здоровья как человека, так и общества.

Другой график касается вопроса «сколько лет осталось жить». Также основан на американских данных.

На примере данные женщина 27 лет. С вероятностью в 75% она проживет еще 50 и более лет.

сколько лет осталось прожить

Можно поиграться и «узнать» свои результаты здесь.

Такой прогноз кажется абстрактным, и он таковым является. Но интересно, насколько повысится персонализация и точность таких прогнозов, учитывая растущие горы данных? Если по человеку снимаются данные о качестве его сна, давлении, характеристиках пульса, маршрута до работы с точной статистикой аварий на нем, наложенные на его генетические данные, историю болезни и сотни других параметров, то результаты будут становиться точнее. И одновременно, самоценность и статичность такого результата будет падать, ибо никому не нужна дата и время своей смерти, но способы ее избегания. Возможностей таких будет становиться все больше и больше.

Например, если человек проживает в стране третьего мира, то он может улучшить свои значения, переехав в страну с лучшей санитарией, медициной и социальной средой. Это самый простой пример, а сложные возможности будут оперировать не столь очевидными связями.

Между тем, диктаторские страны с развитой коррупцией имеют и статистику, подтасованную под благоприятную картинку. Верить ей нельзя, и это ведет и к уменьшению персонализированных данных по человеку, и к уменьшению способов снижения рисков для жизни. И это нормально, так как в таких странах цена жизни людей, не принадлежащих к верхушке, исчезающее мала. Получается, что технологии увеличивают ценность человеческой жизни, просто по факту своего применения.


Русский реализм

Risk Savvy Герд Гигерензер в своей новой книге (Gigerenzer, 2014) упоминает русских, в любопытном контексте.

Гигерензер – директор Центра адаптивного поведения и когнитивных способностей в Институте Развития Человека имени Макса Планка в Берлине. Он занимается многими интересными вещами, и в частности, психологией принятия решений и оценкой вероятностей событий.

В книге приводится пример с ситуацией регулярной проверки грудей женщин (маммографией) и простаты у мужчин (на PSA). Очень часто организации, призывающие к таким проверкам, заявляют о том, что такие проверки ведут к 20% снижения риска смертности от рака груди или простаты. Но это риск относительный, а не абсолютный. Вот как они его выводят: из каждой тысячи женщин, которые не участвуют в таких ежегодных проверках, начиная с возраста в 50 лет, около пяти умрут в течение десяти лет от рака груди. А из каждой тысячи женщин, которые участвуют, умрут только около четырех. Снижение с пяти до четырех и дает эти относительные 20%. У мужчин – аналогичная ситуация с проверкой на PSA: снижение идет с 3,7 человек до 3. Но это, как утверждает Гигерензер, сознательная дезинформация.

Для того чтоб понять, как такая искаженная информация влияет на людей, он с коллегами (Gigerenzer, Mata & Frank, 2009) провел исследование в девяти в европейских странах. Ученые опросили более десяти тысяч человек в Австрии, Франции, Германии, Италии, Голландии, Испании, Польше, Великобритании и России. Мужчин спрашивали о пользе регулярной проверки PSA, а женщин – маммографии.

восприятие пользыКак видно из графика выше, русские оказались наиболее точными – только 77% мужчин переоценивают пользу от таких проверок. Для сравнения – 99% британцев верят в искаженную информацию, что такое сканирование приведет к 20% снижению их смертности. Фактически, идея, которую им внедрили в головы, звучит даже так: «регулярная проверка на PSA приведет к снижению вероятности моей смерти на 20%». Но это не так.

В целом, во всех европейских странах, только 11% мужчин и 8% женщин реалистично оценивают пользу от сканирования. Русские лидируют в реализме: 23% мужчин и 18% женщин. Гигерензер полагает, что дело не в том, что русские лучше других разбираются в теории вероятности и статистике, а в том, что они получают меньше ложной информации. Но мы-то знаем, что является настоящей причиной :)

Шутки шутками, но Гигерензер в своей книге показывает, на множестве других примеров, как такого рода некорректные представления весьма опасны для жизни, и предлагает начать этим интересоваться и понимать риски, которые нас окружают, реально их представлять, и предпринимать необходимые действия. Рекомендую к прочтению.

Gigerenzer, G., Mata, J., & Frank, R. (2009). Public knowledge of benefits of breast and prostate cancer screening in Europe. Journal of the National Cancer Institute, 101(17), 1216–20. doi: 10.1093/jnci/djp237.

Gigerenzer, G. (2014). Risk savvy: how to make good decisions. New York: Viking.

Диаграмма адаптирована из книги.


Лекция Стивена Пинкера

Стивен ПинкерЛекция Стивена Пинкера о рациональности и насилии на fora.tv. Речь идет о темах, которые раскрыты в его последней книге The Better Angels of Our Nature: Why Violence Has Declined. Например: грамотность и печатание книг приводит к уменьшению суеверия и предрассудков. Грамотное и образованное население менее склонно верить, что: колодцы отравили евреи, еретики отправятся в ад, а неурожай связан с проклятием ведьмы, и проч. Чем меньше вы верите в это, тем меньше у вас основ для насилия по отношению к другим. Как сказал Вольтер: «Тот, кто заставил тебя верить в абсурдность, может заставить тебя совершить жестокость».

Интересно, что Нассим Талеб, автор нашумевших книг Черный лебедь и Одураченные случайностью, недавно весьма агрессивно раскритиковал книгу Пинкера, обвиняя того в незнании статистики: документ в pdf.
Пинкер ответил: документ в pdf. Талеб завершил дискуссию: документ в pdf, заключая, что Пинкер некомпетентен в споре с ним. А как вы думаете, кто прав?


Какая попа лучше?

девушки с красивыми попамиЭтот серьезный вопрос часто или недостаточно часто встает перед каждым. Он волнует как смотрящих и выбирающих, так и осматриваемых и выбираемых. Ведь, в самом деле – ну как выбрать, и не ошибиться? Мы, по идее, должны оправдывать свой выбор: одно дело решить, что нам нравится попа А, потому что нравится и все, но на каком основании мы должны отвергнуть другие попы?! Это момент истины, ведь мы понимаем, что дело тут не только в попах, ведь они — символы и метафоры нашей жизни и выбора, который мы делаем каждый день. Мы достаточно долго живем в одной и той же жопе, чтобы научиться, наконец, выбирать себе нормальные и попы, и судьбу. И это как раз тот случай, когда наука спешит на помощь.

Эта фотография показывалась среди прочих в ходе завершившегося в апреле нейромаркетингового исследования с 20 участниками (10 мужчин и 10 женщин), то есть, с использованием прибора слежения за движениями глаз, или, как его называют, ай-трекинг (eye-tracker). На фото вы видите, как две модели, по обе стороны от центральной девушки, поднимают ей юбочку купальника, чтобы у нее, надо полагать, были равные с ними шансы. О себе бы лучше побеспокоились, как мы сейчас увидим.

В ходе анализа мы выделяли различные зоны интереса. Вот, например, на фото, один пример такого выделения зоны:

Число фиксаций взглядов в зонах интереса Тут изображены три зоны — на каждую девушку, с числом взглядов всех участников в каждой зоне. Как вы видите, большее число у центральной девушки, 94, за ней следует та, что слева с 51 взглядом и замыкает правая девушка с 38 взглядами. Различие – статистически значимое.

А на картинке ниже — средняя длительность фиксации взглядов (в миллисекундах), приблизительно одинаковая. То есть, нет ничего особенного ни у одной попы такого, что задерживало бы взгляд дольше, чем у других.

Среднее время фиксации взгляда в миллисекундахА вот, собственно, полное время длительности фиксаций:

Длительность всех фиксаций взглядов в зонах интересаЗдесь разница статистически значимая, и центральная попа лидирует с большим отрывом – только за счет числа взглядов. Центральная попа занимает более 50% внимания, слева от нее – около 30% и правая – около 20%.

Вот тепловая карта всех взглядов:

Тепловая карта всех взглядовИ еще одна:

Карта внимания, созданная по фиксации взглядовИз этого анализа видно, что все же главное внимание зрителей было на попы, а не на траву, скажем, и это радует. Значительный объем внимания на спину центральной девушки, предположительно объясняется: а) руками девушек, которые как мы знаем, привлекают внимание не хуже, чем попы. б) некой динамикой, которую создают эти руки, поднимающие юбочку, потому что движение привлекает наше внимание; в) просто центральностью положения спины, г) еще чем-то.

Что касается рук, то мы провели несколько анализов. Ну, например, один из них:

Длительность фиксаций взглядов на определенных участкахКак и предсказывалось, руки получили довольно много внимания. Мы также знаем, что украшения привлекают внимание. Однако обратите внимание – руки на периферии картинки не удостоились вообще ни одного взгляда, даже несмотря на то, что левая рука центральной девушки — с браслетом. Даже грудь левой девушки не особо пользовалась вниманием. Снижение внимания на периферии возвращает нас к гипотезе центрального положения.

Есть такой эффект центрального положения (Centre Stage effect): мы предпочитаем объекты, расположенные в центре. Так, одно исследование показало, что в шоу-викторинах типа Слабое звено, тот игрок, который располагается посередине, считается зрителями как наиболее успешный. А когда людям показывали групповое фото кандидатов на работу, они выбирали чаще всего тех, кто находился в центре, несмотря на то, что было сказано, что все они практически одинаковы по квалификации (Raghubir & Valenzuela, 2006).

Недавнее исследование (Rodway, Schepman, & Lambert, 2012) продемонстрировало, что мы чаще всего выбираем центральный объект, и когда объекты расположены по горизонтали, и когда по вертикали. Ученые показывали по 5 картинок: видов природы, собачек, идентичных носков – все равно что, больше выбора падало на центральные объекты.

Если увеличенное внимание к центральной попе обуславливается этим эффектом, чем мы объясним второе место у левой девушки? Я бы здесь провел проверку, (возможно так и поступлю) – перевернув по горизонтали фотографию, чтоб она оказалась справа, и прогнав ее опять через ай-тракер. А пока можно предположить, что роль сыграл цвет купальника, поворот тела, и все что угодно еще. Что угодно, потому что в предыдущих исследованиях я видел, как взгляд уходил скорее вправо, чем влево, от центра, но это не было статистически значимо.

Вывод: размещайте свою попу, если хотите чтобы ее выбрали, и не только ее, как можно ближе к центру! Помните также одну вещь, которая идет тут лейтмотивом в блоге: даже если человек знает про этот феномен, он все равно ведется на него.

Raghubir, P. & Valenzuela. (2006). Centre-of-inattention: Position biases in decision-making. Organisational Behaviour and Human Decision Processes, 99, 66-80.

Rodway, P., Schepman, A., & Lambert, J. (2012). Preferring the one in the middle: Further evidence for the centre-stage effect. Applied Cognitive Psychology, 26 (2), 215-222.


Понимание неопределенности

МикромортыМикроморт – единица риска, обозначающая вероятность смерти, равную одному шансу на миллион. Микроморты полезны для измерения и лучшего представления рискованности различных видов деятельности. Термин был придуман Рональдом Говардом (Ronald Howard) и образован от слияния двух слов: микро – одна миллионная, и mortality (англ.) – смертность.
По-другому 1 микроморт можно представить как русскую рулетку, когда смерть наступит в случае, если подброшенные одновременно 20 монеток покажут решку или орла. Статья в википедии.

ЗА каждый прожитый день мы получаем 39 микромортов (при продолжительности жизни в 70 лет), просто за то, что мы живы. Три сигареты добавят 2 микроморта (шансы получить сердечно-сосудистое заболевание и рак легких). Скушать 100 стейков (шашлыков), пожаренных на огне, стоит тоже 1 микроморт (шанс умереть от рака, вызванного бензопиреном). Один микроморт в Великобритании оценивается в 1,6 фунтов стерлингов (порядка 77 рублей).

Это очень полезная концепция, потому что позволяет представить себе риски, которые иначе очень трудно воспринять. Вот как выглядит рискованность различного вида перемещений и их риска (картинка в самом верху). Как видите, мы получаем 1 микроморт за поездку в 250 миль (400 километров) на автомобиле, а за то же самое расстояние на мотоцикле мы заполучим суточную дозу!

Более подробно про эти и другие интересные вещи – на сайте Understanding Uncertainty. Там много полезной и интерактивной анимации, в том числе, с возможностью введения своих данных.


Статистика

игральные костиПроверьте себя. Надо выбрать одну страну из пары, ту, которая имеет самый большой уровень детской смертности на душу населения. Ответы в конце заметки.

Шри Ланка или Турция?
Польша или Южная Корея?
Малазия или Россия?
Пакистан или Вьетнам?
Таиланд или ЮАР?

Этот тест предлагал профессор Ханс Рослинг (Hans Rosling) своим студентам курса глобального здравоохранения. Казалось бы, они-то должны были знать это лучше, чем кто-либо еще. Однако их ответы были правильными в среднем в 1,8 случаях из 5 (в 36% правильные). Если бы вы подкидывали монетку, отвечая на такие вопросы, вы были бы правы в 2,5 случаях. Он предлагал этот тест и ученым, некоторые из которых имели Нобелевские премии в области здравоохранения, и они были правы в 2,4 случаях.

Из фильма The Joy of Stats BBC4. Рекомендую к просмотру.

Правильные ответы: Турция, Польша, Россия, Пакистан и ЮАР.