Tag Archives: зрительное внимание

Внимание к деталям

В рекламном ролике принтера фирмы Canon решили показать разницу между профессиональным фотографом и обычным человеком. История о том, как зная одержимость профессиональных фотографов к деталям, решили узнать, насколько она выражена.

Человек, не имеющий отношения к фотографии, студент фотограф и профессионал, Джоэл Граймз, смотрели на работу, которую вы видите в начале статьи. Фото, кстати, самого Граймза. Вот какими оказались результаты:

Вот собственно сам ролик:

Ролик можно также посмотреть здесь: http://www.canonpro1000.com/

Пока боги еще молодые

боги Сейчас на coursera идет курс по нейромаркетингу, который меня естественным образом заинтересовал. Томас Рамсой (Thomas Zoëga Ramsøy), ведущий курса, прошелся по вычислительной нейробиологии (computational neuroscience). В частности, по программе, которая определяет салиентность (saliency – заметность) элементов визуального стимула. Салиентность объекта – это целый ряд его характеристик, которые делают его выделяющимся на фоне других. То может быть плотность, контраст, размер и прочее. Можно сделать объект салиентным и гарантировать, что на него обратят внимание. И вот такие программы эмулируют внимание человека, и создают saliency maps -тепловые карты внимания, аналогичные тем, что получаются методом ай-трекинга. Программа NeuroVision, про которую он говорил, сделана компанией, к которой он имеет прямое отношение. К слову сказать, таких программ сейчас уже довольно много, и я изучал несколько таких еще пару лет назад.

Например, ниже две карты одной рекламы – одна, сделанная программой (слева), и другая, сотворенную вниманием 15 людей (справа). Я сделал это еще в 2012 году:
сравнение карт внимания программы и людей Считается, что точность их соответствия – около 80-85%. Анализ одной картинки может стоить, в зависимости от программы – от нескольких долларов до вполне приличных сотен. С одной стороны, теоретической, это круто и неплохо, а с другой стороны, практической, давайте посмотрим, как далеко ушел прогресс.

Вот одна из картинок, которая была проанализирована: упаковка кока-колы

Вот как программа сначала оценивает характеристики картинки:
начало анализа А вот как программа обрабатывает картинку:
карта салиентности Мне сразу показалось это неправильным, потому что, проанализировав сотни картинок, «пропущенных через глаза» реальных людей, у меня тоже, видимо, образовалось интуитивное представление о салиентности. Оно, в большинстве случаев, ошибочное, но не настолько же! На днях представился случай поставить эту картинку в исследование, и вот как увидели эту же картинку 10 человек, 5 мужчин и 5 женщин:
тепловая карта внимания Разница существенная. С практической точки зрения, сегодня полагаться на такую программу я бы не стал. Если на кону стоит важная задача – дизайн упаковки, которую напечатают миллионным тиражом, или реклама, которую развесят на несколько месяцев тысячами плакатов, или дизайн помещения, то верить результатам программы было бы неразумно. А зачем тогда вообще? Если анализу нельзя особо доверять, то и задачу, которую он решает, не стоит анализировать.

Интересно, что математические модели, которые анализируют изображения можно учить, учить и учить, скармливая им реальные результаты и давая обратную связь попыток, и делать это пока точность не достигнет результатов, схожих с результатами людей. Вопрос, на мой взгляд, исключительно организационный – потребуется множество ресурсов, чтобы это осуществить. Но главное – это можно сделать, и не видно каких-то неосуществимых задач.

Давайте пофантазируем, что это сделано – после нескольких лет работы большой команды, которая делала по сотне исследований с ай-трекером каждый день и кормила ненасытную модель, мы получили алгоритм, который с 99% точностью имитирует зрительное внимание человека.

Теперь компьютер может создавать дизайны всего – квартиры, рекламы, гаджета, одежды – так, чтобы добиться поставленной цели. И это лишь ничтожный пустяк. Компьютер теперь понимает эволюционные программы, вшитые в нас, которые и управляют нашим вниманием. Через понимание зрительного внимания он может предполагать о нас невероятно много: насколько мы голодны, и чего именно нам не хватает, когда у нас был секс, и на какой стадии менструального цикла мы находимся, есть ли у нс дети и сколько им лет, каковы шансы принятия практически любого нашего решения в любой ситуации. Посредством кроссмодальности машина будет знать, нравится ли нам запах чего-то, или музыка, которую мы слышим, ткань пальто, которое мы трогаем, и массу чего еще. «Понимание» зрительного внимания – один из ключей к пониманию работы нашего мозга. Без преувеличения можно сказать, что компьютер будет знать о нас на порядки больше, чем мы сами. Фактически, еще до того, как мы захотели совершить какой-то поведенческий акт, машина уже, с большой вероятностью, понимает, что это будет, то есть раньше, чем это станет сознательной мыслью в нашем мозге. Выбор поведения, будь то покупка товара или выбор партнера для совместной жизни будет в виде альтернатив с подсчитанным вероятностным исходом, представленных машиной. Но для каких целей и кем именно будут считаться эти вероятности?

Если это будет опираться на древние эволюционные программы, то грубо говоря, целями станут выживание и размножение, причем не обязательно индивидуального организма. Если программа говорит «сделай так», то у нас нет ни малейшего шанса проверить, во благо лично нам она это советует, либо во благо вида: ведь программа должна быть связана с другими людьми (в идеале, со всеми) и должна корректировать свои вычисления. Все наши неосознаваемые процессы программа отслеживает, а то, что приходит к нам в сознание, она видит заранее.

Компьютер станет нашим богом, которому ведомы наши чаяния и предположения, а его мотивы и алгоритмы будут так же скрыты от нас, как неизвестны нам причины наших поступков сегодня. Религия, с этой точки зрения, выглядит как интуитивное предвосхищение полного и безусловного рабства и покорности перед кем-то, кто знает, что нам следует делать. Делать без объяснений и сопротивления, без надежды на понимание, соглашаясь на выбор, который сделан ради неведомых нам целей. Смартфон, который мы держим в руках уже сегодня — наш маленький, но быстро взрослеющий растущий божок, которого мы сами создали.

Объем сознания – ничтожная лужа, в сравнении с морем неосознаваемых процессов, происходящих в нашем мозге. Если бы у нас не было сознания, мы бы не парились по всем этим вопросам, а мирно кушали бы, спаривались и спали. Зачем оно появилось и что нам с ним делать – вот вопрос, на который мы должны ответить, пока компьютеры могут моделировать наше поведение лишь на 80%, и наш молодой бог не подрос…

Вот, левый поворот

левый поворот Для большинства людей вождение — хорошо отработанная способность, как правило, не требующая серьезной умственной деятельности. Но есть некоторые отвлекающие моменты, например, разговор с пассажиром или изменения в обстановке, которые создают нагрузку на процессуальные возможности мозга и увеличивают риск аварии.
Например, исполнение поворота направо (при правостороннем движении) требует лишь незначительной затраты ресурсов мозга. А вот для поворота налево ресурсы уже требуются в большей степени. По статистике Американской национальной администрации дорожного движения, повороты налево в условиях загруженных дорог – одна из предпосылок многих серьезных аварий (National Highway Traffic Safety Administration, 2009).

Левый поворот, отягощенный отвлекающими факторами: разговорами с пассажирами или по телефону (даже если он поставлен на громкую связь), или слушанием музыки приводит к перераспределению загрузки многих регионов мозга, создавая одну из самых опасных ситуаций на дороге.

В недавнем эксперименте исследователи (Schweizer et al., 2013) попросили участников поездить на симуляторе, и давали им разнообразные отвлекающие задачи, снимая изменения активации регионов мозга в магнитно-резонансном томографе.

На картинке ниже — активация регионов мозга при выполнении задач.
Верхний ряд – правый поворот. Минимальная активация.
Средний ряд — левый поворот без траффика на дороге. Больше активации в больших регионах мозга.
Нижний ряд – левый поворот в условиях траффика. Значительное увеличение активации в сравнении с предыдущими задачами.

активация мозга при выполении разных задач Дело в том, что увеличение внимания к звуковой информации приводит к активации ответственных за это регионов мозга, снижая активацию регионов по обработке зрительной информации. Ресурсы мозга в каждый конкретный момент – ограничены и если они направляются в один регион, значит, в другом они уменьшаются. Иными словами, разговор уменьшает наше зрительное внимание, именно тогда когда оно нам наиболее необходимо.

Schweizer, T. A., Kan, K., Hung, Y., Tam, F., Naglie, G., & Graham, S. (2013). Brain activity during driving with distraction: an immersive fMRI study. Frontiers in Human Neuroscience, 7.
National Highway Traffic Safety Administration. (2009). Traffic Safety Facts. Washington, DC: U.S. Department of Transportation; 2011. DOT HS 811 402. Accessed March 27, 2012. Available online at: http://www.thenewspaper.com/rlc/docs/2011/us-tsf09.pdf

Средь шумного бала, случайно

Это я, недавно, провожу пилотное ай-трекинговое исследование на одном корпоративном мероприятии в гостинице Шератон, в Москве. Людям было интересно, и результаты тоже получились любопытные, как обычно.

Например, никто не заметил состава изделия: