Вслед за впечатляющими результатами предыдущего исследования, Акуисти и его коллеги решили расширить цель эксперимента и теперь посмотреть на то, как программа распознавания лиц, социальные сети и технологии статистической идентификации могут быть использованы для «дополнения реальности», то есть синтеза онлайновой и офлайновой информации на основе перекрёстных обращений в общедоступные хранилища данных (вроде социальных сетей). Упрощённо формулируя цель задачи, учёные решили посмотреть, а возможно ли просто от незнакомого лица, попавшегося на улице, прийти к номеру социального страхования этого человека?
Для ответа на этот и близко к нему относящиеся вопросы было придумано и проведено несколько экспериментов.
Эксперимент I
В первом из экспериментов этой серии исследователи воспользовались открыто доступными для всех фотографиями из Facebook для того, чтобы «переидентифицировать» анонимных, как правило, пользователей в других, более деликатных социальных сетях, таких, как сайты знакомств.
Для этого на одном из наиболее популярных в США сайте знакомств были отобраны около 6 000 фотографий из профилей тех людей, которые проживают в одном конкретном городе. Подавляющее большинство посетителей такого рода сайтов предпочитает использовать псевдонимы. Отобранные фотографии прогнали через общедоступную программу распознавания лиц, которая сравнивала их с базой из 280 000 снимков, автоматически найденных и собранных поисковой машиной, перед которой ставилась задача выявить на сайте Facebook профили тех людей, что проживают в том же самом городе.
Даже при таком, лобовом и совершенно примитивном, подходе исследователи тут же установили личности чуть более одной десятой среди тех людей, что посещают сайт знакомств. На первый взгляд, такая цифра не выглядит особо впечатляющей. Однако можно отметить, что это был чисто пассивный, без «выхода в офлайн», сбор информации из сетевых баз данных. Кроме того, можно уверенно прогнозировать, что число успехов в подобных изысканиях будет неуклонно расти по мере дальнейшего улучшения программ распознавания лиц и по мере того, как всё больше фотографий выкладывается людьми в сеть.
Эксперимент II
Суть второго эксперимента уже можно охарактеризовать как синтез онлайновой и офлайновой информации. Для начала исследователи отобрали (тем же автоматическим способом) около 25 000 фотографий с именами таких пользователей Facebook, которые согласно их страницам-профилям учатся в университете Карнеги-Меллона. Затем они установили в кампусе этого университета свой компьютер с веб-камерой, а всех желающих прохожих пригласили поучаствовать в качестве добровольных участников эксперимента.
Внешняя сторона этого эксперимента сводилась к тому, что студентов просили на минутку задержаться у компьютера и быстро ответить на вопросы краткой онлайновой анкеты. Менее же очевидная сторона опыта заключалась в том, что в то время, когда студенты заполняли анкету своими ответами, веб-камера делала снимок студента, соответствующая программа анализировала лицо и запускала процедуру его сравнения в реальном времени с уже имеющимися фотографиями из накопленной базы данных.
В таких условиях эксперимента веб-камерой были сделаны фотографии 93 студентов (с их согласия, ясное дело). В 29 случаях (то есть уже 31 процент исходов) программа распознавания лиц оказалась способна присовокупить к лицу и анкете соответствующее имя отвечавшего на вопросы. На каждый поиск-идентификацию при этом затрачивалось в среднем меньше трёх секунд.
Эксперимент III
Суть этого эксперимента, развивающего результаты второго, можно охарактеризовать набирающим популярность термином Augmented Reality, или «дополненная реальность». Как показывает опыт, если незнакомого человека на улице становится возможным быстро идентифицировать по его лицу и данным из социальных сетей, то оказывается возможным и много большее — типа получения об этом человеке массы дополнительной, порой весьма чувствительной к компрометации информации в реальном времени.
В своём третьем эксперименте, в качестве подтверждения концепции, исследователям удавалось с высокой вероятностью предсказывать персональные интересы незнакомцев и их идентификационные номера SSN (в качестве «незнакомцев» выступали опознанные участники эксперимента II). Мгновенные познания о личных интересах, ясное дело, были позаимствованы с персональных страниц в Фэйсбуке, а предсказание SSN, как несложно догадаться, выводилось по уже отработанной технологии предыдущего исследования.