Вечером 4 июля российские пользователи обнаружили, что поисковик «Яндекс» слишком тщательно индексирует документы, хранящиеся в сервисе Google Docs: в выдаче оказались файлы, содержавшие пароли, номера кредитных карт и корпоративные документы. Пресс-служба «Яндекса» заявила, что компания действовала строго по правилам, но уже в час ночи 5 июля российский поисковик переставал выдавать какие-либо результаты из Google Docs. «Медуза» рассказывает, что произошло — и какая общественно значимая информация появилась в публичном доступе из-за лазейки.
Как это могло произойти?
Ссылки на Google Docs в поисковиках — это нормально. Но не на все
В 2009 году Google объявила, что публичные документы из Google Docs начнут появляться в выдаче поисковиков — но только если на них существует публичная ссылка. На практике это должно означать, что ссылка на документ, которой пользователь не делился ни с кем (или делился только в почте или мессенджерах), не должна появляться в выдаче — даже если доступ к документу не ограничен. С тех пор поисковики — и сам Google, и Mail.ru, и Yahoo, и Bing — действительно индексируют десятки тысяч публичных документов из Google Docs. Уникальная ситуация с «Яндексом» заключается в том, что он удивительно качественно начал выдавать ссылки на файлы с действительно важной информацией.
Если покопаться, в других поисковиках тоже можно найти документы с приватными данными, но по простому запросу «пароли» они не выдают ссылки на таблицы с паролями, предлагая вместо этого неинтересные документы-ловушки. Более того, журналистам «Медузы» не удалось найти в Google те приватные документы, что выдавались на первых страницах выдачи «Яндекса», даже используя их полное название.
В корпоративном блоге Google на русском языке 5 июля появилась запись, которая фактически подтверждает правила индексации, описанные выше. «Яндекс» в ней никак не упомянут.
В «Яндексе» не объясняют, что произошло
Формально вина за утечку таких документов лежит на пользователях, которые выставили неправильные настройки приватности (не хочешь, чтобы их видели посторонние, — не открывай доступ «для всех»). Однако как они оказались в выдаче «Яндекса», все равно неясно.
В «Яндексе» на этот вопрос не отвечают. Единственный комментарий пресс-службы о произошедшем звучит так: «„Яндекс“ индексирует только открытую часть интернета — те страницы, которые доступны при переходе по ссылкам без ввода логина и пароля. Страницы, индексация которых запрещена администратором сайта в файле robots.txt, „Яндекс“ не индексирует, даже если они находятся в открытой части интернета. В среду вечером в службу поддержки обратились пользователи с жалобами на проблему доступности файлов на docs.google.com. Наша служба безопасности связывается сейчас с коллегами из Google, чтобы обратить их внимание на то, что в этих файлах может оказаться приватная информация».
Robots.txt — специальный файл, который хранится в корне многих сайтов. В нем указаны инструкции для поисковых роботов: какие файлы и пути на сервере они не должны сканировать, а какие могут. У Google Docs такой файл тоже есть. В нем прописано, что поисковики могут сканировать в том числе адреса, начинающиеся на docs.google.com/document — именно так выглядит первая часть ссылки на текстовый документ, созданный в сервисе. Таким образом, роботы «Яндекса» имели право индексировать документы, к которым сами пользователи открыли доступ (изучить содержимое приватных файлов поисковик в любом случае не смог бы — это уже контролирует Google). Другое дело, что просто подобрать адреса документов «Яндекс» бы не сумел: это длинные случайные наборы символов. Ссылки на файлы, к которым может иметь доступ кто угодно, все равно нужно было где-то добыть.
Возможно, все дело в «Яндекс.Браузере». Но это неточно
Можно осторожно предположить, что люди, создающие файлы с паролями или отчетами, не выкладывали на них публичные ссылки. Некоторые пользователи предположили, что «Яндекс» индексирует ссылки, которые открывали пользователи «Яндекс.Браузера» — либо пересылали друг другу через «Яндекс.Почту».
У теории с браузером есть предыстория: в 2015 году оказалось, что «Яндекс.Браузер» передавал на серверы «Яндекса» информацию о том, какие страницы посещал пользователь (это задокументированнаяособенность приложения). Затем эти ссылки попадали в базу робота, который индексирует интернет для поисковика. Как следствие, робот переходил даже по ссылкам, которые передавались приватно, — они позволяли зайти в профиль пользователя без пароля. Теоретически такие приватные страницы, доступные только по прямой ссылке, могли оказаться в поисковой выдаче, но в том случае этого не произошло. В «Яндексе» тогда заявили, что робот получил ссылки от браузера по ошибке и больше такого не будет.
На вопросы «Медузы» о том, могло ли появление ссылок на Google Docs в выдаче «Яндекса» быть связано с тем, что эти документы открывались в «Яндекс.Браузере» или пересылались в «Яндекс.Почте», в пресс-службе компании не ответили.
Какая информация появилась благодаря утечкам?
«Тинькофф-банк» якобы не нанимает мужчин «кавказской национальности» и геев
Несколько пользователей фейсбука обратили внимание на документ, выглядящий как инструкция для сотрудников HR-отдела «Тинькофф-банка». Из него следует, что в банке запрещают нанимать мужчин «кавказской национальности» и людей «с неславянскими ФИО», за исключением армян и дагестанцев с опытом работы в банках. «Нельзя» нанимать и кандидатов «с нетрадиционной сексуальной ориентацией», а также «представителей негроидной расы».
Утром 5 июля в «Тинькофф-банке» изданию TJ заявили, что в организации нет ни таких документов, ни ограничений при найме персонала. Сейчас документ удален. Через несколько часов компания предложила новую версию событий: «Сотрудник [банка] изготовил этот текст с неясными для нас намерениями и выложил его в интернет». В пресс-службе добавили, что автор документа продолжает работать в банке, а вопрос о дисциплинарных мерах в его отношении будет решен позже; пока ему провели «дополнительный инструктаж по ценностям» банка.
Московские чиновники якобы уже повышают явку на выборах мэра
Представители движения наблюдателей «Сонар» обнаружили гугл-документы с личными данными московских избирателей. Например, как указывается в фейсбуке «Сонара», начальница управления соцзащиты Северного административного округа Москвы Светлана Истомина 27 июня создала документ под названием «Ресурсная карта УИК», где собраны данные голосующих на дому, людей с инвалидностью и других избирателей, зависимых от соцзащиты, а также указаны ответственные за «меры по мобилизации ресурса». Активисты предполагают, что мобилизовать таким образом предполагается электорат для участия в выборах московского мэра, которые состоятся в начале сентября. Также активисты «Сонара» нашли документ со списком 23 тысяч избирателей, зарегистрированных в Восточном Дегунино. Рядом с фамилиями в таблице стоит пометка «звонить»; в некоторых ситуациях — в случае людей, которым, видимо, уже позвонили, — указано: «живет на даче», «отказ голосовать», «отказ от уч. в выборах» и прочее.
В пресс-службе Мосгоризбиркома сообщили «Медузе», что о появлении в открытом доступе персональных данных избирателей они ничего не знают и «ничего не думают». Пресс-служба правительства Москвы была недоступна для комментариев.
«Леруа Мерлен» ведет учет своих критиков
Обозреватель «Эха Москвы» Александр Плющев обнаружил гугл-таблицу, в которой ведется учет негативных комментариев, оставленных о компании «Леруа Мерлен» в связи с выступлениями ее пиар-директора Галины Паниной.
Плющев предположил, что таким образом координировалась кампания против Паниной. Позже представители «Леруа Мерлен» подтвердилидостоверность таблицы и сообщили, что сами собирали негативные комментарии, чтобы провести их «аналитику».
Екатеринбургские чиновники якобы борются с Варламовым
Блогер Илья Варламов утверждает, что нашел отчет, составленный сотрудниками администрации Екатеринбурга, в котором чиновники указывают, как ответить на негативные публикации Варламова о городе. В документе требуют подготовить репортаж от имени «местного жителя и блогера» «об удобстве парков и улиц Екатеринбурга», а также «максимально связать [произошедшее] с темой [бывшего мэра города Евгения] Ройзмана — заявить, что это очередной пример, когда глава города, выбранный не как „крепкий хозяйственник“, а как популярная политическая фигура, в итоге не способен эффективно поддерживать городское хозяйство и крупные федеральные проекты».
Сотрудница пресс-службы администрации Екатеринбурга Виктория Мкртчян сказала «Медузе», что попавший в интернет документ о минимизации последствий визита в город блогера Ильи Варламова — фейк. «Администрация Екатеринбурга не работает в Google Docs из-за требований безопасности», — добавила она.
У «троллей», возможно, есть методичка
В своем телеграм-канале Александр Плющев также опубликовал ссылку на гугл-таблицу, сопроводив ее комментарием «еще какую-то методичку прислали». В таблице три вкладки: «Путин», «Горбачев» и «Сталин»; в каждой из них приведены исторические события, случившиеся во время их правления, или общественные феномены, существовавшие в этот период. События распределены по графам «позитив для России» и «негатив для России»; также есть столбцы «аргумент» и «контраргумент». Например, к пункту «Посол России в Ливии был резко против нашего молчаливого потакания свержению Кадафи» (так в документе) приводится комментарий «Строго говоря командовал Медведев. Путин же был не согласен (по крайней мере на словах)» (так в документе). В столбце «контраргумент» по закону о запрете гей-пропаганды указано «Это все-таки хороший закон, хотя я не знаю, как он работает на практике».
Издание Znak.com предполагает, что таблица содержит в себе сценарии интернет-дискуссий, которые могут использовать люди, пишущие платные комментарии в поддержку российской власти, однако верифицировать это невозможно.