Марк Шмулевич: Приватность в эпоху Big Data? Забудьте!
Марк Шмулевич, заместитель министра связи и массовых коммуникаций Российской Федерации - о том, как будут меняться представления о приватности в Интернете в эпоху Big Datа.
Анализ больших объемов данных, Big Data, — главный технологический тренд ближайших десяти лет. При этом все, что связано с технологиями больших данных, до сих пор порождает больше вопросов, чем ответов.
Одно из определений Big Data гласит, что это «данные настолько большого объема, что их невозможно обработать и проанализировать обычными средствами за разумное время». Если принять это определение, сразу возникает вопрос: будет ли технология Big Data волновать умы людей так же, как сейчас, еще долгое время, или эта технология станет обыденной уже через десять лет и Big Data больше не будет, потому что все данные будут большими. Одно несомненно: технологии Big Data принесут огромную пользу человеку.
В первую очередь большие данные повысят эффективность бизнеса. Есть расчеты, что повышение продаж компаний, использующих Big Data, обеспечит увеличение налоговых поступлений в госбюджет до 3% в ближайшие десять лет. Это означает, что государство крайне заинтересовано в Big Data. Это и новые рабочие места, и поддержка принятия решений для самого государства. Принимать важные для страны решения без анализа больших данных будет не просто трудно, но и практически невозможно уже очень скоро. В октябре 2013 г. утверждена Стратегия развития отрасли ИТ, и в ней перечислены направления, для развития которых государство должно фокусировать все имеющиеся ресурсы на R&D (а не распределять равномерно). Иными словами, это приоритеты. Направление «обработка больших данных» стоит в этом перечне на первом месте! При этом у государства не так много задач для развития Big Data.
Во‑первых, это обучение специалистов — аналитиков больших данных (Data Scientist) и других, которых сегодня неоткуда взять, потому что их не готовят вузы (или мало готовят). Второе — не только дать возможность бизнесу использовать большие данные, но и применять их для госуправления. Третье — это исследования.
Но самый важный вопрос, обращенный к государству в связи с Big Data, — как оно, государство, будет обеспечивать защиту персональных данных, безопасность информации, используемых властью, бизнесом, гражданами? Именно это становится важнейшей темой при обсуждении перспектив Big Data не только для бизнеса, но и для всех людей в целом.
Вопрос о защите персональных данных гораздо глубже, чем это может показаться. Думая о том, что и как защищать, нужно понять, а какой вообще смысл будет иметь эта защита в будущем. Посмотрите на самих людей. На самом деле люди сегодня, и прежде всего молодежь, вообще не склонны беспокоиться о своей privacy. Например, если вы зайдете на любой фото‑хостинг — Flickr, Яндекс‑Фото — и случайным образом отберете достаточно большую выборку фотографий, то вы увидите, что лишь несколько процентов людей хоть как‑то повышают приватность своих фотографий, например скрывают EXIF‑данные снимка, место, дату фотографирования. Люди даже не задумываются о том, что эта информация может иметь значение. Примерно треть фотографий имеет GPS‑метку положения. А от 30 до 50% фото с меткой положения такого качества, что легко можно распознать лица и фигуры людей, случайно попавших в кадр. Значительная часть фотографий, примерно 1/5, свободно выложенные на популярных фотохостингах, потенциально могут принести вред другим людям, которые не только об этом не подозревают, но и ничего не смогут с этим сделать. Это маленький пример сегодняшнего дня. А ведь объем данных в Интернете, включающих персональную информацию, находится в фазе бурного роста, таких данных будет все больше и больше.
Это говорит о том, что научно‑технический прогресс остановить не только сложно, но и невозможно. Очень много шансов, что через 10‑15 лет люди просто будут по‑другому думать о проблеме приватности. Потому что невозможно уйти от того, что огромная часть информации о нас с вами, которая сегодня считается личной, завтра перестанет считаться таковой. Она будет всюду, и все будут знать об этом.
Государство, с одной стороны, должно по закону обеспечивать защиту персональных данных — в рамках существующих подходов. Но в перспективе пятнадцати лет становится очевидным, что эти подходы к тому времени не будут работать. А поскольку темпы развития в ИТ ускоряются, то вполне может статься, что то будущее, которое мы планируем через пятнадцать лет, может наступить уже лет через семь. Одно можно сказать с большой долей уверенности: уже в ближайшее время Big Data изменит наши сегодняшние представления о приватности.
Колонка подготовлена на основе выступления на форуме «Открытые инновации‑2013»