Искусственные нейронные сети: технология будущего или орудие обмана?

В последнее время в интернете все чаще можно встретить «интересные» видео, на которых лица известных личностей наложены на видеоряды разного характера. Например, существует видео, на котором Илон Маск поет песню «Земля в иллюминаторе». Но можно обнаружить и более откровенные материалы, способные, например, скомпрометировать знаменитостей: порой довольно трудно определить, что подобное видео – подделка. Такие видеоматериалы создаются программистами и простыми пользователями с помощью искусственных нейронных сетей.

Что такое нейронная сеть?
Искусственная нейронная сеть (или ИНС) – способ машинного обучения, при котором, тренируясь на заданных примерах, компьютер может выполнять необходимые пользователю задачи. Например, в ИНС можно загрузить изображения нескольких тысяч реальных пользователей интернета, и на их основе система сможет создавать фото никогда не существовавших людей. Эти портреты будут как бы собраны из кусочков изображений, которые пользователь дал сети для тренировки.

Помимо фотографий, нейронные сети могут работать и с видеоматериалами. Так, для создания рекламного ролика «Сбера» программисты загрузили в ИНС видеофрагменты с Жоржем Милославским, а нейронная сеть разбила видео на отдельные кадры, выделила на них лицо Милославского и подставила его на заранее отснятый видеоряд.

Принцип работы ИНС похож на то, как функционирует человеческий мозг. Мозг состоит из нейронных сетей, которые, в свою очередь, состоят из нескольких тысяч узлов, связанных между собой. Эти узлы необходимы для последовательной передачи информации, и именно благодаря ним функционирует нервная система человека.

ИНС тоже состоит из узлов, расположенных на разных уровнях. Каждый из узлов может быть связан с несколькими узлами предыдущего или последующего уровня. Поток данных постепенно переходит с верхнего уровня узлов на нижний, пока сеть не решит, что данные можно направить пользователю для получения запрашиваемого результата.

Как ИНС может самостоятельно решить, готово изображение или нет? Дело в том, что каждый последующий узел присваивает предыдущему уровню определенный вес. В процессе работы новый узел получает от предыдущего набор чисел и умножает их на присвоенный вес. Если вес выше установленного максимального значения, ИНС выводит данные пользователю, а если ниже – направляет их на следующий уровень. Изначально максимальные значения устанавливаются случайным образом, а затем меняются в процессе тренировки, пока пользователь не останется доволен результатом.

Так, при подстановке лица героя одного видеоролика в другое заданное видео, ИНС сначала разложит оба видео на отдельные кадры, выделит на них область, на которой находится лицо, и начнет отправлять информацию на обрабатывающие узлы.

Из-за того, что в начале работы значения выставляются произвольно, качество изображения после первых нескольких запусков будет крайне низким. Но затем, когда нейронная сеть начнет совмещать все больше кадров, изображение будет становиться четче, и в итоге получится неплохой и вполне правдоподобный ролик.

Создание и тренировка нейронной сети — трудоемкий и долгий процесс. Дмитрий Неклюдов, генеральный директор компании «КодЛикс», занимающейся созданием искусственных нейронных сетей, отмечает, что на разработку ИНС обычно уходит от двух месяцев до полугода. При этом сам заказ «может выполняться значительно дольше, потому что “голая” нейросеть никому не нужна. Как правило, требуется [еще] инфраструктура, а иногда разработка нейросети выливается в работу, где разработка самой нейросети занимает не более 10% трудозатрат». Неклюдов поясняет, что большую часть времени программист занимается не разработкой, а тренировкой ИНС, чтобы повысить ее качество.

Когда появились первые нейросети?
Впервые технологию искусственной нейронной сети предложили Уоррен Маккалоу и Уолтер Питтс в качестве исследования для Чикагского университета. В предложенных исследователями нейронных сетях были только блоки ввода и вывода информации, а слои как таковые отсутствовали, что сильно ограничивало область применения технологии. Эти сети выполняли только вычислительные операции, не требующие глубокого послойного анализа: пользователь задавал исходные значения и условие задачи, а нейронная сеть сразу же выводила результат. Они были скорее моделью того, как человеческий мозг обрабатывает информацию, чем системой, работающей с большими потоками информации.

В 1957 году появился так называемый «Перцептрон» — ИНС, состоявшая из одного слоя. К 1980 году ученые научились модифицировать и настраивать пороговые значения и веса нейронных сетей, но сам процесс обработки информации все еще вызывал много вопросов. Оставалось неясным, как нейросеть вычленяет полезную информацию и впоследствии собирает ее для формирования изображений различных объектов, машин, чашек, домов и лиц людей.

Как компьютерные игры повлияли на развитие технологии ИНС?
Своим дальнейшим развитием нейросети обязаны индустрии компьютерных игр. Для работы графической составляющей игры, то есть для воспроизведения «картинки», необходимо мощное программное обеспечение. Решением этой проблемы стал графический процессор — чип, состоящий из множества ядер. Такой процессор оказался идеален для поддержания работы ИНС. Благодаря этой технологии ученым за несколько лет удалось создать нейронные сети, состоящие из десятков слоев. А чем больше слоев, тем проще отследить поток информации и понять, по какому принципу нейросеть его обрабатывает. Именно благодаря мощности графического процессора и появился термин «глубинное обучение», лежащий в основе работы современных ИНС.

С того момента, как графический процессор стал использоваться в работе ИНС, компании стали применять нейросети для решения различных задач. По мнению Дмитрия Неклюдова, технология ИНС востребована по нескольким причинам: «С одной стороны, из-за ее эффективности: нейросети позволяют решать широкий спектр задач, особенно в направлении классификации [распознавания]. С другой стороны, можно решать задачи с помощью готовых доступных архитектур, без существенных трудозатрат и квалификации. Проще говоря, это обеспечивает доступность на начальном уровне. Хотя, конечно, в этом случае продукту очень далеко до приемлемого результата, но он все равно как-то работает, к тому же это все равно нейросеть! При этом [сыграла роль] популярность [технологии], широкое освещение в СМИ, «мода». Это все зачастую приводит к тому, что нейросети пытаются применять там, где они совершенно неэффективны».

Для чего сегодня используют нейросети?
В современном мире нейросети лежат в основе большинства систем распознавания лица, речи и изображений. Например, при использовании голосового набора на смартфоне нейросеть разбивает запись голоса на отдельные слова, обрабатывает их и выводит в виде печатного текста.

ИНС применяются в системах распознавания и классификации объектов на изображениях, в голосовых интерфейсах, системах мониторинга качества обслуживания в колл-центрах, системах видеоаналитики, для работы ботов-консультантов технической поддержки и много где еще. По словам Неклюдова, в его фирму чаще всего обращаются производители оборудования, станков, производственных линий, рекламные агентства для создания электронных примерочных или конечный бизнес для решения своих локальных задач.

Популярность ИНС среди прочих алгоритмов Дмитрий Неклюдов объясняет тем, что «для подготовки обучающей выборки не требуются квалифицированные кадры, нет вероятности “упустить необходимую ветвь алгоритма”. Если сеть не достигает требуемых показателей, то происходит уточнение и увеличение обучающей выборки, возможно корректировка архитектуры, но упустить логическую ветвь просто невозможно, в отличие от “точных алгоритмов”».

В чем подвох нейросетей?
С помощью нейронных сетей можно создавать так называемые дипфейки (от «deep learning» — «глубинное обучение» и «fake» — «ложный, поддельный»). Хотя, по мнению Неклюдова, для создания качественного продукта нужен некоторый опыт работы программиста, сделать простой дипфейк и использовать его в корыстных целях может обычный пользователь, прочитав незамысловатый гайд в интернете.

Дипфейки могут использоваться для внедрения в компанию под видом работника предприятия, обхода голосовых систем идентификации, шантажа и вымогательства. Так, в прошлом году издание The Wall Street Journal сообщило, что у «неназванной британской энергетической фирмы» похитили около 200 тысяч евро. Злоумышленники идеально сымитировали голос руководителя компании и запросили немедленный денежный перевод, который директор и осуществил без малейших колебаний. И этот случай далеко не единственный: вымогательства с помощью фейкового голосового запроса часто становятся причиной крупных краж.

Помимо имитации голоса, мошенники могут использовать компрометирующие фотографии, чтобы шантажировать жертву. Однако этому можно противостоять: нейросети не могут воссоздать особые приметы человека, родинки или шрамы, и доказать то, что фотография — фейк, не составит труда, считает эксперт.

В условиях существования ИНС правоохранительные органы по всему миру тоже не сидят на месте, и уже сейчас существуют определенные меры безопасности для защиты от подобных атак.

Как обезопасить себя от дипфейков?
Проблему использования дипфейков во вред уже рассматривают на законодательном уровне. В американском штате Калифорния приняли два закона по ограничению использования ИНС: закон AB-602 запретил использование технологий синтеза изображений человека для создания порнографического контента без согласия изображаемых, а AB-730 — подделку изображений кандидатов на государственные посты в течение 60 дней перед выборами.

В борьбу с неправомерным использованием нейронных сетей включились и компании по обеспечению кибербезопасности. Так, их сотрудники встраивают в информационный поток особые хеши, по принципу работы напоминающие водяные знаки на фотографиях. В случае изменения видео с помощью ИНС, хеши тоже изменятся и исказят изображение.

Другой способ — использование особой маркирующей программы, которая помечает пакеты пикселей. При взаимодействии с помеченными изображениями работа нейросети замедляется, а качество итогового продукта становится низким, что повышает шанс обнаружения подделки.

Но защититься от злоумышленников можно не только с помощью сложных программ. Для того, чтобы обезопасить себя и свою семью от возможных атак с использованием ИНС, Лаборатория Касперского предлагает:

Рассказать своим коллегам и родственникам о том, как устроены дипфейки, почему они могут быть опасны и как их распознать;
Пользоваться достоверными источниками информации.
Соблюдать основы безопасности в интернете и следовать правилу «доверяй, но проверяй». Критический подход к голосовой почте и видеозвонкам еще не гарантирует, что вас не обманут, но поможет избежать многих ловушек.
Напомним также базовые правила кибербезопасности:

1. Регулярное резервное копирование защитит ваши данные от программ-шифровальщиков и поможет восстановить поврежденные файлы.

2. Используйте разные надежные пароли для разных учетных записей – если какая-то одна сеть или служба окажется взломана, это поможет избежать хака всех остальных. Например, если кто-то сумеет похитить вашу учетную запись Facebook, он, по крайней мере, не получит доступ и ко всем остальным вашим аккаунтам.

3. Чтобы защитить от киберугроз свою домашнюю сеть, ноутбук и смартфон, используйте надежный антивирус.