Технологии фейковых новостей: все только начинается - The Economist

В начале этого года французская певица Франсуаза Арди появилась на видео, размещенном на YouTube. Закадровый голос спросил ее, почему президент Дональд Трамп заставил своего пресс-секретаря Шона Спайсера соврать о том, сколько людей пришло на его инаугурацию.

Сначала Арди спорила. А потом сказала, что Спайсер "озвучил альтернативные факты по этому поводу". Видео выглядело странно хотя бы потому, что певице сейчас 73 года, а, комментируя инаугурацию Трампа, она выглядела на 20. Кроме того, она почему-то говорила голосом советника президента 3 Келлиэнн Конуэй.

Об этом пишет The Economist, добавляя, что видео под названием "Альтернативное лицо 1.1" создал немецкий художник Марио Клингеманн. Он взял звук из интервью Конуэй для NBC и пропустил через "уста елетронного призрака Арди". Видео не очень качественное. Компетентные эксперты по визуальным эффектам могут добиться более убедительного результата. Но Клингеманн не долго мастерил свой ролик в специальных программах. Он сделал его за несколько дней на обычном компьютере, используя алгоритм машинного самообучения - так называемую "генеративную соревновательную сеть" (GAN). Компьютер сгенерировал автоматически видео, где Арди говорит голосом Конуэй, проанализировав старые клипы французской певицы.

Эксперимент Клингеманна пролил свет на будущее поле битвы между фейком и правдой. Доверие к печатному слову уже под ударом из-за распространения так называемых фейковых новостей. Но видео и звук до сих пор заставляют многих поверить. GAN стал частью технологической волны, которая может подорвать доверие и к такой информации.

Аудио проще подделать. Сейчас компьютеры генерируют речи, связывая короткие аудиозаписи, чтобы озвучить предложение. Так говорит электронный помощник Apple Siri. Но электронные голоса такого типа ограничены количеством аудиозаписей в их памяти. Они звучат по-настоящему реалистично только тогда, когда говорят конкретными целостными фразами.

Технология же генерации звука работает иначе, используя нейронные сети для изучения статистических свойств источника звука. Затем происходит воспроизведение этих свойств в контесте, моделируя изменение вещания не просто ежесекундно, а каждую миллисекунду. Для того, чтобы заставить Трампа или любую другую публичную личность сказать конкретные вещи, достаточно просто заставить машину проанализировать записи старых речей, а потом приказать тренированному программному обеспечению говорить голосом этого человека.

Подразделение DeepMind компании Alphabet в Великобритании, Институт глубокого самообучения Baidu в Кремниевой долине и Монреальский институт алгоритмов самообучения уже опубликовали очень реалистичные алгоритмы генерации речи в прошлом году. Сейчас эти алгоритмы требуют мощности компьютеров, которые есть только у крупных технологических компаний. Но так будет не всегда.

Генерировать изображение сложнее. GAN был представлен Аяном Гудфеллоуом, когда он был еще студентом одного из "родителей" машинного самообучения Иошуа Бенджио в Монреальском институте алгоритмов самообучения. Гудфеллоу установил, что глубокое самообучение позволяет машинам хорошо различать различные типы данных (изображения кошек и собак, например). Но программы, которые пытались генерировать изображения кошек и собак, справлялись с задачей не очень хорошо. Компьютеру было сложно работать с большим количеством тренировочных изображений в базе данных, чтобы потом самому создать приличную картинку.

Гудфеллоу обратился к привычному для людей подходу - конкуренции. Вместо того, чтобы просить программу сгенерировать что-то полезное в вакууме, он добавил другую программу-соперника, чтобы искусственный интеллект мог соревноваться. Программа-соперник оценивала сгенерированное изображение и определяла, "реально" ли оно, то есть похоже ли на те, которые уже существуют в тренировочной базе данных. Пытаясь обмануть соперника, программа-генератор училась создавать изображения, которые выглядели реалистичнее, но реальными не были. Программа-соперник, зная наверняка, как выглядит подлинное изображение, создавала критерии и препятствия для той, которая генерировала изображения.

Сегодня GAN может создать небольшие изображения размером с почтовую марку, к примеру, птиц, получив лишь команду одним предложением. Можно сказать GAN: "Птица должна быть белой с черными пятнами на голове и крыльях, а ее клюв должен быть длинным и оранжевым". И программа нарисует такую птичку. Изображение будет не идеальным, но с первого взгляда оно кажется вполне реальным.

Вряд ли изображение птиц разрушат общество, но технологии развиваются быстро. За последние 5 лет программное обеспечение, основанное на схожих алгоритмах, сократило ошибки при сортировке фото с 25% до нескольких процентов. Технология генерации изображения, скорее всего, продемонстрирует такой же прогресс. Эксперт Google по самообучению машин уже добился генерации изображений вымышленных лиц с разрешением 768 пикселей, что вдвое качественнее чем все, что было до этого.

Гудфеллоу, который сейчас работает на Google Brain, считает, что сгенерированные машиной фейковые видео начнут массово появляться на YouTube уже через три года. Другие эксперты считают, что это произойдет позже. Но все соглашаются с тем, что это лишь вопрос времени.

"Думаю, искусственный интеллект внесет изменения в то, каким доказательствам мы можем доверять", - считает Гудфеллоу.

Впрочем, если технологии продуцируют новые формы артифактов, они также предлагают способы бороться с фейками. К примеру, для подтверждения фото или видео можно требовать их метаданные, то есть электронные записи, когда, где и как они были сняты. Зная эту информацию, можно отсеять фейки, обнаружив расхождения с настоящими условиями местности на указанный момент съемки.

Тем временем, президент США Дональд Трамп считает "фейками" все опросы с негативной оценкой своей деятельности.

В начале февраля были опубликованы результаты опроса CNN/ORC, согласно которым шесть из десяти жителей США не одобряют решение Трампа о строительстве стены на границе с Мексикой. При этом 53 процента респондентов не поддержали временный запрет на въезд для граждан семи страни приостановку приема беженцев.

Технологии фейковых новостей: все только начинается - The Economist

Искусственный интеллект активно учится фальсифицировать видео и звук, подрывая доверие и к такой информации.