М омент, когда компьютер
сравняется по своему интеллекту с человеком, может быть зафиксирован при помощи критерия, предложенного полвека назад известным английским математиком и создателем теории вычислительных машин Алланом Тюрингом. Критерий этот предельно прост: если в течение 15 минут разговора с компьютером собеседник не сможет определить, кто с ним общался - человек или машина, компьютер может быть признан мыслящим.
Понятно, что это испытание требует от компьютера прежде всего способности воспринимать информацию. Она передается определенными сигналами - световыми или звуковыми. И вопрос о расшифровке этих сигналов и их осмысливании машиной является одним из наиболее сложных.
В области анализа информации, передаваемой световыми импульсами, сейчас достигнуты значительные успехи. Так израильская фирма «Висконт технолоджи» создала устройство размером с авторучку, позволяющее сканировать текст и передавать его в компьютер, который затем осуществляет быстрый перевод с одного языка на другой. (Появление новинки в магазинах ожидается в ближайшее время.)
Преимущества новой системы по сравнению с существующими электронными словарями, в которых каждое слово приходится набирать, как на пишущей машинке, - бесспорны.
Созданное оптическое устройство, по-видимому, принципиально может быть использовано и для письменного общения с компьютером. Однако хотя оно и позволяет достаточно быстро сделать перевод готового текста, свободная «беседа» с компьютером потребует значительно большего времени, ибо каждое слово собеседника должно будет печататься. Поэтому не вызывает сомнения, что предпочтение во многих случаях будет отдано звуковой информации, поступающей в виде обычной речи. Однако на этом пути ученые сталкиваются с серьезными трудностями.
Р аспознавание речи долгое
время пытались осуществить на основе компьютерного анализа потока звуков, трансформированных в цифровой код. Одним из препятствий стала банальная причина - человеческая речь далеко не всегда отчетлива, логична и, как правило, изобилует ошибками. Это серьезно затрудняет надежное опознание. Недавно проблема была наконец решена группой исследователей британского Восточного университета, работающих под руководством д-ра Эндрю Бангама. Ученый предложил довольно простой и остроумный метод: собеседование с компьютером проводится с помощью обычной речи, но в машину она поступает не в форме звуков, а в виде оптических сигналов (с учетом их положительных качеств, проверенных практикой). Дело в тем, что, как выяснили специалисты, звуки лишь на 60 проц. осуществляют процесс коммуникации. Остальные данные «сообщают» жесты, движения всего тела и, главным образом, движения губ, что и позволяет общаться немым. Для получения нефонетической информации устройство Бангама снабжено миниатюрными телекамерами. Они фиксируют изображения движущихся губ, которые компьютер сравнивает с фонемами человеческой речи.
Мимические образцы, используемые для сравнения, предварительно записываются в память машины. Их число огромно: в момент, когда человек произносит конкретный звук или слово, мускулы его лица делают сотни мелких движений. Поэтому группа доктора Бангама значительное время уделяет обучению компьютера воспринимать и расшифровывать секреты разговорной мимики. В настоящее время компьютер уже способен распознавать числа и некоторые слова, произносимые разными людьми.
А налогичные работы про-
водились и в Шеффилдском университете, где была создана программа «Конверс». Она способна при собеседовании давать вполне удовлетворительные ответы и ставить разумные вопросы. Однако испытания системы на основе критерия Тюринга показали, что она далека от совершенства.
Ее собеседнику достаточно было семи минут, чтобы догадаться: с ним говорит компьютер.
Д-р Бангам, однако, полон оптимизма.
Он планирует разработать комплексную систему, способную вести осмысленный диалог с человеком, к 2001 году.