UA / RU
Поддержать ZN.ua

Владимир Широков: "У нас есть уникальный инструмент, какого нет в мире"

О бесценном сокровище, приключениях словаря, виртуальных лексикографических лабораториях, а еще - зачем нужны лингвистические экспертизы.

Автор: Лидия Суржик

"Стать вольным и чистым, как звездное небо, Твой посох принять…" - зал затаил дыхание, а после последних аккордов взорвался многоголосым "Браво!"

В течение двухчасового концерта не покидало ощущение, что мы не в Доме ученых, а в филармонии - со сцены лились восхитительные мелодии, пленили слух романсы на музыку Владимира Широкова. Для многих пришедших на благотворительный вечер романса стало неожиданным открытием: автор музыки - не профессиональный композитор, а ученый, академик НАН Украины, директор Украинского языково-информационного фонда (УЯИФ).

Владимир Широков представил слушателям прекрасный сборник музыкальных произведений - вокальный цикл с символическим названием "Мой серебряный век…" В исполнении солиста Национальной оперы и Национальной филармонии Украины, лауреата Международного конкурса вокалистов им. Бориса Гмыри Андрея Маслакова прозвучали романсы на слова Александра Блока и Николая Гумилева. В целом в сборник вошли 24 романса на слова поэтов "Серебряного века" и зарубежных авторов. Владимир Широков - ценитель высокой философской поэзии, его музыка то романтически-возвышенная, то экспрессивно-драматичная, то романсово-мелодичная, то раскатистая, ибо "целый вечер в саду рокотал соловей…"

После замечательного концерта, где царила гармония слова, музыки и исполнительского мастерства диссонансы нашего бытия как-то особенно "режут слух". Впрочем, о них позже. Наша беседа с Владимиром Широковым началась с ознакомления с сокровищами. В самом деле, сокровищами - бесчисленными, неоценимыми.

- Владимир Анатольевич, в названии вашего научного учреждения есть слово "фонд"…

- Как для научного учреждения, название несколько непривычное, и мне даже приходится объяснять, что мы не имеем никакого отношения к финансовым фондам. Есть разные фонды, в частности библиотечные. А наш фонд - языково-информационный. В его названии объединяются два величественных понятия - язык и информация.

Рассматривать язык как информационную систему - основа нашего научного подхода. На этом базируются наши научные исследования, наша фундаментальная наука и наши прикладные применения.

УЯИФ был создан в 1991 году по моей инициативе, путем реорганизации подразделений двух академических учреждений - Института языкознания имени А.Потебни и Отделения научной информации Института математики. Со мной это дело двигала Мария Михайловна Пещак (к сожалению, уже покойная). И с первых же дней к нам приобщилась Лариса Леонидовна Шевченко - ныне заведующая отделом лингвистики. Отдел информатики со временем возглавил Максим Викторович Надутенко.

Язык мы изучаем как информационную систему. А поскольку подавляющий объем информации во Всемирной сети функционирует в естественно-языковой форме, язык в наше время превратился в основной технологический инструмент, обеспечивающий взаимодействие человека с Сетью и человека с человеком через Сеть. Каждое государство ради своего самосохранения и развития в условиях жесткой сетево-информационной конкуренции должно позаботиться о том, чтобы его язык был достойно представлен в Сети. Украина также должна создавать и развивать собственную высокотехнологичную национальную систему лингвистических ресурсов. Над этой фундаментальной задачей мы и работаем, а прикладные применения наших исследований концентрируются в создании систем интеллектуальной обработки естественного языка, электронных и традиционных словарей…

- …которыми мы также ежедневно пользуемся. Их информационный и тематический диапазон за годы независимости заметно расширился.

- Ваш покорный слуга является основателем серии украинских словарей нового поколения, которая так и называется: "Словники України". Первый из них - Орфографический словарь украинского языка - издан в 1994 году совместно с Тамарой Петровной Гуменюк (издательство "Довіра"). В этой серии уже почти 80 изданий, причем около двух десятков - электронные.

Электронный словарь - его полное название "Интегрированная лексикографическая система "Словники України", - без преувеличения, уникальный. Если распечатать его на бумаге, получится более 120 тыс. страниц текста, то есть 120 томов по тысяче страниц. Такого ни у кого нет. Когда мы это сделали (2001 г.) и выставили в Интернет - в первую же ночь "Майкрософт" снял у нас 800 Мбайт информации. Через некоторое время я увидел на рынке "Петровка" пиратские копии нашего словаря.

Электронным ресурсом "Словники України" онлайн (есть на нашем сайте) пользуется весь мир. Он в свободном доступе, каждый день к нему обращаются свыше 40 тысяч пользователей.

- Какова судьба Словаря украинского языка в 20 томах?

- Как вы знаете, 11-томный Толковый словарь украинского языка был издан в 70-е годы прошлого века. На то время он считался вершиной украинской лексикографии. Но жизнь стремительно меняется, и мы с академиком В.Русанивским и уже упомянутой М.Пещак начали проект нового фундаментального толкового словаря.

Толковый словарь украинского языка в 20 томах - принципиально новая работа. Для этого мы разработали специальную компьютерную технологию - виртуальную лексикографическую лабораторию "Словник української мови".

- В чем отличие нового толкового словаря в сравнении с 11-томником?

- Отличие очень существенное. Прежде всего, разработана теория словаря, так называемая теория лексикографических систем. С ее помощью можно формализовать лексикографические структуры языка. В детали сейчас не буду вдаваться - это вещи сугубо профессиональные. Сначала была построена формальная модель словаря. Сразу отмечу: мы использовали и достояние, которое было в 11-томнике, переведя его в лексикографическую базу данных. Теперь есть такая система, с помощью которой наши лексикографы работают дистанционно: будучи дома или в любом месте земного шара, они могут писать словарные статьи, общаться между собой и т.п. Система устроена так, что к любому элементу лексикограф имеет прямой доступ.

- Словарь увеличился почти вдвое. За счет чего - новых терминов и слов - расширилось их толкование?

- Поскольку "нове життя нового прагне слова", то, конечно, многое добавилось, а от чего-то пришлось избавиться. В частности, очиститься от марксистско-ленинской риторики (в основном это был иллюстративный материал из решений КПСС, цитат из произведений классиков марксизма-ленинизма). В 20-томнике взят курс на то, чтобы шире иллюстрировать языковые единицы и явления (т.н. иллюстративная зона), но за счет аутентичных источников украинского языка. Объем лексикографической обработки возрос тоже приблизительно вдвое. Поскольку полнее описывается семантика. Очень заметно увеличилась т.н. заромбовая зона - система фразеологизмов, устойчивых словосочетаний, терминологизмов. И значительно расширилась иллюстративная зона - все без исключения семантические эффекты проиллюстрированы. Конечно, больше стало словарных статей, расширились значения, появились новые терминологические словосочетания. Возьмем для примера слово "нано". В 11-томнике его вообще не было, а в базе данных 20-томного словаря находим около сотни терминов с этим словом.

В 11-томном насчитывалось около 134 тыс. слов (словарных статей). В 20-томном - приблизительно 200 тыс. И это еще не вся языковая сокровищница. У нас есть базовый электронный Грамматический словарь украинского языка (тоже в форме виртуальной лексикографической лаборатории), где в реестре представлено свыше 576 тыс. лексических единиц. И это еще далеко не все. По оценкам академика Д.Гродзинского, который был главой комитета по научной терминологии НАНУ, общее количество только терминологических единиц достигает 50 млн. Это просто необъятное количество, им практически невозможно пользоваться без современного технологического инструментария. Мы в фонде разработали контуры компьютерной лингвистической технологии, позволяющей практически в автоматическом режиме построить почти всю мировую терминосистему. И фактически это начало того, что я называю системой национальных лингвистических ресурсов Украины.

- Можете вкратце описать, что она собой представляет?

- Традиционно считается, что язык - это предмет языкознания. С развитием информационного общества язык превратился, как я уже заметил, в технологию, технологический инструмент, и от того, насколько компьютерно-сетевая информационная система "понимает" язык, зависит ее, то есть системы, эффективность. А что нужно для того, чтобы она оперировала языком так, как это делает человек? Для этого нужны лингвистические ресурсы. Прежде всего электронные словари разных типов. Не только слов, но и словосочетаний, фразеологизмов, терминологических словосочетаний. Есть даже словари, оперирующие вербально невыраженными структурами - например словари синтаксических структур и др. В украинском языке довольно развитое словоизменение, уже построено около трех тысяч словоизменительных классов. И все это у нас формально описано, кодифицировано, написана программа, делающая это автоматически. Когда программа найдет текстовое слово, она должна найти, к какому классу оно принадлежит, восстановить его семантику, то есть значение, и т.д. Все это вместе представляет систему лингвистических ресурсов. Ни для одного языка мира в таком полном виде, как это удалось сделать нам, система лингвистических ресурсов не построена. У нас есть уникальный инструмент, какого нет нигде в мире. Его название - "Виртуальная лексикографическая лаборатория "Словники української мови".

Такую же систему мы можем создать и для других языков. У нас уже есть несколько десятков различных виртуальных лингвистических лабораторий.

Для этого, безусловно, нужны мощные ресурсы и корпусные технологии обработки языка.

В УЯИФ создан первый в Украине лингвистический корпус (ЛК). Его объем - свыше 170 млн словоупотреблений. ЛК - это современная экспериментальная база для проведения фундаментальных языковедческих исследований и составления лексикографических работ нового поколения. С помощью ЛК уже создан ряд лексикографических работ в серии "Словари Украины", выполнено множество лингвистических исследований.

- Вышло только несколько томов толкового словаря украинского языка. Какова перспектива выхода других, или считается, что этот вопрос несвоевременный?

- Вышло шесть томов. Первый был издан в 2010 году. С тех пор ежегодно издавали по одном тому. Седьмой должен был выйти в конце прошлого года. Остальные тома также есть в базе данных, надо только отредактировать и издать. Но нет средств. Денег, которые нам выделяют, хватает только на один том в год. Да и то тиражом в тысячу экземпляров.

Кстати, 11-томник было издано тиражом 30 тыс. экземпляров. И это при тоталитарном режиме. Весь Институт языкознания (двести человек) работал над этим словарем. А у нас всего 15 лексикографов. А еще ведь есть государственный заказ, который мы выполняем, другая научная тематика. Для того чтобы делать такие лингвистические ресурсы, надо располагать соответствующей структурой. Над аналогичным словарем английского языка - третьим изданием Oxford English Dictionary - работают 80 групп лексикографов, и в каждой до 10 человек.

Между прочим, замечу, что в 2004 году решением правительства Национальная словарная база Украинского языково-информационного фонда была внесена в Государственный реестр научных объектов, представляющих национальное достояние Украины. А среди этих объектов 20-томный словарь - объект номер один. Это больше, чем научная ценность, это один из символов государства. Равно как Государственный Гимн, Герб, Флаг Украины.

- А почему не издан седьмой том?

- Согласно государственному заказу, он должен был выйти в прошлом году. Мы, как полагается, объявили тендер на печать, по действующему законодательству в системе "Прозоро" были проведены торги. Победителем тендера определили ГП "Розвиток" МВД Украины, с которым был заключен договор на печать седьмого тома тиражом 1000 экземпляров. 2 декабря 2016 года УЯИФ перечислил ГП "Розвиток" средства и даже передал ему готовый оригинал-макет. Исполнитель должен был до конца декабря прошлого года отпечатать тираж седьмого тома словаря, но нам были переданы только три сигнальных экземпляра. А дальше все затормозилось. Неоднократно я обращался к и. о. директора ГП "Розвиток" Ю.Галалу, но конкретного ответа не получил. Тогда я написал официальное письмо этому и. о. директора. В ответ он прислал гарантийное письмо, в котором заверил, что тираж будет готов до 07.03.2017. Но тиража и до сих пор нет. Тогда я обратился с письмом к министру А.Авакову, но получил какой-то непонятный ответ. Об этой постыдной истории я рассказал в интервью телеканалу "Рада", но ничего не изменилось. Неужели в суд подавать?

Сколько у нас шума вокруг государственного языка!.. Ведь бюрократическими средствами языковые проблемы не решить. Сколько бы законов ни придумывали… А ведь все просто: должны быть все инструменты его применения - компьютерные, бумажные, сделанные на высшем уровне, и чтобы это было доступно пользователям.

В нашем заделе много разных словарей. Толковый словарь русского языка, турецкого, сейчас готовим словарь испанского языка (как виртуальную лексикографическую лабораторию). Этимологический словарь украинского языка - вообще уникален, он создан в Институте языкознания имени А.Потебни. (Этимология - раздел лингвистики, изучающий происхождение слов языка.) Знаете, на сколько языков по этому словарю имеет выход украинский? Более чем на 250. И это удалось установить только благодаря тому, что в фонде была создана виртуальная лексикографическая лаборатория "Етимологічний словник української мови". Благодаря ее использованию был построен полный индекс по всем языкам, которые есть в этом словаре. Таков наш язык - широкий, разкидистый... К сожалению, последний, седьмой том словаря, а именно - индекс по всем языкам, лежит уже около трех лет - у академии нет средств на издание. Если бы удалось издать седьмой том, был бы завершен чрезвычайно важный для Украины проект.

- УЯИФ проводит логико-лингвистическую экспертизу. Кто обращается по поводу такой экспертизы и с какой целью?

- Разные организации и государственные учреждения. В свое время мы проводили экспертизу Налогового кодекса. Это был огромный по объему материал (свыше 800 страниц) - 18 разделов и 18 групп авторов. И мы с каждой из этих групп работали. Сначала они относились к нам несколько пренебрежительно, дескать, да что те лингвисты… Но когда мы показали результаты экспертизы и они увидели свои огрехи, то очень нас благодарили. Особенно много путаницы было в терминологии. Сейчас мы работаем над экспертизой документов по заказу Генеральной прокуратуры Украины.

Проводили лингвистическую экспертизу программ украинских политических партий, представленных в украинском парламенте (2004 г.). Результаты этого исследования оказались весьма интересными и убедительно показали, что все программы отдают преимущество сугубо политическим вопросам и значительно меньше внимания насущным потребностям граждан и социальных сообществ.

Лингвистические экспертизы - одно из направлений деятельности УЯИФ (и это записано в его уставе). Почти никто в Украине, кроме нашего научного учреждения, не занимается теорией этого вопроса. У нас уже опубликовано свыше полусотни научных работ, разработана методика и методология, определено программное обеспечение. Часть работ мы можем выполнять в автоматизированном режиме, особенно когда речь идет о двух текстах, которые надо сравнить между собой по тем или иным параметрам.

Уже полтора десятка лет слышим разговоры о том, что нужно делать систему логико-лингвистической экспертизы нашего законодательства. Если бы при разработке законопроектов была задействована наша система (а это несложно, поскольку ее системотехника изначально ориентирована на функционирование в Интернете) или обратились к нашим специалистам, то не было бы лингвистических некорректностей и терминологических "ляпов", которые нередко случаются в документах. Если мы создадим систему логико-лингвистической экспертизы правовых актов, то повысим уровень нашей правовой культуры.

- Напоследок вопрос "не по сути". Вы пишете музыку - это ваше хобби? И почему вам полюбился именно романс - этот подзабытый жанр?

- Разумеется, это хобби. Я не придаю ему очень большого значения и не считаю себя выдающимся композитором. Но мелодии в моей голове "вертятся" с самого детства. В последнее время, когда появилась возможность записать их на ноты и организовать исполнение со сцены, я увидел, что они нравятся людям. Особое впечатление на публику произвело исполнение в прошлом году трех моих романсов нашим славным певцом, народным артистом Украины Тарасом Штондой. В конце концов, романс или песня, - это самый простой жанр, поэтому я, как любитель, избрал именно его. Опер или симфоний я не имею наглости писать. Однако некоторые из моих произведений уже не просто романсы. Например, в прошлом году по просьбе нашего известного дуэта сестер Людмилы и Галины Турчак я написал две песни на слова Григория Сковороды. Они были исполнены со сцены и понравились публике. Сейчас, насколько мне известно, их взял в свой репертуар Киевский мужской камерный хор имени Л.Ревуцкого. Они сделали адаптацию для хора, и, надеюсь, в скором времени мы услышим эти произведения в хоровом исполнении. Для меня это большая честь.