UA / RU
Підтримати ZN.ua

Володимир Широков: "Ми маємо унікальний інструмент, якого немає в світі"

Про безцінний скарб, пригоди словника, віртуальні лексикографічні лабораторії та навіщо потрібні лінгвістичні експертизи.

Автор: Лідія Суржик

"Стать вольным и чистым, как звёздное небо, Твой посох принять…" - зал затамував подих, а після останніх акордів вибухнув багатоголосим "Браво!".

Упродовж двогодинного концерту не полишало відчуття, що ми не в Будинку вчених, а в філармонії - зі сцени линули чарівливі мелодії, полонили слух романси на музику Володимира Широкова. Для багатьох із тих, хто прийшов на благодійний вечір романсу, стало несподіваним відкриттям: автор музики - не професійний композитор, а вчений, академік НАН України, директор Українського мовно-інформаційного фонду (УМІФ). Навіть деякі працівники цієї наукової установи не здогадувалися про таку грань таланту свого багаторічного керівника.

Володимир Широков презентував шанувальникам прекрасного збірку музичних творів - вокальний цикл із символічною назвою "Мой серебряный век…" У виконанні соліста Національної опери і Національної філармонії України лауреата Міжнародного конкурсу вокалістів ім. Бориса Гмирі Андрія Маслакова прозвучали романси на слова Олександра Блока і Миколи Гумільова. Загалом до збірки ввійшли 24 романси на слова поетів "срібної доби" та іноземних авторів. Володимир Широков - поціновувач високої філософської поезії, його музика то романтично-піднесена, то експресивно-драматична, то романсово-мелодійна, то розкотиста, бо "целый вечер в саду рокотал соловей…"

Після чудового концерту, де панувала гармонія слова, музики й виконавської майстерності, дисонанси нашого буття якось особливо "ріжуть слух". Втім, про них згодом. Наша розмова з Володимиром Широковим почалася з ознайомлення зі скарбами. Таки справді скарбами - незліченними, неоціненними.

- Володимире Анатолійовичу, у назві вашої наукової установи є слово "фонд". Декому це видається дивним.

- Як для наукової установи назва трохи незвична, і мені часто доводиться пояснювати, що ми не маємо ніякого стосунку до фінансових фондів. Є різні фонди, зокрема бібліотечні. А наш фонд - мовно-інформаційний. У його назві поєднуються два величні поняття - мова й інформація.

Розглядати мову як інформаційну систему - це основа нашого наукового підходу. На цьому базуються наші наукові дослідження, наша фундаментальна наука і наші прикладні застосування.

УМІФ створено 1991 року за моєї ініціативи шляхом реорганізації підрозділів двох академічних установ - Інституту мовознавства імені О.Потебні та відділення наукової інформації Інституту математики. Зі мною цю справу рухала Марія Михайлівна Пещак (на жаль, уже покійна). І з перших же днів до нас долучилася Лариса Леонідівна Шевченко - нині завідувачка відділу лінгвістики. Відділ інформатики згодом очолив Максим Вікторович Надутенко.

Мову ми вивчаємо як інформаційну систему. А оскільки переважний обсяг інформації у Всесвітній мережі функціонує у природно-мовній формі, мова в наш час перетворилася на основний технологічний інструмент, що забезпечує взаємодію людини з Мережею та людини з людиною через Мережу. Кожна держава задля свого самозбереження й розвитку в умовах жорсткої мережево-інформаційної конкуренції повинна подбати про те, щоб її мова була гідно представлена в Мережі. Україна також повинна створювати і розвивати власну високотехнологічну Національну систему лінгвістичних ресурсів. Над цим фундаментальним завданням ми й працюємо, а прикладні застосування наших досліджень концентруються у створенні систем інтелектуального опрацювання природної мови, електронних і традиційних словників…

- …якими ми також щодня користуємося. Їх інформаційний і тематичний діапазон за роки незалежності помітно розширився.

- Ваш покірний слуга є, так би мовити, фундатором серії українських словників нового покоління, яка так і називається "Словники України". Перший з них - Орфографічний словник української мови - видано 1994 року спільно з Тамарою Петрівною Гуменюк (видавництво "Довіра"). У цій серії вже майже 80 видань, причому близько двох десятків - електронні.

Електронний словник - його повна назва "Інтегрована лексикографічна система "Словники України", без перебільшення, унікальний. Якщо роздрукувати його на папері, то вийде понад 120 тис. сторінок тексту, тобто 120 томів по тисячі сторінок. Такого ні в кого немає. Коли ми це зробили (2001 р.) і виставили в Інтернет - першої ж ночі "Майкрософт" зняв у нас 800 Мбайт інформації. Через якийсь час я побачив на ринку "Петрівка" піратські копії нашого словника.

Електронним ресурсом "Словники України" онлайн (є на нашому сайті) користується весь світ. Він у вільному доступі, щодня до нього звертаються понад 40 тисяч користувачів.

- Яка доля Словника української мови у 20-ти томах?

-Як ви знаєте, 11-томний Тлумачний словник української мови був виданий у 70-х роках минулого століття. На той час він вважався вершиною української лексикографії. Але життя стрімко змінюється, і ми з академіком В.Русанівським та вже згаданою М.Пещак започаткували проект нового фундаментального тлумачного словника.

Тлумачний словник української мови у 20-ти томах - це принципово нова робота. Для цього ми розробили спеціальну комп'ютерну технологію - віртуальну лексикографічну лабораторію "Словник української мови".

- У чому відмінність нового тлумачного словника у порівнянні з 11-томником?

- Відмінність дуже істотна. Насамперед розроблено теорію словника, так звану теорію лексикографічних систем. За її допомогою можна формалізувати лексикографічні структури мови. В деталі наразі не вдаватимуся - це речі суто професійні. Спочатку була побудована формальна модель словника. Одразу зауважу: ми використали й надбання, що були в 11-томнику, перевівши їх у лексикографічну базу даних. Тепер є така система, за допомогою якої наші лексикографи працюють дистанційно: будучи вдома чи в будь-якому місці земної кулі, вони можуть писати словникові статті, спілкуватися між собою і т. п. Система влаштована так, що до будь-якого елемента лексикограф має прямий доступ.

- Словник збільшився майже вдвічі. За рахунок чого - нових термінів і слів, розширилося їх тлумачення?

- Оскільки "нове життя нового прагне слова", то, звичайно, багато чого додалося, а чогось довелося позбутися. Зокрема, очиститися від марксистсько-ленінської риторики (в основному це був ілюстративний матеріал з рішень КПРС, цитат з творів класиків марксизму-ленінізму). У 20-томнику взято курс на те, щоб ширше ілюструвати мовні одиниці й явища (т. зв. ілюстративна зона), але за рахунок автентичних джерел української мови. Обсяг лексикографічного опрацювання зріс теж приблизно вдвічі. Тому що повніше описується семантика. Дуже помітно збільшилася т. зв. заромбова зона - система фразеологізмів, усталених словосполучень, термінологізмів. І значно розширилася ілюстративна зона - усі без винятку семантичні ефекти проілюстровано. Звичайно, побільшало словникових статей, розширилися значення, з'явилися нові термінологічні словосполучення. Візьмімо для прикладу слово "нано". В 11-томнику його взагалі не було, а в базі даних 20-томного словника знаходимо близько сотні термінів із цим словом.

В 11-томному налічувалося близько 134 тис. слів (словникових статей). У 20-томному - приблизно 200 тис. І це ще не вся мовна скарбниця. У нас є базовий електронний Граматичний словник української мови (теж у формі віртуальної лексикографічної лабораторії), де в реєстрі представлено понад 576 тис. лексичних одиниць. І це ще далеко не все. За оцінками академіка Д.Гродзинського, який був головою комітету з наукової термінології НАНУ, загальна кількість лише термінологічних одиниць сягає 50 млн. Це просто неосяжна кількість, якою практично неможливо користуватися без сучасного технологічного інструментарію. Ми у фонді розробили контури комп'ютерної лінгвістичної технології, яка дозволяє практично в автоматичному режимі побудувати майже всю світову терміносистему. І фактично це початок того, що я називаю системою національних лінгвістичних ресурсів України.

- Можете стисло описати, що вона собою являє?

- Традиційно вважається, що мова - це предмет мовознавства. З розвитком інформаційного суспільства мова перетворилася, як я вже зазначив, на технологію, технологічний інструмент, і від того, наскільки комп'ютерно-мережева інформаційна система "розуміє" мову, залежить її, тобто системи, ефективність. А що потрібно для того, щоб вона оперувала мовою так, як це робить людина? Для цього потрібні лінгвістичні ресурси. Насамперед електронні словники різних типів. Не тільки слів, а й словосполучень, фразеологізмів, термінологічних словосполучень. Є навіть словники, які оперують вербально невираженими структурами - наприклад словники синтаксичних структур та ін. В українській мові досить розвинена словозміна, вже побудовано близько трьох тисяч словозмінних класів. І все це в нас формально описано, кодифіковано, написано програму, яка це робить автоматично. Коли програма знайде текстове слово, вона повинна знайти, до якого класу воно належить, відновити його семантику, тобто значення і т. д. Все це вкупі становить систему лінгвістичних ресурсів. Для жодної мови світу в такому повному вигляді, як це вдалося зробити нам, системи лінгвістичних ресурсів не побудовано. Ми маємо унікальний інструмент, якого немає ніде в світі. Його назва - "Віртуальна лексикографічна лабораторія "Словник української мови".

Таку саму систему ми можемо створити й для інших мов. У нас уже є кілька десятків різних віртуальних лінгвістичних лабораторій.

Для цього, безумовно, потрібні потужні ресурси й корпусні технології опрацювання мови.

В УМІФ створено перший в Україні лінгвістичний корпус (ЛК). Його обсяг - понад 170 млн слововживань. ЛК - це сучасна експериментальна база для проведення фундаментальних мовознавчих досліджень та укладання лексикографічних праць нового покоління. З допомогою ЛК вже створено низку лексикографічних праць у серії "Словники України", виконано чимало лінгвістичних досліджень.

- Вийшло лише кілька томів тлумачного словника української мови. Яка перспектива виходу інших, чи вважається, що це питання не на часі?

-Вийшло шість томів. Перший було видано 2010 року. Відтоді щороку видавали по одному тому. Сьомий мав вийти наприкінці минулого року. Решта томів також є у базі даних, треба тільки відредагувати й видати. Але немає коштів. Грошей, які нам виділяють, вистачає тільки на один том у рік. Та й то накладом тисяча примірників.

До речі, 11-томник було видано накладом 30 тис. примірників. І це за тоталітарного режиму. Весь Інститут мовознавства (двісті осіб) працював над тим словником. А в нас усього 15 лексикографів. А ще ж є державне замовлення, яке ми виконуємо, інша наукова тематика. Для того щоб робити такі лінгвістичні ресурси, треба мати й відповідну структуру. Над аналогічним словником англійської мови - третім виданням Oxford English Dictionary - працюють 80 груп лексикографів і в кожній до 10 осіб.

Принагідно зазначу, що 2004 року рішенням уряду Національну словникову базу Українського мовно-інформаційного фонду було внесено до Державного реєстру наукових об'єктів, що становлять національне надбання України. А серед цих об'єктів 20-томний словник - об'єкт номер один. Це більше, ніж наукова цінність, це один із символів держави. Так само як Державний Гімн, Герб, Прапор України.

- А чому не видано сьомого тому?

-Згідно з державним замовленням він мав вийти минулого року. Ми, як належить, оголосили тендер на друкування, за чинним законодавством у системі "Прозоро" було проведено торги. Переможцем тендера визначили ДП "Розвиток" МВС України, з яким було укладено договір на друкування сьомого тому накладом 1000 примірників. 2 грудня 2016 року УМІФ перерахував ДП "Розвиток" кошти і навіть передав йому готовий оригінал-макет. Виконавець повинен був до кінця грудня минулого року віддрукувати тираж сьомого тому словника, але нам було передано лише три сигнальні примірники. А далі все загальмувалося. Неодноразово я звертався до т. в. о. директора ДП "Розвиток" Ю.Галалу, але конкретної відповіді не отримав. Тоді я написав офіційного листа цьому т. в. о. директора. У відповідь він надіслав гарантійного листа, в якому запевнив, що наклад буде готовий до 07.03.2017. Але накладу й досі немає. Тоді я звернувся з листом до міністра А.Авакова, але отримав якусь незрозумілу відповідь. Про цю ганебну історію я розповів в інтерв'ю телеканалу "Рада", але нічого не змінилося. Невже до суду подавати?

Скільки в нас галасу навколо державної мови!.. Але ж бюрократичними засобами мовних проблем не вирішиш. Хоч скільки б законів придумували… А тим часом усе просто: мають бути всі інструменти її застосування - комп'ютерні, паперові, зроблені на найвищому рівні, і щоб це було доступно користувачам.

У нашому доробку багато різних словників. Тлумачний словник російської мови, турецької, зараз готуємо словник іспанської мови (як віртуальну лексикографічну лабораторію). Етимологічний словник української мови - це взагалі унікальний словник, створений в Інституті мовознавства імені О.Потебні. (Етимологія - розділ лінгвістики, що вивчає походження слів мови.) Знаєте, на скільки мов за цим словником має вихід українська? Більш ніж на 250. І це вдалося встановити лише завдяки тому, що у фонді було створено віртуальну лексикографічну лабораторію "Етимологічний словник української мови". Завдяки її застосуванню було побудовано повний індекс за всіма мовами, які є в цьому словникові. Отака наша мова - широка, розлога... На жаль, останній, сьомий том словника, а саме індекс за всіма мовами, лежить уже років три - академія не має коштів на видання. Якби видали сьомий том, то було б завершено надзвичайно важливий для України проект.

- УМІФ проводить логіко-лінгвістичну експертизу. Хто звертається з приводу такої експертизи і з якою метою?

- Різні організації та державні установи. Свого часу ми проводили експертизу Податкового кодексу. Це був величезний за обсягом матеріал (понад 800 сторінок) - 18 розділів і 18 груп авторів. І ми з кожною із цих груп працювали. Спочатку вони ставилися до нас трохи зверхньо, мовляв, та що ті лінгвісти… Та коли ми показали результати експертизи і вони побачили свої огріхи, то дуже нам дякували. Особливо багато плутанини було в термінології. Нині ми працюємо над експертизою документів на замовлення Генеральної прокуратури України.

Проводили лінгвістичну експертизу програм українських політичних партій, представлених в українському парламенті (2004 р.). Результати цього дослідження виявилися вельми цікавими і переконливо засвідчили, що всі програми надають перевагу суто політичним питанням і значно менше уваги насущним потребам громадян і соціальних спільнот.

Лінгвістичні експертизи - один з напрямів діяльності УМІФ (і це записано в його статуті). Майже ніхто, крім нашої наукової установи, в Україні не займається теорією цього питання. У нас уже опубліковано понад півсотні наукових робіт, розроблено методику і методологію, певне програмне забезпечення. Частину робіт ми можемо виконувати в автоматизованому режимі, особливо, коли йдеться про два тексти, які треба порівняти між собою за тими чи іншими параметрами.

Уже півтора десятка років чуємо розмови про те, що потрібно робити систему логіко-лінгвістичної експертизи нашого законодавства. Якби при розробці законопроектів задіяли нашу систему (а це нескладно, бо її системотехніка від початку орієнтована на функціонування в Інтернеті) або звернулися до наших фахівців, то не було б лінгвістичних некоректностей і термінологічних "ляпів", які нерідко трапляються в документах. Якщо ми створимо систему логіко-лінгвістичної експертизи правових актів, то підвищимо рівень нашої правової культури.

- Насамкінець запитання "не по суті". Ви пишете музику - це ваше хобі? І чому саме вподобали саме романс - цей призабутий жанр?

- Зрозуміло, це хобі. Я не надаю йому дуже великого значення і не вважаю себе видатним композитором. Але мелодії в моїй голові "крутяться" з самого дитинства. Останнім часом, коли з'явилася можливість записати їх на ноти й організувати виконання зі сцени, я побачив, що вони подобаються людям. Особливе враження на публіку справило виконання торік трьох моїх романсів нашим славетним співаком народним артистом України Тарасом Штондою. Зрештою, романс, або пісня, - це найпростіший жанр, тому я, як аматор, обрав саме його. Опер чи симфоній я не маю нахабства писати. Проте деякі з моїх творів уже не просто романси. Наприклад, минулого року на прохання нашого відомого дуету сестер Людмили і Галини Турчак я написав дві пісні на слова Григорія Сковороди. Вони були виконані зі сцени і сподобалися публіці. Зараз, наскільки мені відомо, їх узяв до свого репертуару Київський чоловічий камерний хор імені Л.Ревуцького. Вони зробили адаптацію для хору, і, сподіваюся, незабаром ми почуємо ці твори в хоровому виконанні. Для мене це велика честь.