UA / RU
Підтримати ZN.ua

Вчені використовували Daily Mail і CNN для навчання штучного інтелекту

Вчені прагнуть навчити штучний інтелект розуміти прочитану їм інформацію.

Команда дослідників, які спеціалізуються на глибокому машинному навчанні, з Google DeepMind і Оксфордського університету навчила штучний інтелект читати тексти і відповідати на питання про зміст прочитаного. Причому в цьому їм "ненавмисно" допомогли сайти Daily Mail і CNN, які відкрили доступ до величезного архіву своїх новин.

Однією з проблем у процесі навчання нейромереж була відсутність значних баз даних, які містили б не тільки тексти, але також спеціальні опису їх ключових моментів і структур. До недавнього часу створити таку базу могли тільки високооплачувані спеціалісти-редактори, причому на це пішло б значна кількість фінансових ресурсів.

Однак Daily Mail і CNN відкрили для загального доступу повні архіви своїх новин. Будь-яка новина має крім основного тексту ще й такі блоки як "лід", "мінілід" або "райтколл" – коротку анотацію ключових моментів будь-новини і їх взаємозв'язків. Все разом це створило необхідні умови для навчання нейромереж під завдання читання і "розуміння" текстів.

Наприклад, у тексті про вбивство президента США Джона Кеннеді будуть багаторазово зустрічатися поєднання "Лі Харві Освальд", "стріляв" і "Кеннеді". Також може бути і повне речення "Лі Харві Освальд стріляв в Далласі в Кеннеді". Штучного інтелекту може бути задано запит "Х стріляв в Далласі в Кеннеді". Після аналізу частоти спільного появи даних слів і їх відносну близькість, він легко знайде відповідь – "Лі Харві Освальд".

Сформовані таким чином зв'язки можуть бути перенесені і на інші ситуації, і в цьому випадку штучний інтелект видасть інформацію на запит, наприклад, "Кеннеді обстріляли в Далласі. Затриманий Х" знову "Лі Харві Освальд", притому, що набір слів буде відрізнятися.

На даний момент програма відповідає правильно на 60% запитів. Дослідники припускають, що вони зможуть довести кількість вірних відповідей до 100% за умови, що запити будуть граматично прості. Чи буде ця програма також ефективна при менш структурованих текстах, ніж новини, поки невідомо.

Раніше британський фізик-теоретик Стівен Хокінг заявив, що протягом 100 років штучний інтелект запанує над людством.