Вчені компанії Meta, яка володіє соціальними мережами Facebook та Instagram, використали мовний штучний інтелект для передбачення структури 600 мільйонів білків вірусів, бактерій та інших мікробів, повідомляє Live science. І деякі з цих білків належать організмам, невідомим науці.
Програма, що отримала назву ESMFold, використала модель, яка була створена для розшифровки людської мови. З її допомогою вона спромоглася спрогнозувати «повороти», що визначають тривимірну структуру білків. Результати роботи ШІ можуть бути використані для розробки нових ліків, опису раніше невідомих мікробних функцій та відстеження еволюційних зв'язків між окремими спорідненими видами.
Білки - це «будівельні блоки» життя, які складаються з ланцюжків амінокислот - крихітних молекулярних одиниць, які з'єднуються один з одним у незліченних комбінаціях, утворюючи тривимірну форму білка. Знання форми білка дозволяє визначити його функції. Але існує безліч способів, якими може комбінуватися один і той же набір амінокислот.
Золотим стандартом визначення структури білка є рентгенівська кристалографія, що дозволяє побачити, як високоенергетичні світлові промені заломлюються навколо білків, але це копіткий метод, на отримання результатів якого можуть піти місяці чи роки, і він працює для всіх типів білків. Після десятиліть роботи за допомогою рентгенівської кристалографії було розшифровано понад 100 тисяч білкових структур. Щоб вирішити цю проблему, фахівці Meta вирішили розробити власну програму, яка передбачає форму білка.
Щоб перевірити роботу своєї програми, дослідники використали базу метагономної ДНК, яка була секвенована з ґрунту, води, кишечника та зі шкіри людини. Ввівши дані у програму, вченим вдалося спрогнозувати форму 617 мільйонів білків за два тижні.
Це на 400 мільйонів більше, ніж спромоглася спрогнозувати програма AlphaFold від компанії DeepMind.