Якщо послухати пихату риторику Пекіна та Вашингтона, то США та Китай ведуть тотальне змагання за технологічну перевагу. Жодна технологія, схоже, зараз не хвилює їх більше, ніж штучний інтелект (ШІ). Швидке вдосконалення можливостей "генеративних" ШІ, таких як ChatGPT, які аналізують в Інтернеті людські тексти, зображення або звуки, а потім можуть створювати все більш релевантні симулякри, лише посилило цю одержимість. Розвинені технології ШІ можуть дати тим, хто ними володіє, економічну та військову перевагу у головному геополітичному змаганні 21 століття. Західні та китайські стратеги вже говорять про гонку озброєнь, пише The Economist.
У 2019 році Китай перевершив США за часткою високоцитованих статей у галузі ШІ у світі; 2021 року 26% публікацій на конференціях з ШІ у світі припадатиме на Китай, тоді як частка Америки становить 17%. Дев'ять із десяти провідних світових інститутів за обсягом публікацій у галузі ШІ – китайські. П'ять провідних китайських лабораторій працюють над комп'ютерним зором – типом ШІ, особливо корисним для спостереження у комуністичній державі.
Коли ж мова заходить про "фундаментальні моделі", які дають поштовх розвитку генеративних ШІ, Америка впевнено опиняється попереду. ChatGPT і новаторська модель, що стоїть за ним, остання версія якої називається GPT-4, є дітищем американського стартапу OpenAI. Купка інших американських компаній, від невеликих фірм, таких як Anthropic або Stability, до таких технологічних гігантів, як Google, Meta та Microsoft (яка частково володіє OpenAI), мають власні потужні системи. ernie, китайський конкурент ChatGPT, створений Baidu, китайським гігантом інтернет-пошуку, широко розглядається як менш розумний, ніж більшість із них. Alibaba і Tencent, наймогутніші технологічні титани Китаю, ще навіть не представили свої власні генеративні ШІ.
Англійська мова VS китайська: у США більше «їжі» для ШІ
Це дозволяє зробити висновок, що Китай на два-три роки відстає від Америки у створенні базових моделей. Є три причини такого відставання. Перша стосується даних. На перший погляд, централізована автократія має бути здатною зібрати їх у великій кількості - уряд, наприклад, зміг передати свої масиви інформації про спостереження за китайськими громадянами таким компаніям, як SenseTime або Megvii, які за допомогою провідних лабораторій комп'ютерного зору країни потім використовували їх для розробки першокласних систем розпізнавання облич.
Перевага виявилася менш грізною в контексті генеративних ШІ, оскільки базові моделі навчаються на набагато більших неструктурованих даних Інтернету. Американські розробники моделей користуються тим, що 56% всіх веб-сайтів - англійською мовою, тоді як китайською - лише 1,5%, згідно з даними сайту інтернет-досліджень w3Techs. Як зазначає Іцінь Фу зі Стенфордського університету, китайці взаємодіють з інтернетом в основному через мобільні програми, такі як WeChat і Weibo. Це "закриті сади", тому більшість їх контенту не індексується пошуковими системами. Це ускладнює роботу з контентом для ШІ-моделей. Недолік даних може пояснити, чому Wu Dao 2.0, китайська модель, представлена в 2021 році Пекінською академією штучного інтелекту, що фінансується державою, не змогла зробити фурор, незважаючи на те, що вона, можливо, складніша в обчислювальному плані, ніж GPT-4.
Залежність Китаю від США у питанні мікросхем
Друга причина незадовільних досягнень Китаю у сфері генерації пов'язані з апаратним забезпеченням. Минулого року Америка запровадила жорсткий експортний контроль на будь-які технології, які можуть надати її головному геостратегічному супернику перевагу в галузі інформаційних технологій. Зокрема, йдеться про потужні чіпи, що використовуються в центрах обробки даних хмарних обчислень, де навчаються базові моделі, та інструменти для виробництва мікросхем, які можуть дозволити Китаю самостійно створювати такі напівпровідники.
Це стало ударом для китайських моделей розробників. Аналіз 26 великих китайських моделей, проведений британським аналітичним центром Centre for the Governance of ai, показав, що більше половини з них залежить від обчислювальної потужності американського розробника чіпів Nvidia. За деякими даними, компанія smic, найбільший китайський виробник чіпів, випустила прототип чіпів, які лише на покоління або два відстають від tsmc, тайваньського лідера галузі, що виробляє чіпи для Nvidia. Але китайська фірма може бути здатна лише на масове виробництво чіпів, які tsmc випускала мільйонами три чи чотири роки тому. Професор одного з провідних китайських університетів нарікає на слабкість своєї країни у такій "базовій інфраструктурі" ШІ.
Ноу-хау – на боці США, а не Китаю
Китайським компаніям, які займаються розробками в галузі ШІ, все важче отримати до рук ще один американський експорт - ноу-хау. Америка залишається магнітом для світових технічних талантів. Дві третини американських експертів у галузі ШІ, які представляють доповіді на найбільшій конференції з ШІ, мають іноземне походження. Китайські інженери склали 27% цієї обраної групи у 2019 році. Багато китайських айтішників навчалися або працювали в Америці, перш ніж привезти свої машинні знання на батьківщину. (Мало хто з некитайських фахівців вважав би переїзд до поліцейської держави мудрим кар'єрним кроком). Пандемія Ковід-19 та зростаюча китайсько-американська напруженість призводять до скорочення їхньої кількості. У першій половині 2022 року Америка видала китайським студентам удвічі менше віз, ніж за період 2019 року.
Потрійна нестача даних, обладнання та фахівців стала справжньою перешкодою для Китаю. Однак чи стримуватиме це китайські амбіції в галузі інформатики ще довго, це вже інше питання.
Китай нарощує інформацію для свого ШІ
13 лютого місцева влада Пекіна, де розташована майже третина китайських компаній, що працюють у сфері айті, заявила, що вона оприлюднить дані 115 пов'язаних з державою організацій, надавши розробникам моделей 15 880 наборів даних. Центральний уряд раніше заявляв про бажання ліквідувати "закриті сади" китайських додатків, що може призвести до вивільнення більшої кількості даних.
До того ж, оновлена американська GPT-4 дуже добре справлятиметься із завданнями китайською мовою, незважаючи на нестачу китайського вихідного матеріалу у навчальних даних моделі. Модель Ernie від Baidu навчалася на великій кількості англомовних даних.
Чіпи: КНР шукає обхідні шляхи
У галузі апаратного забезпечення Китай також знаходить обхідні шляхи. Компанія SenseTime, яка внесена до чорного списку американського уряду, використала посередників, щоб обійти експортний контроль. Деякі китайські ШІ-фірми можуть використовувати обчислювальну потужність передових чіпів Nvidia через хмарні сервери, розташовані в інших країнах. В якості альтернативи вони можуть просто купити більш просунутих напівпровідників Nvidia або використовувати їх більш ефективно за допомогою розумного програмного забезпечення. Щоб продовжувати обслуговувати великий китайський ринок, американська компанія розробила менш потужні процесори, які відповідають вимогам санкцій. Вони на 10%-30% повільніші, ніж топові комплекти, і в результаті обходяться китайським клієнтам дорожче в перерахунку на одиницю обчислювальної потужності. Але вони виконують свою роботу.
Вихідний код для навчання
Китай може частково вирішити проблему нестачі чіпів та мозкової потужності за допомогою моделей з "відкритим вихідним кодом". Внутрішня будова таких моделей може бути завантажена будь-якою людиною та доопрацьована під конкретне завдання. Найважливіше, що це включає числа, так звані "ваги", які визначають структуру моделі і які виходять в результаті дорогого навчання. Alpaca, модель, побудована дослідниками зі Стенфордського університету з використанням ваги flama, базової моделі, створеної Meta, була зроблена менш ніж за 600 доларів, порівняно із сумами близько 100 млн доларів на навчання чогось на зразок GPT-4. Альпака справляється з багатьма завданнями так само добре, як оригінальна версія ChatGPT.
Китайські лабораторії можуть також скористатися моделями з відкритим вихідним кодом, які втілюють колективну мудрість міжнародних дослідницьких груп. Метт Шихан із Фонду Карнегі за міжнародний світ, ще одного аналітичного центру, каже, що Китай має форму "швидкого послідовника" - його лабораторії вбирають досягнення з-за кордону, а потім швидко впроваджують їх у власні моделі, часто з невеликими державними ресурсами. Видатний венчурний капіталіст із Кремнієвої долини висловлюється прямолінійніше, називаючи моделі з відкритим вихідним кодом «подарунком Комуністичної партії».
Можливості США протистояти загрозам від КНР
Зважаючи на ці міркування, важко уявити, що в довгостроковій перспективі Америка чи Китай зможуть досягти непереборної переваги в галузі авіамоделювання. Кожна зі сторін цілком може мати приблизно однакові можливості, навіть якщо Китаю коштуватиме величезних витрат, щоб не відстати перед обличчям американських санкцій. Але навіть якщо в гонці творців моделей настане переломний момент, у Америки є одна перевага, яка може зробити її великим переможцем у галузі ШІ – її неперевершена здатність розповсюджувати передові інновації по всій економіці. Зрештою, саме більш ефективне поширення технологій допомогло Америці досягти технологічної переваги над Радянським Союзом, який у 1950-х роках випускав удвічі більше наукових праць, ніж його демократичний супротивник.
Китай, звісно, набагато компетентніший у освоєнні нових технологій, ніж будь-коли був Радянський Союз. Його фінтех-платформи, телекомунікації 5g та високошвидкісні залізниці – високого класу. Але ці успіхи можуть бути винятком, а не правилом. Зокрема, у розгортанні сенсорів, хмарних обчислень та програмного забезпечення для бізнесу – все це доповнює айті-технології – Китай досяг менших успіхів.
Хоча американський експортний контроль не може зупинити всі китайські моделі, він стримує китайську технологічну промисловість загалом, тим самим уповільнюючи впровадження будь-яких нових технологій. Більше того, корпоративний Китай загалом, і особливо малі та середні компанії, відчувають нестачу в технологах, які виступають як провідники для поширення технологій. В економіці країни переважають державні компанії, які, як правило, завмерли і не хочуть змін. Китайський "Великий фонд" для чіпів, який у 2014 році залучив $50 млрд для підтримки вітчизняних напівпровідникових компаній, потопає у скандалах. Багато тисяч ШІ-стартапів, створених останніми роками, просто наклеїли ярлик "ШІ" в надії отримати частину щедрих субсидій, що виділяються державою на улюблену галузь.
Як наслідок, приватному сектору Китаю може бути важко скористатися всіма перевагами генеративного ШІ, особливо якщо Комуністична партія встановить жорсткі правила, щоб чат-боти не говорили про те, що не подобається цензорам. Такі перешкоди стануть доповненням до ширшого підриву приватного підприємництва з боку Сі Цзіньпіна, включаючи дво- та півторарічні репресії проти китайської технологічної індустрії. Хоча ця антитехнологічна кампанія офіційно завершилася, вона залишила на підприємствах шрами.
Результатом стало охолодження настроїв у технологічній сфері. Минулого року приватні інвестиції в китайські стартапи становили $13,5 млрд, що менше третини суми, яка прийшла до їхніх американських конкурентів. За перші чотири місяці 2023 року розрив у фінансуванні, за даними компанії PitchBook, лише збільшився. Незалежно від того, чи виявиться генеративний ШІ революційним, чи ні, вільний ринок зробив ставку на те, хто отримає з нього найбільшу вигоду.