Если послушать напыщенную риторику Пекина и Вашингтона, то США и Китай ведут тотальное соревнование за технологическое превосходство. Ни одна технология, похоже, сейчас не волнует их больше, чем искусственный интеллект (ИИ). Быстрое совершенствование возможностей "генеративных" ИИ, таких как ChatGPT, которые анализируют в Интернете человеческие тексты, изображения или звуки, а затем могут создавать все более подходящие симулякры, только усилило эту одержимость. Развитые технологии ИИ могут дать тем, кто ими владеет, экономическое и военное преимущество в главном геополитическом соревновании 21 века. Западные и китайские стратеги уже говорят о гонке вооружений, пишет The Economist.
В 2019 году Китай превзошел США по доле высокоцитируемых статей в области ИИ в мире; в 2021 году 26% публикаций на конференциях по ИИ в мире будет приходиться на Китай, в то время как доля Америки составляет 17%. Девять из десяти ведущих мировых институтов по объему публикаций в области ИИ - китайские. Пять ведущих китайских лабораторий работают над компьютерным зрением - типом ИИ, особенно полезным для наблюдения в коммунистическм государстве.
Когда же речь заходит о "фундаментальных моделях", которые дают толчок развитию генеративных ИИ, Америка оказывается уверенно впереди. ChatGPT и стоящая за ним новаторская модель, последняя версия которой называется GPT-4, являются детищем американского стартапа OpenAI. Горстка других американских компаний, от небольших фирм, таких как Anthropic или Stability, до таких технологических гигантов, как Google, Meta и Microsoft (которая частично владеет OpenAI), имеют свои собственные мощные системы. ernie, китайский конкурент ChatGPT, созданный Baidu, китайским гигантом интернет-поиска, широко рассматривается как менее умный, чем большинство из них. Alibaba и Tencent, самые могущественные технологические титаны Китая, еще даже не представили свои собственные генеративные ИИ.
Английский язык VS китайский: у США больше «пищи» для ИИ
Это позволяет сделать вывод, что Китай на два-три года отстает от Америки в создании базовых моделей. Есть три причины такого отставания. Первая касается данных. На первый взгляд, централизованная автократия должна быть способна собрать их в большом количестве - правительство, например, смогло передать свои массивы информации о наблюдении за китайскими гражданами таким компаниям, как SenseTime или Megvii, которые с помощью ведущих лабораторий компьютерного зрения страны затем использовали их для разработки первоклассных систем распознавания лиц.
Преимущество оказалось менее грозным в контексте генеративных ИИ, поскольку базовые модели обучаются на гораздо более объемных неструктурированных данных Интернета. Американские разработчики моделей пользуются тем, что 56% всех веб-сайтов - на английском языке, в то время как на китайском - всего 1,5%, согласно данным сайта интернет-исследований w3Techs. Как отмечает Ицинь Фу из Стэнфордского университета, китайцы взаимодействуют с интернетом в основном через мобильные приложения, такие как WeChat и Weibo. Это "закрытые сады", поэтому большая часть их контента не индексируется поисковыми системами. Это усложняет работу с контентом для ИИ-моделей. Недостаток данных может объяснить, почему Wu Dao 2.0, китайская модель, представленная в 2021 году Пекинской академией искусственного интеллекта, финансируемой государством, не смогла произвести фурор, несмотря на то, что она, возможно, более сложна в вычислительном плане, чем GPT-4.
Зависимость Китая от США в вопросах микросхем
Вторая причина неудовлетворительных достижений Китая в области генерации связана с аппаратным обеспечением. В прошлом году Америка ввела жесткий экспортный контроль на любые технологии, которые могут дать ее главному геостратегическому сопернику преимущество в области информационных технологий. В частности, речь идет о мощных чипах, используемых в центрах обработки данных облачных вычислений, где обучаются базовые модели, и инструментах для производства микросхем, которые могут позволить Китаю самостоятельно создавать такие полупроводники.
Это стало ударом для китайских разработчиков моделей. Анализ 26 крупных китайских моделей, проведенный британским аналитическим центром Centre for the Governance of ai, показал, что более половины из них зависят от вычислительной мощности американского разработчика чипов Nvidia. По некоторым данным, компания smic, крупнейший китайский производитель чипов, выпустила прототип чипов, которые всего на поколение или два отстают от tsmc, тайваньского лидера отрасли, производящего чипы для Nvidia. Но китайская фирма может быть способна только на массовое производство чипов, которые tsmc выпускала миллионами три или четыре года назад. Профессор одного из ведущих китайских университетов сетует на слабость своей страны в такой "базовой инфраструктуре" ИИ.
Ноу-хау - на стороне США, а не Китая
Китайским компаниям, занимающимся разработками в области ИИ, все труднее получить в свои руки еще один американский экспорт - ноу-хау. Америка остается магнитом для мировых технических талантов. Две трети американских экспертов в области ИИ, представляющих доклады на крупнейшей конференции по ИИ, имеют иностранное происхождение. Китайские инженеры составили 27% этой избранной группы в 2019 году. Многие китайские айтишники учились или работали в Америке, прежде чем привезти свои машинные знания на родину. (Мало кто из некитайских специалистов посчитал бы переезд в полицейское государство мудрым карьерным шагом). Пандемия Ковид-19 и растущая китайско-американская напряженность приводят к сокращению их числа. В первой половине 2022 года Америка выдала китайским студентам вдвое меньше виз, чем за тот же период 2019 года.
Тройная нехватка данных, оборудования и специалистов стала настоящим препятствием для Китая. Однако будет ли это сдерживать китайские амбиции в области информатики еще долго, это уже другой вопрос.
Китай наращивает информацию для своего ИИ
13 февраля местные власти Пекина, где расположена почти треть китайских компаний, работающих в сфере айти, заявили, что они обнародуют данные 115 связанных с государством организаций, предоставив разработчикам моделей 15 880 наборов данных. Центральное правительство ранее заявляло о своем желании ликвидировать "закрытые сады" китайских приложений, что может привести к высвобождению большего количества данных.
К тому же, обновленная американская GPT-4 будет очень хорошо справляться с заданиями на китайском языке, несмотря на недостаток китайского исходного материала в обучающих данных модели. Модель ernie от Baidu обучалась на большом количестве англоязычных данных.
Чипы: КНР ищет обходные пути
В области аппаратного обеспечения Китай также находит обходные пути. Компания SenseTime, которая внесена в черный список американского правительства, использовала посредников, чтобы обойти экспортный контроль. Некоторые китайские ИИ-фирмы могут использовать вычислительную мощность передовых чипов Nvidia через облачные серверы, расположенные в других странах. В качестве альтернативы они могут просто купить больше менее продвинутых полупроводников Nvidia или использовать их более эффективно с помощью умного программного обеспечения. Чтобы продолжать обслуживать обширный китайский рынок, американская компания разработала менее мощные процессоры, соответствующие требованиям санкций. Они на 10%-30% медленнее, чем топовые комплекты, и в итоге обходятся китайским клиентам дороже в пересчете на единицу вычислительной мощности. Но они выполняют свою работу.
Исходный код для обучения
Китай может частично решить проблему нехватки чипов и мозговой мощности с помощью моделей с "открытым исходным кодом". Внутреннее устройство таких моделей может быть загружено любым человеком и доработано под конкретную задачу. Самое важное, что это включает в себя числа, называемые "весами", которые определяют структуру модели и которые получаются в результате дорогостоящего обучения. Alpaca, модель, построенная исследователями из Стэнфордского университета с использованием весов llama, базовой модели, созданной Meta, была сделана менее чем за 600 долларов, по сравнению с суммами порядка 100 млн долларов на обучение чего-то вроде GPT-4. Альпака справляется со многими задачами так же хорошо, как и оригинальная версия ChatGPT.
Китайские лаборатории могут также воспользоваться моделями с открытым исходным кодом, которые воплощают в себе коллективную мудрость международных исследовательских групп. Мэтт Шихан из Фонда Карнеги за международный мир, еще одного аналитического центра, говорит, что Китай имеет форму "быстрого последователя" - его лаборатории впитывают достижения из-за рубежа, а затем быстро внедряют их в свои собственные модели, часто с небольшими государственными ресурсами. Видный венчурный капиталист из Кремниевой долины высказывается более прямолинейно, называя модели с открытым исходным кодом «подарком Коммунистической партии».
Возможности США противостоять угрозам от КНР
Из этих соображений трудно представить, что в долгосрочной перспективе Америка или Китай смогут добиться непреодолимого превосходства в области авиамоделирования. Каждая из сторон вполне может в итоге иметь примерно одинаковые возможности, даже если Китаю будет стоить огромных затрат, чтобы не отстать перед лицом американских санкций. Но даже если в гонке создателей моделей наступит переломный момент, у Америки есть одно преимущество, которое может сделать ее большим победителем в области ИИ - ее непревзойденная способность распространять передовые инновации по всей экономике. В конце концов, именно более эффективное распространение технологий помогло Америке добиться технологического превосходства над Советским Союзом, который в 1950-х годах выпускал в два раза больше научных трудов, чем его демократический противник.
Китай, конечно, гораздо более компетентен в освоении новых технологий, чем когда-либо был Советский Союз. Его финтех-платформы, телекоммуникации 5g и высокоскоростные железные дороги - высокого класса. Но эти успехи могут быть исключением, а не правилом. В частности, в развертывании сенсоров, облачных вычислений и программного обеспечения для бизнеса - все это дополняет айти-технологии - Китай добился меньших успехов.
Хотя американский экспортный контроль не может остановить все китайские модели, он сдерживает китайскую технологическую промышленность в целом, тем самым замедляя внедрение любых новых технологий. Более того, корпоративный Китай в целом, и особенно малые и средние компании, испытывают недостаток в технологах, которые выступают в качестве проводников для распространения технологий. В экономике страны преобладают государственные компании, которые, как правило, застыли и не хотят перемен. Китайский "Большой фонд" для чипов, который в 2014 году привлек $50 млрд для поддержки отечественных полупроводниковых компаний, погряз в скандалах. Многие из тысяч ИИ-стартапов, созданных в последние годы, просто наклеили ярлык "ИИ" в надежде получить часть щедрых субсидий, выделяемых государством на любимую отрасль.
Как следствие, частному сектору Китая может быть трудно воспользоваться всеми преимуществами генеративного ИИ, особенно если Коммунистическая партия установит жесткие правила, чтобы чат-боты не говорили того, что не нравится цензорам. Такие препятствия станут дополнением к более широкому подрыву частного предпринимательства со стороны Си Цзиньпина, включая двух- и полуторагодичные репрессии против китайской технологической индустрии. Хотя эта антитехнологическая кампания официально завершилась, она оставила на предприятиях шрамы.
Результатом стало охлаждение настроений в технологической сфере. В прошлом году частные инвестиции в китайские стартапы составили $13,5 млрд, что меньше трети суммы, пришедшей к их американским конкурентам. За первые четыре месяца 2023 года разрыв в финансировании, по данным компании PitchBook, только увеличился. Независимо от того, окажется ли генеративный ИИ революционным или нет, свободный рынок сделал ставку на то, кто извлечет из него наибольшую выгоду.