UA / RU
Поддержать ZN.ua

"Облачная" наука

Тенденции и перспективы создания "облачных" проектов для нужд науки в Украине и Европейском Союзе

Авторы: Андрей Василенко, Григорий Мозолевич

Стратегической задачей украинской науки, как известно, является вступление в Европейское исследовательское пространство. В процессе выполнения этой задачи возникает ряд дискуссионных вопросов, один из которых - создание "облака" для нужд украинской науки.

В 2017 г. на саммите European Open Science Cloud (EOSC) была принята Декларация EOSC и, как следствие, возникла дискуссия о создании "Всеукраинского облака открытой науки". Однако хотя в названии EOSC и содержится термин "cloud" ("облако" - англ.), к классическим "облакам" эту организацию, пребывающую ныне на стадии создания, отнести нельзя. Предлагаемая статья ставит целью определить основные различия между классическим "облаком" и EOSC и установить смысл и перспективы реализации проекта "Всеукраинское облако открытой науки".

Что такое "облако", и в чем смысл его существования?

"Облако", или "облачное хранилище", - это модель хранения данных, где цифровые данные сортируются в логические пулы, a физическое хранение охватывает несколько серверов, зачастую в разных местах (локациях). Физическая среда "облака" обычно принадлежит хостинговым компаниям, управляющим этой средой.

В научной сфере деятельности облачные технологии обеспечивают возможность удаленного доступа к компьютерным мощностям в целях проведения вычислительных операций и хранения данных.

Основной мотив использования "облаков" (как в научной, так и в бизнес-среде и производстве) - снижение затрат на оборудование за счет использования внешних компьютерных мощностей, объединенных в "облако", что позволяет организациям экономить ресурсы на создание и содержание собственной электронной инфраструктуры и ее техническое обслуживание. Особенно актуально использование "облаков" при реализации отдельного проекта.

"Облако" является е-инфраструктурой. Е-инфраструктура - это исследовательская среда, поддерживающая инновационное получение, хранение, управление и интеграцию данных, их глубинный анализ, визуализацию и другие вычисления, а также прочие услуги по обработке информации, предоставляемые через Интернет, не ограничиваясь рамками одного учреждения. В зависимости от основных направлений применения мощностей "облака", оно может быть отнесено к исследовательским, социальным, деловым и иным е-инфраструктурам. "Облако", в классическом понимании этого термина, - лишь средство для обработки новых данных и хранения старых.

Создание "облака" на основе имеющихся исследовательских е-инфраструктур Украины для нужд украинской науки является актуальным вопросом, требующим тщательного изучения. Сейчас в Украине созданы мощности Украинского национального грида (УНГ), используемого в процессе реализации некоторых европейских исследовательских проектов. Кроме того, уже есть опыт сотрудничества УНГ и отдельных научных учреждений в указанной сфере и первые попытки пилотных проектов создания виртуальных машин для нужд научной деятельности. Важная особенность - то, что эту е-инфраструктуру можно будет свободно использовать и в случае полноценной интеграции государственной исследовательской инфраструктуры в Европейское исследовательское пространство (ЕИП) и в EOSC.

European Open Science Cloud (EOSC): сущность, процесс становления и стадия реализации проекта

Европейский Союз (ЕС) намерен занять ведущие позиции в мире в области организации работы с исследовательскими данными и развитием наук, которые в своей деятельности этими данными руководствуются (data-driven science). Основными путями эффективного достижения этой цели были определены: обеспечение исследователей свободным доступом к имеющимся данным и предоставление исследователям ЕС общедоступной виртуальной среды с сервисами для обработки данных [1].

Для реализации указанного намерения разработана концепция Открытой науки (Open Science), представляющей собой набор практик, призванных сделать научные процессы и результаты прозрачными и доступными вне исследовательской группы. Основной принцип Открытой науки заключается в том, что "научные данные, полученные за счет государственных средств, должны быть общедоступны"[2]. Также предложено создать Европейское облако открытой науки (European Open Science Cloud-EOSC)[1] - виртуальную среду, которая должна работать согласно концепции открытой науки.

Еврокомиссия представила свое видение EOSC в апреле 2016 г. в European Cloud Initiative. Предполагается, что EOSC станет фундаментальным реализатором концепции Открытой науки и цифровой трансформации науки, предлагая любому ученому (единичной исследовательской инфраструктуре, консорциуму и т.д.) возможность доступа и повторного использования всех исследовательских данных, которые были получены в процессе исследований, профинансированных за счет государства, без ограничения границами и научными дисциплинами[1].

Имплементация проекта EOSC является четким приоритетом политики Европейских исследований и инноваций. Проект поддержан Европейским советом[3] и Европарламентом[4].

Базовые принципы имплементации EOSC изложены в Декларации EOSC[5]. Еврокомиссия поддерживает имплементацию EOSC как федерализованной модели за счет объединения имеющихся европейских исследовательских инфраструктур (включая е-инфраструктуры) рамочной программы Horizon 2020 (далее - Н2020), таких как проекты и программы ESFRI[5, 7].

Еврокомиссия планирует и уже обеспечивает необходимую финансовую поддержку для имплементации EOSC как проекта в пределах Н2020[6]. Совокупный бюджет в 2016–2020 гг. составляет 600 млн евро[7].

Реализованным проектом на пути к созданию федерации EOSC является EOSC-hub[8], вокруг которого будет строиться ядро ​​федерации EOSC[7]. EOSC-hub финансируется Н2020 (грантовый договор №777536) и дополняется взносами European Grid Infrastructure (EGI). EOSC-hub сочетает ряд провайдеров с намерением создать исследовательский хаб - одну точку контакта для исследователей и инноваторов.

Для создания общего каталога исследовательских данных, услуг и софта для исследований и вычислений EOSC-hub привлекает провайдеров из EGI, EUDAT CDI, INDIGO DATA CLOUD и другие европейские исследовательские е-инфраструктуры. EOSC-hub тесно сотрудничает с GEANT, OPEN-AIRE и EOSC-pilot с целью осуществления соответствующих сервисных предложений для исследовательских объединений Европы.

Таким образом, EOSC-hub можно рассматривать как объединение имеющихся исследовательских е-инфраструктур в Европе, созданное с целью физической реализации проекта федерации EOSC.

Также была запущена пилотная версия EOSC-pilot (Project ID: 739563)[9]. Результаты работы пилотной версии дали подтверждение целесообразности реализации проекта EOSC на межотраслевом и панъевропейском уровнях.

4 апреля 2017 г. утверждена дорожная карта имплементации EOSC[7], в которой сведены результаты консультаций со стейкхолдерами и странами-членами, представлены необходимые действия, которые сейчас ведутся, и примерные сроки их выполнения. С учетом всего предыдущего опыта, в т.ч. EOSC-pilot, определены шесть направлений работы для имплементации EOSC и сроки выполнения поставленных задач[7].

Разрабатываются:

архитектуры федерации (решение вопроса текущей фрагментации);

управление данными с учетом FAIR-подхода;

каталогизация имеющихся и разработка новых услуг для участников EOSC;

доступ и интерфейс (механизм доступа и разработка внешнего вида точки входа в EOSC);

правила участия для различных активных участников (стран - членов ЕС, ассоциированных стран и др.) EOSC;

системы управления федерацией.

Итак, EOSC - это федерация, которая будет объединять исследовательские инфраструктуры Европы (в т.ч., е-инфраструктуры и программы/проекты ESFRI) в единое виртуальное научное пространство, где каждому исследователю - члену EOSC (единичной исследовательской инфраструктуре, консорциуму и т.д.) будет предоставлен доступ к:

всем на данный момент имеющимся научным данным, полученным за государственный счет, с возможностью их использования в своих собственных исследованиях (каталог данных);

информации о доступных услугах и мощности исследовательских е-инфраструктур с возможностью их использования (каталог маркета сервисов);

информации об имеющихся исследовательских инфраструктурах, о действующих программах и проектах, о консорциуме, которые уже существуют и создаются, с возможностью добавления и сотрудничества (каталог исследовательских инфраструктур).

Исследователь будет иметь право:

подавать информацию о тех услугах, которые он сам может оказывать на базе своих мощностей (каталог маркета сервисов);

подавать предложения своих собственных проектов и осуществлять поиск заинтересованных партнеров в рамках федерации (каталог исследовательских инфраструктур).

В свою очередь исследователь обязан:

передавать все полученные данные в общий доступ в случае финансирования исследований за государственный счет (каталог данных).

Таким образом, федерация EOSC сама по себе не может считаться чисто электронной инфраструктурой, хотя физическая ее реализация обеспечивается именно на базе имеющихся европейских е-инфраструктур. Это контрастирует с видением EOSC как классического "облака", создаваемого только для цифровой обработки научных данных (вычисления, анализа, хранения и т.д.). EOSC не является "облаком" в классическом его понимании.

Преимущества и недостатки создания "Всеукраинского облака открытой науки"

Прежде всего следует отметить, что одной из основных причин создания EOSC является современная фрагментация исследовательских инфраструктур Европы. Для Украины такая проблема - не столь остра. Перечень научных организаций, функционирующих в Украине в рамках одной отрасли науки и проводящих исследования по сходным направлениям, своим количеством значительно уступает соответствующему перечню организаций стран ЕС. К тому же в Украине уже есть организации, выполняющие объединительную функцию в пределах государства (например, профильные академии наук). Таким образом, актуальность создания "Всеукраинского облака открытой науки" (Ukrainian Open Science Cloud - UOSC) как организации, полностью аналогичной EOSC, для Украины немного ниже, чем EOSC для ЕС.

Ниже приведен SWOT-анализ по созданию UOSC как организации, аналогичной EOSC.

Таким образом, несмотря на имеющиеся преимущества, в создании UOSC есть ряд недостатков, оказывающих существенное влияние на евроинтеграционный процесс государственной исследовательской инфраструктуры Украины.

Каковы же выводы?

1 сентября 2017 г. окончательно вступило в силу Соглашение об ассоциации между Украиной, с одной стороны, и Европейским Союзом, Европейским сообществом по атомной энергии и их государствами-членами - с другой. Согласно п.2 статьи 375 указанного Соглашения, "сотрудничество между Сторонами направляется на содействие привлечению Украины в Европейское исследовательское пространство".

Для реализации этого пункта участие украинских исследовательских инфраструктур в EOSC является необходимой мерой фактического объединения с европейскими инфраструктурами в единое виртуальное Европейское исследовательское пространство.

Поскольку правила вступления в EOSC исследовательских инфраструктур стран - членов ЕС и для ассоциированных стран пока не сформированы (первую версию предполагается представить к I кварталу 2019 г.[7]), то установить уровень вовлеченности государственной исследовательской инфраструктуры Украины в федерацию EOSC пока невозможно.

Однако, в любом случае, объединение осуществляется на основе принципов, указанных в Декларации EOSC. Одним из ее ключевых акцентов является готовность признавать принцип "Открытой науки": "доступ к данным должен быть открыт по умолчанию для всех результатов исследований, финансируемых из государственного бюджета, допуская определенные ограничения только в обоснованных случаях защиты персональных данных, конфиденциальности, прав интеллектуальной собственности, национальной безопасности и т.п."[5].

Принцип "Открытой науки" в Украине сейчас официально не применяется. Без такого официального применения ни создание UOSC, ни вовлечение государственной исследовательской инфраструктуры Украины в федерацию EOSC произойти не может.

Ссылки:

1. European Cloud Initiative - Building a competitive data and knowledge economy in Europe

https://ec.europa.eu/digital-single-market/en/news/communication-european-cloud-initiative-building-competitive-data-and-knowledge-economy-europe

2. Open Innovation, Open Science, Open to the World - a vision for Europe

https://ec.europa.eu/digital-single-market/en/news/open-innovation-open-science-open-world-vision-europe

3. COUNCIL CONCLUSIONS ON THE TRANSITION TOWARDS AN OPEN SCIENCE SYSTEM

https://data.consilium.europa.eu/doc/document/ST-9526-2016-INIT/en/pdf

4. https://www.europarl.europa.eu/sides/getDoc.do?pubRef=-//EP//TEXT+TA+P8-TA-2017-0052+0+DOC+XML+V0//EN

5. The EOSC Declaration

https://ec.europa.eu/research/openscience/pdf/eosc_declaration.pdf

6. https://ec.europa.eu/programmes/horizon2020

7. Implementation Roadmap for the European Open Science Cloud

https://ec.europa.eu/research/openscience/pdf/swd_2018_83_f1_staff_working_paper_en.pdf#view=fit&pagemode=none

8. https://www.eosc-hub.eu

9. https://eoscpilot.eu