Хранилище цифровых данных ЦЕРН. Если всю информацию, получаемую от нового церновского ускорителя за год, записывать на CD-ROM, то высота этой стопки компакт-дисков составит 20 км.
Фото: www.cern.ch/openlab
– Владимир Васильевич, что же такое GRID?
– Название GRID (сеть) взято по аналогии с электрическими сетями – electric power grid. Если попробовать сформулировать определение, то современный электронный GRID – это система, которая координирует использование глобальных ресурсов при отсутствии централизованного управления этими ресурсами; использует стандартные и универсальные протоколы и интерфейсы, обеспечивает высококлассное обслуживание. Современные GRID-системы уже сейчас объединяют значительные ресурсы, расположенные в различных научных и технологических центрах, институтах, университетах мира. Они включают отдельные компьютеры, кластеры, локальные сети, суперкомпьютеры, хранилища информации, коммуникации, программные пакеты и инструментарий.
Хотелось бы подчеркнуть, что на данном этапе речь идет прежде всего о глобализации использования ресурсов на качественно новом уровне. Степень развития GRID пока позволяет лишь существенно расширить возможности использования компьютерных ресурсов, но, как правило, не избавляет ученых от необходимости самостоятельно доводить свою задачу до уровня программного продукта – за исключением тех случаев, когда программное приложение уже разработано и внедрено в структуру GRID.
Также следует понимать, что глобальные ресурсы объединяются (и эта тенденция, безусловно, будет сохранена и в дальнейшем) по направленности ведущихся исследований: крупные эксперименты физики высоких энергий, биологические разработки, медицинская диагностика. Такое объединение ресурсов в GRID называется «виртуальная организация» и соответствующим образом администрируется в среде GRID.
– Сейчас в арсенале математиков есть метод распределенных вычислений, когда пользователи, находящиеся в различных офисах, могут работать с одним и тем же набором географически распределенных ресурсов. Чем принципиально отличается от него GRID?
– GRID – это качественное развитие системы распределенных вычислений, которая основана на наиболее целесообразном использовании ресурсов. В обычной системе распределенных вычислений пользователь может работать только с теми ресурсами, где он зарегистрирован, при этом он должен точно знать, где находятся его программы и данные. В GRID пользователь получает доступ к ресурсам как специальный электронный сертификат, а эта «умная» система сама регулирует поиск свободных ресурсов, обращение к хранилищам данных в рамках своей виртуальной организации. Каждый GRID-сайт предоставляет свои ресурсы только определенным виртуальным организациям.
Например, ОИЯИ заинтересован в решении задач моделирования и обработки информации с установок, находящихся в Женеве, в Европейском центре ядерных исследований (ЦЕРН) – CMS, ATLAS, ALICE, и других физических экспериментов, в решении задач биофизики. Поэтому мы предоставляем свои ресурсы этим виртуальным организациям, а сами, в свою очередь, можем использовать их ресурсы – на данный момент это около ста крупных вычислительных фирм в различных научных учреждениях на разных континентах.
– Какая страна является лидером в использовании GRID?
– Буквально до недавнего времени – США. Американским ученым принадлежат инициатива и первенство в осуществлении этой идеи. Ее авторы – сотрудник Арагонской национальной лаборатории Чикагского университета Ян Фостер и сотрудник Института информатики Университета Южной Калифорнии Карл Кессельман. Там уже работают несколько GRID-систем, в основном они ориентированы на уникальные научные вычислительные задачи. Крупнейшая из них – TeraGrid – объединяет четыре суперкомпьютера – два на Восточном побережье и два на Западном, соединенных 40-гигабитными каналами связи. Проект финансируется Национальным научным фондом с бюджетом больше сотни миллионов долларов.
Благодаря успешным проектам к уровню Америки в последнее время приближается и Европа. Вообще сейчас трудно назвать крупную страну, которая не участвует в процессе развития GRID-технологии.
– Расскажите немного подробнее о европейских проектах, в которых участвуют ОИЯИ и другие российских научные центры.
Многоярусная структура Grid. Годовой поток информации с детекторов ускорителя LHC составит примерно 10 миллионов гигабайт. Именно поэтому возникла необходимость организации отдельного проекта LHC Computing Grid. |
Россия активно участвует в крупнейшем международном проекте по физике высоких энергий – создании ускорителя элементарных частиц – большого адронного коллайдера (LHC) в ЦЕРНе. Первые экспериментальные данные планируется получить в 2007 году, к этому времени должна быть создана соответствующая информационно-вычислительная система, работа над ней уже активно ведется. Базовые параметры такие: процессорная мощность примерно 200 Терафлопс (2 х 1014 операций в секунду), объем дисковой памяти – десятки и сотни Петабайт (1016 байт). Информация с детекторов LHC будет направляться для обработки и анализа в региональные вычислительные центры.
Реализацией этих важных задач занимается в настоящее время крупный международный проект LCG (LHC Computing Grid), который уже стал полигоном для испытания GRID-технологий. В рамках этого проекта в России планируется создание мощной инфраструктуры: в НИИЯФ МГУ создан Сертификационный центр, а часть компьютерных ресурсов российских центров и ОИЯИ стали составной частью нескольких виртуальных организаций. При создании LCG-сегмента наши специалисты совместно с зарубежными коллегами активно участвуют в создании программного обеспечения для среды LCG.
И, наконец, в Европе развивается проект создания глобальной компьютерной инфраструктуры GRID – EGEE (Enabling Grids for E-science in Europe), доступной 24 часа в сутки. В нем участвуют 70 институтов из 28 стран мира. Согласно принятой в EGEE структуре Россия входит в проект в качестве одной из федераций.