Процессор Intel Itanium 2 — оптимальное решение "проблемы больших размерностей"

Процессор Intel Itanium 2 — оптимальное решение "проблемы больших размерностей"
Новость

26 декабря 2003, 14:54
А. Троянов, к.т.н., независимый эксперт Решение ряда задач, стоящих перед нефтегазовыми и сервисными компаниями, сегодня невозможно без применения высокопроизводительных вычислительных систем. Последние разработки компании Intel в области микропроцессоров на базе архитектуры многопоточных параллельных вычислений не только ставят рекорды в соотношении цена-производительность, но и открывают весьма перспективное направление совершенствования этих вычислительных систем.

А. Троянов, к.т.н., независимый эксперт

Решение ряда задач, стоящих перед нефтегазовыми и сервисными компаниями, сегодня невозможно без применения высокопроизводительных вычислительных систем. Последние разработки компании Intel в области микропроцессоров на базе архитектуры многопоточных параллельных вычислений не только ставят рекорды в соотношении цена-производительность, но и открывают весьма перспективное направление совершенствования этих вычислительных систем.

Роль высокопроизводительных вычислительных систем в процессах автоматизации деятельности отечественных нефтегазовых и сервисных компаний трудно переоценить. Достаточно сказать, что прогресс геофизических технологий за последние 10-15 лет позволил повысить более чем в 2 раза достоверность прогнозов по нефтеизвлечению, доведя этот показатель до 65-75% [1]. Эти достижения базировались на сложных математических моделях строения месторождений и обработки результатов сейсмических наблюдений, численная реализация которых возможна только на вычислительных комплексах большой производительности.

Но требования бизнеса не позволяют останавливаться на достигнутых результатах. Кроме необходимости дальнейшего повышения достоверности прогнозов по извлечению углеводородного сырья (УВС) в последние годы сформировалась еще одна задача — вложения в передовые технологии должны приносить значимый экономический эффект. Применительно к программно-аппаратным комплексам большой производительности это означает, что инвестиции в них должны окупаться в кратчайшие сроки.

В последние годы с ростом производительности этих вычислительных комплексов расширяется спектр их применения для задач нефтегазовой отрасли. Потребность в компьютерах большой мощности стала ощущаться при решении задач автоматизации технологических процессов в нефтепереработке [2], сбыте нефтепродуктов в сети АЗК, а также в управлении ресурсами предприятия, построении ГИС с использованием аэрокосмических данных дистанционного зондирования Земли [3] и др. Если попытаться обобщить области возможного применения высокопроизводительных вычислительных систем на предприятиях НГК, то это будут задачи, при решении которых приходится сталкиваться с т.н. «проблемой больших размерностей».

Настоящим прорывом в решении этой проблемы явились последние разработки компании Intel в области архитектуры микропроцессоров, базирующейся на многопоточных параллельных вычислениях.

Резервы повышения быстродействия

Традиционные архитектуры процессоров. Архитектура всех типов современных процессоров подразумевает в той или иной степени одновременное выполнение команд. Применение конвейера, например, позволяет, не дожидаясь прохождения предыдущей инструкцией всех этапов, начать обработку следующей и т.д. В идеале это дает существенный прирост производительности, если только последующая команда не зависит от результата предыдущей. Иначе дальнейшее выполнение кода программы приостанавливается до завершения предыдущей инструкции.

Чтобы преодолеть эту трудность, в процессоры были встроены сложные механизмы переупорядочения инструкций, блоки предсказания ветвлений, переименования регистров и др. хитроумные решения, благодаря которым разработчикам традиционных RISC и CISC-архитектур удалось достичь некоторой параллельности вычислений. В результате этого микропроцессоры (МП) традиционных архитектур стали осуществлять распараллеливание исполняющегося последовательного кода «на лету».

Однако необходимо отметить, что пытаться распараллеливать последовательный код в процессоре не самый оптимальный вариант, т.к. при этом:требуются большие аппаратные ресурсы (заметно усложняется структура чипа, что приводит к препятствиям в повышении скорости работы); не гарантируется оптимальный результат преобразования кода (МП распараллеливает лишь небольшой фрагмент кода, поступающего на выполнение).

Архитектура Intel Itanium (IA-64). Если заложить параллелизм на этапе компиляции, можно избежать всех перечисленных недостатков. Ведь при разработке программного обеспечения можно один раз потратить много времени и создать качественный машинный код. Это гораздо лучше, чем пытаться за доли секунды уже в процессоре распараллеливать поток инструкций. Важным достоинством такого подхода является то, что для возможной оптимизации компилятору доступна вся программа целиком, а не малый фрагмент.

Другими словами, выход из этой ситуации состоит в принципиальной смене архитектуры и переходе к настоящему параллелизму на уровне инструкций. Поэтому в июне 1994 года начались совместные научные исследования компаний Intel и Hewlett-Packard по разработке новой 64-разрядной архитектуры явно параллельных вычислений. Первые опытные образцы процессоров архитектуры IA-64 были разработаны в августе 1999 года.

Одно из нововведений архитектуры IA-64 состоит в использовании предикативных вычислений, которые намного сокращают количество условных переходов, так снижающих производительность МП. Каждая инструкция может содержать предикат, который показывает, выполнять эту команду или игнорировать. Предыдущие по ходу программы условные операторы могут устанавливать значения предикатов. За счет такой организации кода он становится «сквозным» и не содержит столь вредных условных переходов.

Важным достоинством новой архитектуры является ее способность сохранять инвестиции в аппаратные средства предыдущего поколения. Полное изменение архитектуры микропроцессора не означает, что программы для более старой архитектуры IA-32 не будут выполняться процессором Itanium. Архитектура МП такова, что он может выполнять как программы для архитектуры х86, так и 64-разрядные программы.

Процессор Intel Itanium 2

В июле 2002 года компания Intel представила процессор следующего поколения в семействе Intel Itanium — Intel® Itanium® 2 (фото 1) на базе новой прогрессивной архитектуры IA-64 с явным параллелизмом на уровне команд. В МП также реализованы и другие достижения лидера мировой электроники. Об этом лучше всего говорят количественные характеристики (табл.1).

Инструкции, обрабатываемые шестью конвейерами глубиной 8 команд, непосредственно выполняются в 23 функциональных блоках: 6 целочисленных модулей; 2 модуля для вычислений с плавающей точкой; 2 модуля для вычислений с плавающей точкой двойной точности; 6 модулей для обработки мультимедийных команд; 4 модуля, управляющих загрузкой и выгрузкой данных; 3 модуля ветвлений.

Такое распределение модулей подобрано на основе результатов исследований по оптимизации потребностей в вычислительных ресурсах приложений, характерных для корпоративных СУБД и сложных инженерных расчетов. При этом команды практически не «задерживаются» в ожидании, пока освободится нужный исполняющий модуль.

Новый МП Intel® Itanium® 2 позволяет также поднять производительность за счет обработки данных большего 64-разрядного формата. Кроме того, архитектура IA-64 позволяет преодолеть одну из главных трудностей современных 32-разрядных процессоров — непосредственную адресацию только 4 Гбайт. Процессор Intel® Itanium® 2 может напрямую работать с 16 Тбайтами оперативной памяти.

Ширина системной шины, по которой осуществляется взаимодействие нескольких процессоров друг с другом и доступ к памяти, увеличена до 128 бит, что также кардинально повышает производительность МП.

Кэш — быстродействующая внутренняя память процессора — используется для динамического хранения кода и данных, задействованных в вычислениях в текущий момент. Загрузка часто используемых данных и фрагментов кода в кэш позволяет существенно поднять производительность. Доступ к кэшу в несколько раз быстрее, чем к «медленной» оперативной памяти, и составляет 48 Гбайт/сек.

Объем кэша процессора Intel® Itanium® 2 достигает рекордного на сегодняшний день значения — 6 Мбайт. Столь большая внутренняя память занимает более 2/3 площади кристалла процессора, выполненного по технологии 0,13 микрон.

Кластерные технологии на базе МП Intel® Itanium® 2

Компания Schlumberger Information Solutions (SIS) разработала кластерные решения [4] на базе архитектуры Intel, призванные упростить и ускорить процесс развертывания вычислительных систем для решения сложных задач моделирования месторождений УВС. В число первых сертифицированных конфигураций вошли кластеры HP ClusterBlocks под управлением ОС Linux. Эти вычислительные кластерные решения (фото 2), базирующиеся на серверах HP Integrity rx2600, позволяют нефтегазовым компаниям осуществлять быструю обработку больших объемов данных, используя программное решение ECLIPSE Parallel компании SIS.

Программное обеспечение ECLIPSE Parallel версии 2003 года было оптимизировано для работы на системах на базе процессоров Intel Itanium 2 под управлением ОС Red Hat Linux Advanced Server 2.1 и обеспечивает формирование требуемого количества вычислительных процессов на каждом МП кластера под управлением ОС Linux. Для реализации технологии явного параллелизма выполнения команд EPIC (Explicitly Parallel Instruction Computing) на базе процессоров семейства Itanium используются компиляторы Intel языков высокого уровня Fortran и C версий 7.0.

Согласованность выполнения расчетов обеспечивается связью между процессами. Моделирование месторождений УВС требует постоянного обмена данными между процессами. Это значит, что процессоры должны быть соединены между собой каналами с высокой пропускной способностью и низким уровнем задержек. В решении компании SIS используется технология Myrinet 2000* и MPICH/GM* — оптимизированный драйвер интерфейса передачи сообщений MPI (Message Passing Interface) компании Myricom*. Технология Myrinet 2000 обеспечивает полнодуплексное соединение между узлами параллельной вычислительной системы с пропускной способностью 2 Гбит/сек.; задержка при прохождении сигнала туда-обратно обычно составляет менее 10 мкс.

В многопользовательской среде часто требуется управление распределением рабочей нагрузки и очередями пакетных заданий. В программе ECLIPSE Office предусмотрена связь с библиотеками ПО распределения вычислительной нагрузки LSF (Load Scheduling Facility) компании Platform Computing, которое обеспечивает максимально эффективное использование имеющихся аппаратных средств.

Серверы HP можно легко модернизировать по мере появления новых процессоров. Новые модели МП Intel® Itanium® 2 без проблем устанавливаются в разъемы процессоров существующих серверов Integrity rx2600.

Результаты испытания

В технологическом центре компании Schlumberger в г. Абингдон, Великобритания, было проведено специальное тестирование этого ПО на серверах HP на базе процессоров Intel® Itanium® 2. Позитивные результаты этого тестирования позволяют компаниям HP и SIS развертывать и поддерживать по всему миру сертифицированное и полностью готовое к эксплуатации решение на базе кластеров HP ClusterBlocks, построенных из серверов HP Integrity rx2600.

Кластеры HP ClusterBlocks демонстрируют наивысшую производительность (рис. 1), а показатель цена-производительность для кластеров HP ClusterBlocks на базе серверов Integrity rx2600 (табл. 2 и рис. 2) более чем вдвое ниже соответствующего показателя для систем IBM. Серверы семейства HP Proliant на базе процессоров Intel Xeon могут быть несколько более выгодными с точки зрения показателя цена-производительность при тех же эксплуатационных характеристиках, если не предполагается обрабатывать большие по объему модели.С точки зрения пользователя

Работа в среде ПО ECLIPSE Parallel на многопроцессорной вычислительной системе или на вычислительном кластере под управлением ОС Linux очень похожа на работу на однопроцессорной системе. Процесс обработки модели начинается обычным способом из ПО ECLIPSE Office, которое либо отправляет задачу на расчет немедленно, либо, в предпочтительном варианте, ставит ее в очередь на пакетную обработку.

Результаты расчетов передаются, если это необходимо, на терминал и сохраняются в стандартных выходных файлах. Все результаты моделирования можно анализировать с использованием имеющихся средств анализа.

Эффект внедрения

В настоящее время ПО ECLIPSE Parallel используется многими компаниями по всему миру. Это решение, построенное на базе наиболее высокопроизводительных и экономичных решений Intel® Itanium® 2, обеспечивает заказчикам целый ряд преимуществ:

Быстрое получение результатов. Сокращение времени обработки модели месторождения позволяет выполнять большее количество вычислительных циклов и анализировать большие объемы результатов, повышая тем самым качество принимаемых решений. Время обработки сложной модели на системе из 16 узлов на базе процессоров Intel® Itanium® 2 может сокращаться в более чем 10 раз по сравнению с последовательной обработкой на однопроцессорных системах — то есть типичный 48- часовой расчет может быть выполнен менее чем за 5 часов. Более точные результаты. Возможность обрабатывать более объемные модели с более высокой точностью за данный промежуток времени позволяет получать лучшие результаты и более достоверные прогнозы. Это создает условия для оптимизации программ бурения скважин и уменьшения риска неудачного выбора места бурения (существенный фактор для успешности бизнеса, поскольку бурение одной скважины обходится более чем в $10 млн). Снижение риска. Более частое выполнение моделирования позволяет получить более четкое представление об объемах извлекаемых запасов при различных сценариях разработки и добычи. Быстрое реагирование на изменение рыночной ситуации. Возможность быстрого анализа сценариев позволяет компаниям эффективно использовать новые рыночные возможности по мере их появления. Более низкая совокупная стоимость владения. Основанное на отраслевых стандартах решение на базе архитектуры Intel обладает более низкой стоимостью, требует меньшего количества специалистов для обслуживания и предоставляет значительные возможности для расширения и модернизации.

Кроме того, использование отраслевых стандартов архитектуры МП и аппаратных средств корпорации Intel дает ряд следующих дополнительных преимуществ:высочайшая производительность; показатель цена-производительность может быть во много раз ниже, чем у предшествовавших технологий; простота модернизации с использованием стандартных процессоров по мере их выпуска; более широкий выбор специалистов на рынке труда; возможность перевода кластера под управление другой операционной системы, например Microsoft Windows* или HP UX; возможность применения систем в других подразделениях предприятия, когда появится возможность установить новые, еще более быстродействующие решения на базе архитектуры Intel.

Применение вычислительных комплексов на основе процессоров Intel® Itanium® 2, объединенных в кластеры HP ClusterBlocks, вместо суперкомпьютеров RISC-архитектуры, позволяет обеспечить требуемую производительность, максимальную надежность, готовность и обслуживаемость. Высокие показатели соотношения цены и производительности, а также масштабируемости и сохранения инвестиций в предыдущие версии МП Intel, обеспечивают дальнейшее совершенствование этого решения в будущем.

Литература

1. Современные технологии и методы нефтегазовой геофизики. НТЖ «Технологии ТЭК», №3 (июнь) 2003г., с. 4-5.

2. И.Сунчелей, Т.Гартман. Анализ стратегии экономической оптимизации технологических процессов при интеграции АСУ П и АСУ ТП для непрерывных производств. Там же, №5 (октябрь) 2003 г., с.56-64.

3. А. Врагов, А.Денисов. Автоматизированная обработка аэрокосмических данных дистанционного зондирования Земли. Там же, №3 (июнь) 2003 г., с.68-72.

4. А.Троянов. Оптимизация моделирования нефтегазовых месторождений на базе кластеров из серверов стандартной архитектуры. НТЖ «Технологии ТЭК», декабрь 2002 г., с. 84-88.

5. База данных IDEAS на сайте www.ideasinternational.com

Found a typo in the text? Select it and press ctrl + enter