|
|
С чего начать
|
|
Запуск заданий
Запуск заданий происходит через стандартный планировщик IBM LoadLeveler. При постановке задания в очередь пользователь может указать число процессоров и максимальное время счета (по умолчанию 1 процессор и 10 минут). При наличии достаточного числа свободных процессоров задание начнет выполняться. После постановки на счет задание будет выполняться не больше указанного времени, если оно не успеет завершиться само – его удалит планировщик.
На данный момент (12.03.04) задания делятся по заказанному времени работы на три класса:
Short_class – задания продолжительностью до 5 минут;
test_class – задания продолжительностью до 31 минуты для проведения коротких тестовых расчетов;
nightmare — задания большей продолжительности.
Short_class имеет приоритет перед заданиями test_class, а test_class перед заданиями nightmare.
Если в очереди возникает задание более высокого приоритета, оно начинает выполняться, а задание с более низким приоритетом переходит в режим ожидания.
Постановка в очередь
Для обращения к планировщику используются специальные скрипты ompsubmit и mpisubmit.
Ompsubmit – для заданий, использующих OpenMP
Mpisubmit – для заданий, использующих MPI
Синтаксис и семантика их использования следующие
<имя скрипта> -w <лимит счетного времени> -n <число процессоров> <имя задания> <ее параметры>,
где:
лимит счетного времени – предполагаемое время счета задания в формате чч:мм:сс или сс;
число процессоров – требуемое число процессоров.
Обязательным параметром является только имя задания, для остальных параметров существуют умолчания. Для времени – 10 минут, для числа процессоров – 1.
Каждому заданию планировщик присваивает уникальное имя regatta.nnnn.0, где nnnn – номер задания.
Когда задание выполняется, потоки ее стандартного вывода и ошибок будут направлены в файлы имя_задания.nnnn.out и имя_задания.nnnn.err в каталог, из которого происходила постановка задания в очередь.
Для постановки обычных и OpenMP заданий в очередь используется скрипт ompsubmit.
Пример:
ompsubmit my_program
поставит my_program в очередь для работы на 1 процессоре, не более 10 минут.
ompsubmit –w 25:00 –n 4 my_omp_program its_parameters
запустит задание с использованием OpenMP на 25 минут на 4-х процессорах, и передаст ему в качестве параметров командной строки “its_parameters”.
|
Для постановки заданий с использованием MPI, соответствующим образом откомпилированных используется mpisubmit.
Пример:
mpisubmit –w 25:00 –n 16 my_mpi_program 0.001.
запустит задание с использованием MPI на 25 минут на 16-ти процессорах
|
Просмотр состояния очереди
Для просмотра состояния очереди используется команда llq (L строчная).
Например:
jesus@aix$llq
Id Owner Submitted ST PRI Class Running On
--------------------------------------------------------------------
regatta.180.0 jesus 9/9 16:05 R 50 short_class regata2
regatta.181.0 jesus 9/9 16:05 R 50 test_class regata2
regatta.182.0 jesus 9/9 16:05 R 50 test_class regata2
regatta.183.0 jesus 9/9 16:05 I 50 test_class
regatta.184.0 jesus 9/9 16:05 I 50 test_class
Команда выводит на экран текущее состояние очереди. Для каждого задания выводится идентификатор задания (Id), имя владельца (Owner), дата постановки в очередь (Submitted), текущий статус (ST), приоритет при планировании (PR), класс задания (Class), машина, на которой задание выполняется (Running On).
текущий статус (ST) может принимать следующие значения:
R – Run
ST – STart
I –Idle
E - pEnding
Более подробную информацию можно получить по команде: llq -l
Для конкретного задания по команде: llq –l (id задания (колонка Id)).
Причину по которой задание не ставится на выполнение по команде: llq –s (id задания).
Удаление задания из очереди
Для того чтобы удалить задание из очереди, нужно воспользоваться командой llcancel (id задания).
P.S.
Для получения доступа на комплекс IBM Regatta и все замечания о работе комплекса посылайте по адресу regatta@cs.msu.su или на Форуме
|
|