Moscow State University Regatta community

· Regatta
· Новости
· Инструкция
· Документация
· Downloads
· Форум
· Контакты
· Ссылки



С чего начать

Запуск заданий

Запуск заданий происходит через стандартный планировщик IBM LoadLeveler. При постановке задания в очередь пользователь может указать число процессоров и максимальное время счета (по умолчанию 1 процессор и 10 минут). При наличии достаточного числа свободных процессоров задание начнет выполняться. После постановки на счет задание будет выполняться не больше указанного времени, если оно не успеет завершиться само – его удалит планировщик.
На данный момент (12.03.04) задания делятся по заказанному времени работы на три класса:
  • Short_class – задания продолжительностью до 5 минут;
  • test_class – задания продолжительностью до 31 минуты для проведения коротких тестовых расчетов;
  • nightmare — задания большей продолжительности.
    Short_class имеет приоритет перед заданиями test_class, а test_class перед заданиями nightmare.
    Если в очереди возникает задание более высокого приоритета, оно начинает выполняться, а задание с более низким приоритетом переходит в режим ожидания.

    Постановка в очередь

    Для обращения к планировщику используются специальные скрипты ompsubmit и mpisubmit.
  • Ompsubmit – для заданий, использующих OpenMP
  • Mpisubmit – для заданий, использующих MPI

    Синтаксис и семантика их использования следующие
    <имя скрипта> -w <лимит счетного времени> -n <число процессоров> <имя задания> <ее параметры>, где:
  • лимит счетного времени – предполагаемое время счета задания в формате чч:мм:сс или сс;
  • число процессоров – требуемое число процессоров.

    Обязательным параметром является только имя задания, для остальных параметров существуют умолчания. Для времени – 10 минут, для числа процессоров – 1.
    Каждому заданию планировщик присваивает уникальное имя regatta.nnnn.0, где nnnn – номер задания.
    Когда задание выполняется, потоки ее стандартного вывода и ошибок будут направлены в файлы имя_задания.nnnn.out и имя_задания.nnnn.err в каталог, из которого происходила постановка задания в очередь.
    Для постановки обычных и OpenMP заданий в очередь используется скрипт ompsubmit.
    Пример:
    ompsubmit my_program
       поставит my_program в очередь для работы на 1 процессоре, не более 10 минут.

    ompsubmit –w 25:00 –n 4 my_omp_program its_parameters
        запустит задание с использованием OpenMP на 25 минут на 4-х процессорах, и передаст ему в качестве параметров командной строки “its_parameters”.


    Для постановки заданий с использованием MPI, соответствующим образом откомпилированных используется mpisubmit.
    Пример:
    mpisubmit –w 25:00 –n 16 my_mpi_program 0.001.
        запустит задание с использованием MPI на 25 минут на 16-ти процессорах


    Просмотр состояния очереди

    Для просмотра состояния очереди используется команда llq (L строчная).
    Например:
    jesus@aix$llq
    Id              Owner   Submitted    ST  PRI    Class     Running On
    --------------------------------------------------------------------
    regatta.180.0   jesus   9/9  16:05    R   50  short_class   regata2
    regatta.181.0   jesus   9/9  16:05    R   50  test_class    regata2
    regatta.182.0   jesus   9/9  16:05    R   50  test_class    regata2
    regatta.183.0   jesus   9/9  16:05    I   50  test_class
    regatta.184.0   jesus   9/9  16:05    I   50  test_class
    
    Команда выводит на экран текущее состояние очереди. Для каждого задания выводится идентификатор задания (Id), имя владельца (Owner), дата постановки в очередь (Submitted), текущий статус (ST), приоритет при планировании (PR), класс задания (Class), машина, на которой задание выполняется (Running On).
    текущий статус (ST) может принимать следующие значения:
  • R – Run
  • ST – STart
  • I –Idle
  • E - pEnding
    Более подробную информацию можно получить по команде: llq -l
    Для конкретного задания по команде: llq –l (id задания (колонка Id)).
    Причину по которой задание не ставится на выполнение по команде: llq –s (id задания).

    Удаление задания из очереди

    Для того чтобы удалить задание из очереди, нужно воспользоваться командой llcancel (id задания).

    P.S. Для получения доступа на комплекс IBM Regatta и все замечания о работе комплекса посылайте по адресу regatta@cs.msu.su или на Форуме