Следующие разделы посвящены задачам ведения протокола ошибок и содержат информацию по работе со средством ведения протокола ошибок:
Для получения отчета о всех ошибках, обнаруженных в течение суток, предшествовавших сбою, введите следующую команду:
errpt -a -s ммддччммгг | pg
где ммддччммгг - месяц, день, час, минута и год суток, предшествовавших сбою.
Отчет об ошибках содержит следующую информацию:
Примечание: Для некоторых ошибок может быть получена не вся информация.
Некоторые ошибки можно исключить из отчета. Для просмотра ошибок, исключенных из отчета, введите команду:
errpt -t -F report=0 | pg
Если такие ошибки есть, включите в отчет все ошибки с помощью команды errupdate.
Некоторые ошибки могут не регистрироваться в протоколе. Для просмотра ошибок, исключенных из протокола, введите команду:
errpt -t -F log=0 | pg
Если такие ошибки есть, включите регистрацию в протоколе для всех ошибок с помощью команды errupdate. Регистрация всех ошибок в протоколе необходима для воссоздания ошибки системы.
Ниже приведен пример записей отчета об ошибках, созданного с помощью команды errpt -a.
Класс ошибки H и тип ошибки PERM означают, что в системе была обнаружена ошибка устройства (драйвера адаптера SCSI), которую не удалось устранить.
С этим типом ошибки могут быть связаны данные диагностики.
Эта информация находится в конце сообщения об ошибке.
МЕТКА: SCSI_ERR1 ИД: 0502F666
Дата/Время: Jun 19 22:29:51 Порядковый номер: 95 ИД системы: 123456789012 ИД узла: host1 Класс: H Тип: PERM Имя ресурса: scsi0 Класс ресурса: adapter Тип ресурса: hscsi Расположение: 00-08 VPD: Device Driver Level.........00 Diagnostic Level............00 Displayable Message.........SCSI EC Level....................C25928 FRU Number..................30F8834 Manufacturer................IBM97F Part Number.................59F4566 Serial Number...............00002849 ROS Level and ID............24 Read/Write Register Ptr.....0120
Описание ADAPTER ERROR
Возможные причины ADAPTER HARDWARE CABLE CABLE TERMINATOR DEVICE
Возможные сбои ADAPTER CABLE LOOSE OR DEFECTIVE
Рекомендуемые действия PERFORM PROBLEM DETERMINATION PROCEDURES CHECK CABLE AND ITS CONNECTIONS
Подробные сведения SENSE DATA 0000 0000 0000 0000 0000 0000 0000 0000 0000 0000 0000 0000
Порядковый номер протокола диагностики: 153 Проверенный ресурс: scsi0 Описание ресурса: SCSI I/O Controller Расположение: 00-08 SRN: 889-191 Описание: Анализ протокола ошибок указывает на неполадку аппаратного обеспечения. Возможные FRU: Шина SCSI FRU: нет 00-08 Вентилятор SCSI2 FRU: 30F8834 00-08 Контроллер ввода-вывода SCSI
Класс ошибки H и тип ошибки PEND означают, что устройство (Token Ring) может в ближайшее время стать недоступным из-за большого количества ошибок, обнаруженных системой.
МЕТКА: TOK_ESERR ИД: AF1621E8
Дата/Время: Jun 20 11:28:11 Порядковый номер: 17262 ИД системы: 123456789012 ИД узла: host1 Класс: H Тип: PEND Имя ресурса: TokenRing Класс ресурса: tok0 Тип ресурса: Adapter Расположение TokenRing
Описание EXCESSIVE TOKEN-RING ERRORS
Возможные причины TOKEN-RING FAULT DOMAIN
Возможные сбои TOKEN-RING FAULT DOMAIN
Рекомендуемые действия REVIEW LINK CONFIGURATION DETAIL DATA CONTACT TOKEN-RING ADMINISTRATOR RESPONSIBLE FOR THIS LAN
Подробные сведения SENSE DATA 0ACA 0032 A440 0001 0000 0000 0000 0000 0000 0000 0000 0000 0000 0000 2080 0000 0000 0010 0000 0000 0000 0000 0000 0000 0000 0000 0000 0000 78CC 0000 0000 0005 C88F 0304 F4E0 0000 1000 5A4F 5685 1000 5A4F 5685 3030 3030 0000 0000 0000 0000 0000 0000 0000 0000 0000 0000 0000 0000 0000 0000 0000 0000 0000 0000 0000 0000 0000 0000 0000 0000 0000 0000 0000 0000 0000 0000 0000 0000 0000 0000 0000 0000 0000 0000 0000 0000
Класс ошибки S и тип ошибки PERM означают, что в системе была обнаружена ошибка программного обеспечения, которую не удалось устранить.
МЕТКА: DSI_PROC ИД: 20FAED7F
Дата/Время: Jun 28 23:40:14 Порядковый номер: 20136 ИД системы: 123456789012 ИД узла: 123456789012 Класс: S Тип: PERM Имя ресурса: SYSVMM
Описание Data Storage Interrupt, Processor
Возможные причины SOFTWARE PROGRAM
Возможные сбои SOFTWARE PROGRAM
Рекомендуемые действия IF PROBLEM PERSISTS THEN DO THE FOLLOWING CONTACT APPROPRIATE SERVICE REPRESENTATIVE
Подробные сведения Data Storage Interrupt Status Register 4000 0000 Data Storage Interrupt Address Register 0000 9112 Segment Register, SEGREG D000 1018 EXVAL 0000 0005
Класс ошибки S и тип ошибки TEMP означают, что в системе была обнаружена ошибка программного обеспечения. После нескольких попыток системе удалось устранить неполадку.
МЕТКА: SCSI_ERR6 ИД: 52DB7218
Дата/Время: Jun 28 23:21:11 Порядковый номер: 20114 ИД системы: 123456789012 ИД узла: host1 Класс: S Тип: INFO Имя ресурса: scsi0
Описание SOFTWARE PROGRAM ERROR
Возможные причины SOFTWARE PROGRAM
Возможные сбои SOFTWARE PROGRAM
Рекомендуемые действия IF PROBLEM PERSISTS THEN DO THE FOLLOWING CONTACT APPROPRIATE SERVICE REPRESENTATIVE
Подробные сведения SENSE DATA 0000 0000 0000 0000 0000 0011 0000 0008 000E 0900 0000 0000 FFFF FFFE 4000 1C1F 01A9 09C4 0000 000F 0000 0000 0000 0000 FFFF FFFF 0325 0018 0040 1500 0000 0000 0000 0000 0000 0000 0000 0000 0800 0000 0100 0000 0000 0000 0000 0000 0000 0000 0000 0000 0000 0000 0000 0000
Класс ошибки O означает информационное сообщение.
МЕТКА: OPMSG ИД: AA8AB241
Дата/Время: Jul 16 03:02:02 Порядковый номер: 26042 ИД системы: 123456789012 ИД узла: host1 Класс: O Тип: INFO Имя ресурса: OPERATOR
Описание OPERATOR NOTIFICATION
Ошибки пользователя errlogger COMMAND
Рекомендуемые действия REVIEW DETAILED DATA
Подробные сведения MESSAGE FROM errlogger COMMAND hdisk1: Анализ протокола ошибок указывает на неполадку аппаратного обеспечения.
Ниже приведен пример краткого отчета об ошибках, созданного с помощью команды errpt. Каждой записи об ошибке соответствует одна строка информации.
ERROR_ ИДЕНТИФИКАТОР СИСТЕМНОЕ_ВРЕМЯ Т КЛ ИМЯ_РЕСУРСА ОПИСАНИЕ_ОШИБКИ 192AC071 0101000070 I 0 errdemon Ведение протокола ошибок выключено 0E017ED1 0405131090 P H mem2 Сбой памяти 9DBCFDEE 0101000070 I 0 errdemon Ведение протокола ошибок включено 038F2580 0405131090 U H scdisk0 НЕОПРЕДЕЛЕННАЯ ОШИБКА AA8AB241 0405130990 I O OPERATOR ИЗВЕЩЕНИЕ ОПЕРАТОРА
Выполните следующие действия, чтобы создать отчет об ошибках программного обеспечения или неполадках аппаратного обеспечения.
errpt -a
Команда errpt создает отчет об ошибках из записей системного протокола ошибок.
Если протокол ошибок пуст, ведение протокола ошибок было отключено. Активизируйте средство ведения протокола ошибок с помощью следующей команды:
/usr/lib/errdemon
Примечание: Для запуска этой команды необходимы права доступа пользователя root.
Демон errdemon запускает ведение протокола ошибок. Если демон не работает, протокол ошибок не ведется.
errpt -N hdisk1
smit errpt
Выберите 1, чтобы направить отчет об ошибках в стандартный вывод, или 2, чтобы отправить отчет на принтер.
Выберите yes, чтобы просматривать или распечатывать записи протокола ошибок по мере из добавления, в противном случае выберите no.
Укажите нужное имя устройства в опции Выбрать имена ресурсов (например hdisk1).
В данном разделе описано завершение работы средства ведения протокола ошибок. Как правило, нет необходимости отключать средство ведения протокола ошибок. Вместо этого следует удалить из протокола ошибок старые и ненужные записи. Инструкции по очистке протокола ошибок приведены в разделе Очистка протокола ошибок.
Средство ведения протокола ошибок следует отключать при установке или проверке нового программного или аппаратного обеспечения. В этом случае демон ведения протокола ошибок не будет отнимать время центрального процессора на регистрацию известных вам ошибок.
Примечание: Для запуска применяемой в этой процедуре команды у вас должны быть права доступа пользователя root.
Введите команду errstop, чтобы отключить ведение протокола ошибок:
errstop
Команда errstop завершает работу демона ведения протокола.
Этот раздел содержит информацию по удалению из протокола ошибок старых и ненужных записей. Обычно очистка протокола автоматически выполняется ежедневно с помощью команды cron.
Если эта процедура не выполняется автоматически, следует время от времени очищать протокол ошибок вручную, предварительно проверив его на наличие записей о серьезных неполадках.
Кроме того, можно удалить записи о конкретных ошибках. Например, после замены дискового накопителя можно удалить из протокола ошибок записи об ошибках старого дискового накопителя.
Для удаления всех записей протокола ошибок выполните одно из следующих действий:
errclear -d S 0
Команда errclear удаляет из протокола ошибок записи, внесенные раньше определенного числа дней. В предыдущем для удаления всех записей указано значение 0.
smit errclear
Выполните следующие действия, чтобы скопировать протокол ошибок:
ls /var/adm/ras/errlog | backup -ivp
ls /var/adm/ras/errlog | backup -ivpf/dev/rmt0
ИЛИ
Примечание: Для запуска команды snap у вас должны быть права доступа пользователя root.
snap -a -o /dev/rfd0
В этом примере для сбора всей информации о конфигурации системы в команде snap указан флаг -a. Флаг -o позволяет скопировать сжатый файл tar на указанное устройство. /dev/rfd0 указывает дисковод.
Введите следующую команду, чтобы собрать всю информацию о конфигурации в файле tar и скопировать его на магнитную ленту:
snap -a -o /dev/rmt0
/dev/rmt0 указывает лентопротяжное устройство.
Дополнительная информация приведена в описании команды snap в книге AIX 5L Version 5.1 Commands Reference.