Однажды после подключение нескольких трансиверов 40G в устройства Juniper QFX5100 и MX204 на syslog сервер начали приходить сообщения с этих устройств:
fpc0 qsfp-0/0/0: Temperature low warning cleared
fpc0 qsfp-0/0/0: Temperature low alarm cleared
fpc0 qsfp-0/0/0: Temperature low warning set
При этом судя по графику в Zabbix, температура оптического модуля была стабильно 24 градуса, а порог для срабатывания warning/alarm 0/-5 градусов, что не возможно, так как устройства находились в дата центре со стабильной температурой 20-21 градусов Цельсия.
show interfaces diagnostics optics et-0/0/0 | match "Module temperature"
Module temperature : 24 degrees C / 74 degrees F
Module temperature high alarm : Off
Module temperature low alarm : Off
Module temperature high warning : Off
Module temperature low warning : Off
Module temperature high alarm threshold : 78 degrees C / 172 degrees F
Module temperature low alarm threshold : -5 degrees C / 23 degrees F
Module temperature high warning threshold : 75 degrees C / 167 degrees F
Module temperature low warning threshold : 0 degrees C / 32 degrees F
Еще логи от другого трансивера, на этом их больше:
fpc0 qsfp-0/0/0 Chan# 1: Rx power low warning cleared "
fpc0 qsfp-0/0/0 Chan# 1: Rx power low alarm cleared "
fpc0 qsfp-0/0/0 Chan# 0: Rx power low warning cleared "
fpc0 qsfp-0/0/0 Chan# 0: Rx power low alarm cleared "
fpc0 qsfp-0/0/0 Chan# 3: Rx loss cleared "
fpc0 qsfp-0/0/0 Chan# 3: Rx power low warning cleared "
fpc0 qsfp-0/0/0 Chan# 3: Rx power low alarm cleared "
fpc0 qsfp-0/0/0 Chan# 2: Rx loss cleared "
fpc0 qsfp-0/0/0 Chan# 2: Rx power low warning cleared "
fpc0 qsfp-0/0/0 Chan# 2: Rx power low alarm cleared "
fpc0 qsfp-0/0/0: Temperature low warning cleared "
fpc0 qsfp-0/0/0: Temperature low alarm cleared "
fpc0 qsfp-0/0/0 Chan# 3: Rx power low warning set "
fpc0 qsfp-0/0/0 Chan# 3: Rx power low alarm set "
fpc0 qsfp-0/0/0 Chan# 2: Rx power low warning set "
fpc0 qsfp-0/0/0 Chan# 2: Rx power low alarm set "
fpc0 qsfp-0/0/0 Chan# 1: Rx power low warning set "
fpc0 qsfp-0/0/0 Chan# 1: Rx power low alarm set "
fpc0 qsfp-0/0/0 Chan# 0: Rx power low warning set "
fpc0 qsfp-0/0/0 Chan# 0: Rx power low alarm set "
fpc0 qsfp-0/0/0: Temperature low warning set "
fpc0 qsfp-0/0/0: Temperature low alarm set "
mib2d[2071]: SNMP_TRAP_LINK_DOWN: ifIndex 517, ifAdminStatus up(1), ifOperStatus down(2), ifName et-0/0/0"
Такие события в логах наблюдались пару раз в день, даже был случай когда пропал и поднялся линк, после этого трансивер заменили на трансивер другого производителя (заказывали у компании OmniLink), после этого подобные сообщения в логах больше не появлялись.
Также видел информацию о том что подобная проблема с ложными срабатываниями была у производителя FINISAR CORP., который исправил ее в новых версиях прошивки, в моем же случае на проблемных трансиверах в поле производитель указано OEM:
show chassis hardware |find FPC
FPC 0
PIC 0
Xcvr 0 NON-JNPR QSFP+-40G-LR4
show chassis pic fpc-slot 0 pic-slot 0
PIC port information:
Fiber Xcvr vendor Wave- Xcvr JNPR
Port Cable type type Xcvr vendor part number length Firmware Rev
0 40GBASE LR4 SM OEM LQ-LR4-10 1310 nm 0.0 "
Смотрите также мою статью:
Juniper SNMP OIDs DDM для оптического сигнала трансиверов