emc 5300 system alarm event


Случайный прохожий
Доброго времени суток! Я не очень разбираюсь в системах хранения данных и потому прошу помощи. Есть СХД vnx 5300 в ней загорелся желтый led индикатор на передней панели. Прочитал на форумах что все настройки в emc unisphere, зашел туда и увидел system alert:
Error 0x7404 SPS (Bus 0 Enclosure 0 SPS A) is faulted.
Error 0x7409 DPE (Bus 0 Enclosure 0) is faulted.
Помогите разобраться что сломалось?
Последнее редактирование модератором:
что то меняли в подключении? Проверьте кабель соединения с контроллером. Обычно возникает из за неверного подключения.
соберите логи sp-collect и посмотрите что там. если есть поддержка заведите тикет. Запросто может быть что и контроллер сдох.
Последнее редактирование:
Спасибо за ответы. Техническая поддержка подтвердила поломку контроллера. А как заменить контроллер в emc ? Можно ли на горячую менять?
Спасибо за ответы. Техническая поддержка подтвердила поломку контроллера. А как заменить контроллер в emc ? Можно ли на горячую менять?

Можно конечно. Все меняется на горячую. Питание будет обеспечено вторым источником.
Гайд по замене здесь https://mydocuments.emc.com/requestMyDoc.jsp
спасибо! а что такое dpe и sps ? может ли быть что это не контроллер а блок питания?
есть только этот кусок. Смущают просто эти строки, может просто блок питания вышел из строя??:dummy:
Array Name: CKM
Array Serial Number: CKM
Array Model: VNX5300 ( BLOCK )

SPA------------ SPB------------
Array Software Revision:
SP Serial Number:
IP Address:
PROM Revision: 7.00.00 7.00.00
SP Signature: 3550f1 35531c
Agent Revision: 7.32.26 (0.95) 7.32.26 (0.95)
SP Memory: 8192 8192
SP Time: 09/14/2018 15:55:19 09/14/2018 15:51:29
SP Uptime: 1056 days 00:18:07 1056 days 00:19:06
Write Cache State: ENABLED ENABLED
Read Cache Size: 400 400
Write Cache Size: 3597 3597
Cache Page Size: 8 8
Greater WC Availability: ENABLED ENABLED
System Fault LED: ON ON
System Disk Free Space: 50.1 GB (76% free) 50.2 GB (77% free)
Enclosures: 6 6
Disks: 90 90

Fault summary:
-------------------- ------------------------- -------------------------
Bus0 Enc0 Faulted Faulted
Bus0 Enc0 SPSA Faulted Faulted

A 09/09/18 01:00:56 Bus0 Enc0 SpsA 940 Fault reported by SPS. Replace the SPS. 0 0 104
A 09/09/18 01:01:21 2580 Storage Array Faulted Bus 0 Enclosure 0 : Faulted Bus 0 Enclosure 0 SPS A : Faulted
A 09/09/18 01:01:55 Bus0 Enc0 SpsA 7404 Standby Power Supply is faulted.
A 09/09/18 01:01:55 Bus0 Enc0 7409 Disk Processor Enclosure is faulted.

!spstat info
> !spstat
Transfering FLARE globals

Peer sp is configured
The log_enabled is 1
Statistics Logging: ENABLED PEER SP: PRESENT
A: DP 63% TOTAL 222975 DIRTY 142005
B: TOTAL 222976
U: DP 00% TOTAL 0000
Requests Complete: -102557554
SPS A: (1.2KW) FLT
SPS B: (1.2KW) OK

c:\EMC\Navisphere\\msgbin\NavisecCli.exe -np getcrus -all
DPE7 Bus 0 Enclosure 0 *FAULT*
(Bus 0 Enclosure 0 : Faulted; Bus 0 Enclosure 0 SPS A : Faulted)
Enclosure Drive Type: SAS
Current Speed: 6Gbps
Maximum Speed: 6Gbps
SP A State: Present
SP B State: Present
Bus 0 Enclosure 0 Power A State: Present
Bus 0 Enclosure 0 Power B State: Present
Bus 0 Enclosure 0 SPS A State: Faulted
Bus 0 Enclosure 0 SPS B State: Present
Bus 0 Enclosure 0 SPS A Cabling State: Cabling Status is unknown
Bus 0 Enclosure 0 SPS B Cabling State: Valid
Bus 0 Enclosure 0 CPU Module A State: Present
Bus 0 Enclosure 0 CPU Module B State: Present
Bus 0 Enclosure 0 SP A I/O Module 0 State: Empty
Bus 0 Enclosure 0 SP A I/O Module 1 State: Empty
Bus 0 Enclosure 0 SP B I/O Module 0 State: Empty
Bus 0 Enclosure 0 SP B I/O Module 1 State: Empty
Bus 0 Enclosure 0 DIMM Module A State: Present
Bus 0 Enclosure 0 DIMM Module B State: Present
правильно понимаете.:popkorn:

- -Подумал и добавил - -

Добавлю, что бы понимать что есть что и зачем оно нужно
DAE stands for Disk Array Enclosure. This is the component of your EMC rack that contains the actual disk drives of the platform, where the data is stored. They come in a multitude of different shapes and sizes, depending on your needs – you can also purchase expansions for a number of existing EMC products.

The Disk Processor Enclosure contains the actual working parts of the EMC device – all the stuff related to block-level protocols. It’s also where the Vault Drives of your device can be found. Generally, you’re not going to spend much time fiddling with this, lest you mess up your system.

Storage Processor Enclosures generally only appear on larger EMC systems. They appear in place of the Disk Processor Enclosure, fulfilling the same general purpose – they contain the storage processors. Again, don’t mess with them.

Storage Processors handle the majority of the operations for an EMC system, including data writing/retrieval, RAID operations, and Read/Write caching. Ultraflex Modules (see below) are used to add additional functionality.

Ultraflex I/O Modules
Justin Paul identifies these as “basically PCIe cards that have been modified for use in a VNX system.” These are fitted into metal enclosures and attached to either storage processors or data movers.

Data Movers and Blades
Data Movers (also known as X-Blades) provide file access to clients through the storage processors of a VNX system. If it helps, Paul recommends thinking of these as Linux systems containing SCSI drives.

Note: Data movers/Blade Enclosures are not present on the VNXe3200, as it doesn’t require separate hardware for this function.

The Control Station manages either the File or Unified components in a VNX array. It’s important to note here that Block-only arrays (such as the VNXe3200) don’t utilize Control Stations.

NAS stands for Network-Attached Storage, and is used to refer to a shared storage device which provides both file system and storage service to servers – all accessed over a shared IP network.
Вобщем продолжение проблемы. Блок SPS DPE привезли по контракту поддержки. После того как заменили батарею в схд индикаторы LED загорелись зеленым сзади. А спереди нет. Так же горит желтый индикатор на передней панели. Я зашел в юнисферу и вижу что алерты не исчезли, а в свойствах оборудования вижу ошибку
Cabling status is invalid
111111111.png 22222222222.png

Подскажите в чем может быть дело? Подключено все по инструкции...
1. Проверьте состояние индикаторов на батарее. Если они показывают Fault, то есть вероятность, что пришедшая батарея неисправна. :throw:
2. Если индикаторы показывают исправное состояние и прошло достаточно времени, чтобы зарядить батарею, то проверьте установку sense cable от DPE к SPS
3. Можно попробовать перезапустить management сервер на обоих контроллерах одновременно. Это можно сделать нажатием соответствующей кнопки в интерфейсе по адресу https://sp_address/setup
4. Если ничего не получится и это не поможет то опять сбор логов и опять в поддержку.
  1. проверить кабельное соединение к неисправному sps, надо на первом этапе убедиться, что питание доходит до него.
  2. проверить соединение кабеля мониторинга к нему и от него
  3. проверить индикацию sps
с вероятностью где то 99% вас спасет обновление микрокода (flare) массива до последней рекомендованной, и ,вдруг если нет, то тогда замена через саппорт
это какая то ошибка микрокода:boom1:
если новый SPS не работает то смотрим serial проводок
Верх Низ