Решено emc 5300 system alarm event

awocose

Случайный прохожий
Доброго времени суток! Я не очень разбираюсь в системах хранения данных и потому прошу помощи. Есть СХД vnx 5300 в ней загорелся желтый led индикатор на передней панели. Прочитал на форумах что все настройки в emc unisphere, зашел туда и увидел system alert:
Error 0x7404 SPS (Bus 0 Enclosure 0 SPS A) is faulted.
Error 0x7409 DPE (Bus 0 Enclosure 0) is faulted.
Помогите разобраться что сломалось?
 
Последнее редактирование модератором:

UEF

Супер модератор
Команда форума
что то меняли в подключении? Проверьте кабель соединения с контроллером. Обычно возникает из за неверного подключения.
 

Surf_rider

Администратор
Команда форума
соберите логи sp-collect и посмотрите что там. если есть поддержка заведите тикет. Запросто может быть что и контроллер сдох.
 
Последнее редактирование:

awocose

Случайный прохожий
Спасибо за ответы. Техническая поддержка подтвердила поломку контроллера. А как заменить контроллер в emc ? Можно ли на горячую менять?
 

NanoSuit

Участник
Спасибо за ответы. Техническая поддержка подтвердила поломку контроллера. А как заменить контроллер в emc ? Можно ли на горячую менять?
Можно конечно. Все меняется на горячую. Питание будет обеспечено вторым источником.
Гайд по замене здесь https://mydocuments.emc.com/requestMyDoc.jsp
 

awocose

Случайный прохожий
спасибо! а что такое dpe и sps ? может ли быть что это не контроллер а блок питания?
 

awocose

Случайный прохожий
есть только этот кусок. Смущают просто эти строки, может просто блок питания вышел из строя??:dummy:
Evidence:
**********************************************************************************************
ARRAY CONFIGURATION INFORMATION [ArrayInfo Script]
**********************************************************************************************
Array Name: CKM
Array Serial Number: CKM
Array Model: VNX5300 ( BLOCK )

SPA------------ SPB------------
Array Software Revision: 05.32.000.5.206 05.32.000.5.206
SP Serial Number:
IP Address: 172.30.0.110 172.30.0.109
PROM Revision: 7.00.00 7.00.00
SP Signature: 3550f1 35531c
Agent Revision: 7.32.26 (0.95) 7.32.26 (0.95)
SP Memory: 8192 8192
SP Time: 09/14/2018 15:55:19 09/14/2018 15:51:29
SP Uptime: 1056 days 00:18:07 1056 days 00:19:06
Read Cache State: ENABLED ENABLED
Write Cache State: ENABLED ENABLED
Read Cache Size: 400 400
Write Cache Size: 3597 3597
Cache Page Size: 8 8
Greater WC Availability: ENABLED ENABLED
System Fault LED: ON ON
System Disk Free Space: 50.1 GB (76% free) 50.2 GB (77% free)
Enclosures: 6 6
Disks: 90 90

Fault summary:
FRU SPA SPB
-------------------- ------------------------- -------------------------
Bus0 Enc0 Faulted Faulted
Bus0 Enc0 SPSA Faulted Faulted


A 09/09/18 01:00:56 Bus0 Enc0 SpsA 940 Fault reported by SPS. Replace the SPS. 0 0 104
A 09/09/18 01:01:21 2580 Storage Array Faulted Bus 0 Enclosure 0 : Faulted Bus 0 Enclosure 0 SPS A : Faulted
A 09/09/18 01:01:55 Bus0 Enc0 SpsA 7404 Standby Power Supply is faulted.
A 09/09/18 01:01:55 Bus0 Enc0 7409 Disk Processor Enclosure is faulted.


!spstat info
--------------------------------------------------------------------------------
> !spstat
Transfering FLARE globals


Peer sp is configured
SP A
The log_enabled is 1
Statistics Logging: ENABLED PEER SP: PRESENT
WRITE CACHE: ENABLED READ CACHE: ENABLED
A: DP 63% TOTAL 222975 DIRTY 142005
B: TOTAL 222976
U: DP 00% TOTAL 0000
Requests Complete: -102557554
SPS A: (1.2KW) FLT
SPS B: (1.2KW) OK

--------------------------------------------------------------------------------
********************************************************************************
c:\EMC\Navisphere\7.32.26.0.95.1\msgbin\NavisecCli.exe -np getcrus -all
--------------------------------------------------------------------------------
DPE7 Bus 0 Enclosure 0 *FAULT*
(Bus 0 Enclosure 0 : Faulted; Bus 0 Enclosure 0 SPS A : Faulted)
Enclosure Drive Type: SAS
Current Speed: 6Gbps
Maximum Speed: 6Gbps
SP A State: Present
SP B State: Present
Bus 0 Enclosure 0 Power A State: Present
Bus 0 Enclosure 0 Power B State: Present
Bus 0 Enclosure 0 SPS A State: Faulted
Bus 0 Enclosure 0 SPS B State: Present
Bus 0 Enclosure 0 SPS A Cabling State: Cabling Status is unknown
Bus 0 Enclosure 0 SPS B Cabling State: Valid
Bus 0 Enclosure 0 CPU Module A State: Present
Bus 0 Enclosure 0 CPU Module B State: Present
Bus 0 Enclosure 0 SP A I/O Module 0 State: Empty
Bus 0 Enclosure 0 SP A I/O Module 1 State: Empty
Bus 0 Enclosure 0 SP B I/O Module 0 State: Empty
Bus 0 Enclosure 0 SP B I/O Module 1 State: Empty
Bus 0 Enclosure 0 DIMM Module A State: Present
Bus 0 Enclosure 0 DIMM Module B State: Present
 

UEF

Супер модератор
Команда форума
правильно понимаете.:popkorn:

- -Подумал и добавил - -

Добавлю, что бы понимать что есть что и зачем оно нужно
DAE
DAE stands for Disk Array Enclosure. This is the component of your EMC rack that contains the actual disk drives of the platform, where the data is stored. They come in a multitude of different shapes and sizes, depending on your needs – you can also purchase expansions for a number of existing EMC products.

DPE
The Disk Processor Enclosure contains the actual working parts of the EMC device – all the stuff related to block-level protocols. It’s also where the Vault Drives of your device can be found. Generally, you’re not going to spend much time fiddling with this, lest you mess up your system.

SPE
Storage Processor Enclosures generally only appear on larger EMC systems. They appear in place of the Disk Processor Enclosure, fulfilling the same general purpose – they contain the storage processors. Again, don’t mess with them.

SPS
Storage Processors handle the majority of the operations for an EMC system, including data writing/retrieval, RAID operations, and Read/Write caching. Ultraflex Modules (see below) are used to add additional functionality.

Ultraflex I/O Modules
Justin Paul identifies these as “basically PCIe cards that have been modified for use in a VNX system.” These are fitted into metal enclosures and attached to either storage processors or data movers.

Data Movers and Blades
Data Movers (also known as X-Blades) provide file access to clients through the storage processors of a VNX system. If it helps, Paul recommends thinking of these as Linux systems containing SCSI drives.

Note: Data movers/Blade Enclosures are not present on the VNXe3200, as it doesn’t require separate hardware for this function.

C S
The Control Station manages either the File or Unified components in a VNX array. It’s important to note here that Block-only arrays (such as the VNXe3200) don’t utilize Control Stations.

NAS
NAS stands for Network-Attached Storage, and is used to refer to a shared storage device which provides both file system and storage service to servers – all accessed over a shared IP network.
 

awocose

Случайный прохожий
Вобщем продолжение проблемы. Блок SPS DPE привезли по контракту поддержки. После того как заменили батарею в схд индикаторы LED загорелись зеленым сзади. А спереди нет. Так же горит желтый индикатор на передней панели. Я зашел в юнисферу и вижу что алерты не исчезли, а в свойствах оборудования вижу ошибку
Код:
Cabling status is invalid
111111111.png 22222222222.png

Подскажите в чем может быть дело? Подключено все по инструкции...
 

UEF

Супер модератор
Команда форума
1. Проверьте состояние индикаторов на батарее. Если они показывают Fault, то есть вероятность, что пришедшая батарея неисправна. :throw:
2. Если индикаторы показывают исправное состояние и прошло достаточно времени, чтобы зарядить батарею, то проверьте установку sense cable от DPE к SPS
3. Можно попробовать перезапустить management сервер на обоих контроллерах одновременно. Это можно сделать нажатием соответствующей кнопки в интерфейсе по адресу https://sp_address/setup
4. Если ничего не получится и это не поможет то опять сбор логов и опять в поддержку.
 

Funtik

Случайный прохожий
  1. проверить кабельное соединение к неисправному sps, надо на первом этапе убедиться, что питание доходит до него.
  2. проверить соединение кабеля мониторинга к нему и от него
  3. проверить индикацию sps
 

Anatoly

Случайный прохожий
с вероятностью где то 99% вас спасет обновление микрокода (flare) массива до последней рекомендованной, и ,вдруг если нет, то тогда замена через саппорт
 

Anatoly

Случайный прохожий
если новый SPS не работает то смотрим serial проводок
 
Верх Низ