在EDA环境日常维护过程中,经常会出现硬盘损坏的情况,而为了“降本增效”,通常我们不会采购上门更换的服务,而只采购配件邮寄上门,这时候就比较考验大家的动手能力了。
下面,介绍如何自行纯手工的更换损坏硬盘,前提是要ssh登录到netapp设备。
一、定位坏盘与新盘识别
1. 登录控制器并进入高级模式
priv set advanced #切换至高级权限模式
2. 查看硬盘列表及状态
disk show -v #显示详细磁盘信息(包含盘名、状态、归属等)
o 关键信息:通过 disk_name 确认目标坏盘(如 disk-0a),新盘通常显示为 NOT owned 或 bad label。
3. 利用指示灯定位物理磁盘
blink_on <disk_name> # 点亮磁盘指示灯(黄色闪烁) blink_off <disk_name> # 关闭指示灯
o 操作场景:机架式存储可通过指示灯快速定位机柜中对应的物理硬盘位置。
二、分配新硬盘与初始化
1. 检查未分配磁盘
disk show -v | grep "owner: NOT owned" #过滤未归属磁盘
2. 手动分配磁盘(推荐)
disk assign <disk_name> <controller_name> # 分配至指定控制器(如 `controller A`) # 示例:disk assign disk-1a controllerA
o 替代方案:自动分配所有未归属磁盘
disk assign all #谨慎使用,避免跨控制器分配导致性能问题
3. 处理 bad label 状态磁盘
disk unfail -s <disk_name> #修复磁盘标签并加入备用池(spare) #示例:disk unfail -s disk-2a
4. 零化磁盘(清除历史数据)
# 检查是否需要零化 sysconfig -r | grep "zero" # 若显示 `no`,需执行零化 # 零化单盘(推荐) disk zero <disk_name> # 零化指定磁盘(如 spare 盘) # 零化所有备用盘 disk zero spares # 批量零化,需确认无在用磁盘
5. 验证配置
disk show -v # 确认归属(owner)正确 sysconfig -r # 检查零化状态(应为 `yes`)
三、特殊问题处理
1. 旧数据残留导致磁盘故障
现象:新盘加入后,卷(aggr)中其他磁盘显示 failed,因残留原控制器数据。
处理步骤:
#1.离线故障卷 aggr off <aggr_name> #示例:aggr off aggr0 #2.摧毁故障卷(谨慎!会删除数据) aggr destroy <aggr_name> #示例:aggr destroy aggr0 #3.移除磁盘归属(若有残留) disk remove_ownership <disk_name> #示例:disk remove_ownership disk-3a #4.重新分配并零化磁盘 disk assign <disk_name> <controller>disk zero <disk_name>
2. 关闭自动分配功能(避免误分配)
option set disk.auto_assign off #禁用自动分配(需重启生效)
#启用命令: option set disk.auto_assign on
四、最佳实践建议
1. 操作前备份:重要数据卷操作前执行 snapshot 或数据备份。
2. 分盘策略:
o 跨控制器分配磁盘时,确保符合存储架构设计(如双活、HA 配对)。
o 备用盘(spare)建议与数据盘同类型、同容量,避免加入后影响性能。
3. 监控验证:操作后通过 system health 检查存储状态,观察磁盘 I/O 及报错日志。
4. 版本适配:不同 ONTAP 版本命令可能有差异(如 ONTAP 9.8+ 支持部分图形化操作),建议参考官方文档。
五、常用命令速查表
操作类型 | 命令示例 | 说明 | |
---|---|---|---|
查看磁盘详情 | disk show -v | 显示盘名、归属、状态等信息 | |
分配磁盘 | disk assign disk-0a controllerA | 手动分配至指定控制器 | |
零化磁盘 | disk zero disk-0a | 清除磁盘数据(不可恢复) | |
管理卷 | aggr off/on/destroy <aggr_name> | 卷离线 / 上线 / 摧毁 | |
权限模式切换 | `priv set {advanced basic}` | admin权限切换 | 切换权限等级(需谨慎) |
通过以上步骤可规范完成 NetApp 硬盘新增与故障处理,操作中需注意命令参数正确性及数据备份,避免误操作导致数据丢失。
网友留言: