博客
关于我
强烈建议你试试无所不能的chatGPT,快点击我
关注物理硬盘预警信息
阅读量:6070 次
发布时间:2019-06-20

本文共 1016 字,大约阅读时间需要 3 分钟。

有一次在做MySQL数据库更新时,发现DML更新效率特别低,总能发现超过1秒的慢日志,一般很少会出现这种情况,初步判定为可能网络故障或者就是DB服务器自身的性能出现问题导致。

经过检查服务器状况,发现确实发生了硬件故障,主要是raid 10中的一块硬盘发生预警,信息如下:

Physical Disk: 1Enclosure Device ID: 32Slot Number: 3Device Id: 3Sequence Number: 2Media Error Count: 650Other Error Count: 73Predictive Failure Count: 71Last Predictive Failure Event Seq Number: 6716Raw Size: 140014MB [0x11177328 Sectors]Non Coerced Size: 139502MB [0x11077328 Sectors]Coerced Size: 139392MB [0x11040000 Sectors]Firmware state: OnlineSAS Address(0): 0x500000e11079e682SAS Address(1): 0x0Connected Port Number: 3(path0) Inquiry Data: FUJITSU MBA3147RC       D306BLB5P9500H4M

大家注意下上面的信息,硬盘的状态还是 Online,并没有报错,但是另外2个 Error Count值从凌晨开始一直在较快速度增长。
再观察服务器的sar日志,发现从5点发起例行DB备份时,服务器的IO性能急剧下降,因此认定:
停服时存盘速度慢确实和一块硬盘发生预警有关系

由于发起DB备份,需要瞬间读取大量数据,因此需要扫描全部raid阵列中的硬盘,但其中一块盘的状态并没有标记为Failed或Offline,
因此raid阵列还是会去扫描它,导致IO性能特别差。这时候,如果我们把硬盘状态修改成Offline应该就可以避免这种问题,并且不会对raid 10产生丢数据的风险。

碰到类似现象需要谨慎,尽快安排更换备盘,防止问题扩大化。

本文转自叶金荣51CTO博客,原文链接:http://blog.51cto.com/imysql/1879740,如需转载请自行联系原作者

你可能感兴趣的文章
httpd主配置文档的介绍及小练习
查看>>
Centos 7.1 快速搭建postfix邮件系统
查看>>
学 Win32 汇编[32] - 子程序进阶
查看>>
WinAPI: GetSystemDirectory - 返回 System 文件夹路径
查看>>
C#学习笔记(20140911)-下拉框、日历、pannel控件的使用
查看>>
音乐荷包蛋 2013
查看>>
命令行模式下快速移动光标快捷键
查看>>
RxJava 入门
查看>>
清理 SYSAUX 表空间
查看>>
keepalive配置文件详解
查看>>
第二讲 SCCM2012 配置和发现边界
查看>>
RHEL7.0系统相关配置
查看>>
linux 下将mysql数据库中的表内容显示到网页上
查看>>
CentOS6.6修改主机名
查看>>
Oracle拥抱开源:JavaFX计划细节泄露
查看>>
甲骨文推WebCenter 创企业社交最佳实践
查看>>
Java进级篇 - Java Enum的用法详解
查看>>
在sun 刀片机上使用CAM配置LV
查看>>
HCL里MSR36-20的PPPoE配置(含client和server)
查看>>
nginx + django
查看>>