广东服务器大促销查看详情

数据中心存储系统的故障处置的几个建议


    发布时间:2020-05-19 11:55:42  |   发布者:邓新薇   | 访问次数:128

  数据中心的存储系统作为如今大数据云计算时代的根基,它的稳定才是支撑起如此海量数据的根本。所以各大相关行业对于这部分非常重视,所以在此针对存储系统的故障处置的几个建议。 首先在处理存储系统发生的可能故障前...

数据中心的存储系统作为如今大数据云计算时代的根基,它的稳定才是支撑起如此海量数据的根本。所以各大相关行业对于这部分非常重视,所以在此针对存储系统的故障处置的几个建议。

数据中心存储系统的故障处置的几个建议

首先在处理存储系统发生的可能故障前必须对于整个存储系统的架构以及原理有一个清楚的了解。普遍来说存储系统由主机、交换机及存储设备组成。它们之间可以是直连或者是IP网络或FC网络的方式进行连接。整个系统的稳定性跟每个组成部分都息息相关。

其次了解故障的分类,故障分类大致分为硬件故障、配置故障或者license类问题,先外部后内部,先处理高级警告后处理低级警告,先共性后个性。

面对故障的发生,第一步永远都是先进行必要的信息收集,对于整个存储系统的基本信息,故障信息、存储设备信息以及组网、主机服务器信息要有了解。这些部分可以直接管理到主机、交换机或存储设备中进行收集,如今厂商也都有专门研发维护工具来帮助管理者做这些事情。收集清楚这些信息之后,才能对整个存储系统有一个普遍清晰的认知。至少对如今的故障可能发生原因有一个了解,然后再细化到每个组成部分上排查可能问题。

一、主机层


在主机层面大多需要检查的是操作系统版本,相应的HBA卡是否达到合适的标准,如速率、IOPS及带宽等。其次是在主机上安装的多路径软件,查看一下与存储设备连接的物理路径的状态以及存储LUN等信息。

二、网络层


网络层次可能发生的问题大多是连通性问题,由于链路故障导致的丢包或者误码率上升等现象,此现象可以在交换机上观察端口的信息,观察误码率是否在持续增长,如有,则可能存在链路部件异常或接触不良的现象。其次可能是端口速率或带宽未达到标准,查看端口配置及协商状况,这些都有可能导致故障或者性能问题。

三、存储层


存储设备可以在导出相关告警,事件或者运行数据、系统日志和硬盘日志来进一步分析可能发生故障的原因,到底是存储控制器问题还是底层的硬盘问题都需要一一排查。在底层存储方面主要考虑存储模块的配置,指示灯状态等信息,从指示灯状态我们可以分析出是否存在硬件故障等,其次在配置方面:RAID级别、分条深度、LUN读写策略、cache策略,LUN归属、硬盘类型等是否符合业务的特点以及不符合时可能导致的问题。都是需要我们在故障排查处理时需要考虑的。

总之面对存储系统的故障,一定要具备一个清晰的思路,不要盲目的去做。盲目的去做可能会恶化故障,从而使得排查难度进一步加大。

如果亲们有服务器租用或者托管需求随时联系小薇,提供技术协助等服务。

点击这里给我发消息

版权声明:部分文章内容、图片来源于互联网获取,如有侵权请联系删除,发送邮件:server889#qq.com 请将#改为@,我们将第一时间审核处理!
Tags数据中心存储系统
上一页文章:如何远程进入服务器   下一页文章:机房防火墙有什么用处呢?

关注新之洲COM
服务器租用/托管联系QQ:78664972 / 316065124

服务器优势
     
IDC优势

IDC优势

广东专业IDC服务器租用提供商
8年以上丰富经验,ISP经营许可资质
多个机房供应选择IDC数据中心
服务器机房资源遍布海内外
贴心服务支持

贴心服务支持

7*24技术维护支持
普通话、英语多语言技术支持
免费故障排查处理
免费重启,重装系统,网络连接维护服务等
       
网络和硬件的保证

网络和硬件的保证

网络基础设施一流
保证安全可靠的存放环境
网络连通率99.99%
多线路骨干网接入,网速畅通无阻
管理和监控

管理和监控

网络连接管理
实时监测带宽使用
流量监视
提供免费网络流量报告
  服务协议/条款

一、整机服务器可安装任何系统,默认Windows Server 2003系统以及linux系统,其他系统可提供完整镜像安装。

二、国内机器均要备案,如未备案的可联系客服备案,香港服务器,韩国服务器免备案。

三、退款条例:非机器问题不支持退款,质量问题可申请退款。

四、一切内容以客服聊天记录为标准,S内容直接封机器不退款。

五、新之洲数据一致续费提前三天会给您联系通知,如联系不上机器到期先下架1天第二天还未来续费或者备份资料的直接格式化。

六、免责声明,关于机器故障等情况这个是机房无法控制的,请各位用户要备份,可联系技术员设置全自动日期周期备份。