硬件方面告警分析(硬件故障处理的方法)

来源网友投稿 1015 2023-03-08

本站部分文章、图片属于网络上可搜索到的公开信息,均用于学习和交流用途,不能代表睿象云的观点、立场或意见。我们接受网民的监督,如发现任何违法内容或侵犯了您的权益,请第一时间联系小编邮箱jiasou666@gmail.com 处理。
本篇文章给大家谈谈硬件方面告警分析,以及硬件故障处理的方法对应的知识点,希望对各位有所帮助,不要忘了收藏本站喔。 今天给各位分享硬件方面告警分析的知识,其中也会对硬件故障处理的方法进行解释,如果能碰巧解决你现在面临的问题,别忘了关注本站,现在开始吧!

本文目录一览:

华为设备有如下告警,期间并没有修改配置,请分析大概是什么原因

磁盘空间告警
告警信息:IGWB介质空间不足。
告警分析:主用IGWB在剩余磁盘空间小于15%的时候就会出磁盘空间告警,省公司要求话单保存时间:原始话单15天(D盘),格式转换后的话单15天(E盘),最终话单90天。
告警处理:删除部分格式转换后的话单(E:\backsave\Second\X3KM\),剪切部分最终话单到应急工作站(暂时),建议增加IGWB硬盘空间。
02备用IGWB磁盘空间不足
故障现象:备用IGWB磁盘空间不足
故障分析:备用IGWB是实现话单双备份的组成,并且如果备用IGWB磁盘剩余空间过小,主用IBWG异常的时候将无法倒换。
故障处理:清理备用IGWB磁盘空间。
03单板故障
告警信息:例如WSMU 板故障、单板CPU自检故障。
告警分析:无
告警处理:1.复位 2.拔插 3.更换
04电源故障
告警信息:-48V 电压过高告警。
告警分析:
告警产生原因:
· 动力进行例行放电测试,致电压临时过高
· 电压已恢复正常,但告警未自动消除,出现假告警
· 电压过高导致。根据指令DSP PDB可以查询到系统的电压正常范围是-42V~-57V,经常观察如果电压过高后,告警会在电压降到-54V的时候消除。如果告警长时间未自动恢复,可以用万用表测电压,看是否在正常范围内,如果电压已正常,可以手动把电压的门限值进行调高,使告警恢复后再把门限值调到正常范围内。
告警处理:
1.联系动力专业,确认是否在进行电池放电测试。如是,在测试完成后观察告警是否消除
2. 根据指令DSP PDB可以查询到系统的电压正常范围是-42V~-57V,经常观察如果电压过高后,告警会在电压降到-54V的时候消除。如果告警长时间未自动恢复,可以用万用表测电压,看是否在正常范围内,如果电压已正常,可以手动把电压的门限值进行调高,使告警恢复后再把门限值调到正常范围内。(现在配电框监控板默认的告警上限目前定义为57V,产品设置时,可在此基础上加3V,设置为60V比较合适。
MSOFTX3000可以通过软调修改电压告警上限。
软调命令如下:
STR SFTD: LT=MN, MN=2, PID="166", CTRL="36", PM0="1", PM1="60", PM2="42";
STR SFTD: LT=MN, MN=2, PID="166", CTRL="36", PM0="2", PM1="60", PM2="42";)
3.观察一段时间,如告警不会自动恢复就联系动力室处理。
05IGWB倒换
告警信息:iGWB双机倒换
告警分析:双机倒换通常是主用IGWB异常引起,可能原因:磁盘空间不足,重要目录被改动,网络故障,进程异常。
告警处理:清理磁盘空间,恢复被改动目录,检查处理网络,重启IGWB进程。
06传输故障
告警信息:E1端口故障或信号丢失。
告警分析:无
告警处理:自环检测,通过LOP E1对本端端口进行软件环回,如正常则表示单板端口硬件正常,再在各段DDF架端进行环回测试,逐段排除线缆原因,如是本端问题则重做线缆接口、换线或者换板,如是传输问题则转传输室处理。
07IGWB内存过载
告警信息:iGWB 内存过载。
告警分析:IGWB上运行的主要进程有om_proc.exe,ap_proc.exe,cfg_proc.exe,cls_proc.exe,knl_proc.exe。主要检查这些进程有没有大量占用内存空间。现在SZS09,SZS12的om_proc.exe进程占用大量内存不释放。
告警处理:暂时的处理办法是重启om_proc.exe,最终解决方法等待华为工程师补丁解决。
08IGWB备份失败
告警信息:iGWB备份连接失败。
告警分析:IGWB备份有两份,都是从主用IGWB以FTP方式备份到备用IGWB。一份保存在备机的E:\billforbs,保存1000个文件,通过smartback实现;一份保存在E:\ finabill_bak,保存时间为90天,通过igwb.ini文件的配置信息实现。
告警处理:检查smartback备份的路径和用户名密码是否正确;重启smartback软件;重启IGWB进程。
09网络故障
告警信息:BAM到主机连接中断、TCP链路故障。
告警分析:故障可能原因lanswitch异常,网口松动,网卡运行异常。
告警处理:拔插BAM主机网线,拔插lanswitch端口网线,禁用启用网卡,重启BAM。
10MTP、SCCP、M3UA故障
告警信息:M3UA路由传输禁止 路由不可用;MTP链路故障/MTP 链路定位失败;SCCP目的信令点禁止。
告警分析:故障可能原因传输故障引起,配置数据变更,链路负荷过高。
告警处理:检查传输,检查数据配置信息,检查是否为垃圾数据产生的告警。
11话单文件校验错误或话单文件丢失
告警信息:无
告警分析:可能是话单文件传送到计费中心出错,需要重传计费文件
告警处理:重传相应计费文件
12更换单板时程序加载不成功
告警信息:单板程序加载不成功
告警分析:可能原因:1.单板加载软开关未打开.2. 加载文件丢失
告警处理:1.通过MOD LSS修改单板加载软开关,设置为”程序不可用,数据不可用 ,数据可写, 程序可写”,加载完成修改为” 程序可用,数据可用,数据可写,程序不可写”
2.主机加载文件都存于BAM的D:/data 目录下,在此目录下查找所要加载的单板的程序文件,如未找到,说明文件因其他原因丢失,通过在其他同类型同版本局上能找到该单板的程序文件,将文件拷贝至该目录下,重新复位加载单板。
13硬盘故障
故障现象:故障磁盘灯亮红灯。
故障分析:华为软交换的硬盘都采用磁盘阵列方式对数据进行保护,硬盘支持热拔插,坏一块磁盘不影响系统运行,但是要尽快安排更换。
故障处理:更换硬盘。
14主机时间偏差
故障现象:检查主机系统时间发现网元的主机时间和北京时间相差较大。
故障分析:主机系统时间就是话单产生时间,华为认为偏差在正负5秒是正常的,超过这个范围需要校正。
故障处理:主机时间和BAM时间同步,更正其中一个就可以达到校正的目的。可以通过DSP TIME查看系统时间,通过指令SET TIME修改,或者直接改BAM的系统时间。
15CRC校验错误
故障现象:CRC校验错误告警。
故障分析:交换机数据与BAM机数据不一致,可能是由于工程引起的故障。
故障处理:通过SND SPD指令对校验出错的数据表进行强制发送,再次执行STR CRC进行CRC校验
以上,就是给大家整理的华为设备故障分析与排除方法,希望对你能有所启发。

linux怎么查看硬件告警

想知道怎么查看Linux中硬件方面告警分析的硬件告警吗?下面是我带来的关于linux怎么查看硬件告警的内容硬件方面告警分析,欢迎阅读!

Linux查看硬件告警 方法 一硬件方面告警分析

Linux系统拥有非常灵活和强大的日志功能,可以保存几乎所有的操作记录,并可以从中检索出需要的信息。

大部分Linux发行版默认的日志守护进程为 syslog,位于 /etc/syslog 或 /etc/syslogd,默认配置文件为 /etc/syslog.conf,任何希望生成日志的程序都可以向 syslog 发送信息

/sbin/syslogd

在修改syslog配置后,需要重新启动syslogd守护进程才能使新的配置生效。其命令如下所示。

# killall -HUP syslogd

Red Hat Enterprise Linux 5.2安装后默认就已经在syslog中定义硬件方面告警分析了一些日志文件。

说明

/var/log/message

系统启动后的信息和错误日志,是Red Hat Linux中最常用的日志之一

/var/log/secure

与安全相关的日志信息

/var/log/maillog

与邮件相关的日志信息

/var/log/cron

与定时任务相关的日志信息

/var/log/spooler

与UUCP和news设备相关的日志信息

/var/log/boot.log

守护进程启动和停止相关的日志消息

Linux查看硬件告警方法二:

日志作为普通的文本文件存储在磁盘中,因此可以通过查看文件的命令来查看日志。比如:通过tail命令查看日志的最后10行,通过head命令查看命令的开头10行。

日志文件的默认存储路径是:/var/log

下面是几个重要的日志文件:

/var/log/messages:包括整体系统信息,其中也包含系统启动期间的日志。此外,还包括mail,cron,daemon,kern和auth等内容。

/var/log/syslog:它和/etc/log/messages日志文件不同,它只记录警告信息,常常是系统出问题的信息。

/var/log/user.log:记录所有等级用户信息的日志。

/var/log/auth.log:包含系统授权信息,包括用户登录和使用的权限机制等。

要查看最新的10条系统消息就可以使用命令:

tail /var/log/messages

硬件方面告警分析了"linux怎么查看硬件告警" 文章 内容的人还看:

1. linux中查看硬件信息的方法有哪些

2. 如何查看Linux加载内置模块的信息

3. linux怎么查看内存

4. linux怎么查看cpu的使用率问题

5. 如何正确查看Linux机器内存使用情况

6. linux怎么查看内存使用情况

7. linux系统如何查看内存使用情况

8. Linux查看cpu个数

电脑主机报警是怎么回事?

电脑开机报警是硬件有故障,至于具体原因要根据警报音来判断:

具体可以百度电脑开机警报音大全来对照。

建议先排除硬件接触不良导致的。

1、先拔掉键盘鼠标外设启动试试,问题依旧重新拔插一下显示数据线,各种电源线。

2、有独立显卡显示数据线要连接到独立显卡中。

3、开机箱打扫机箱内卫生,清理灰尘。

4、重新拔插机箱内外各种线

5、扣主板电池放电解决静电问题。

6、内存重新拔插一下

7、用橡皮擦擦内存显卡金手指

8、用单条内存插到不同插槽中开机测试

机箱报警,要听声音的长短和报警次数判断是什么故障,欢迎追问,满意请采纳。

1短:系统正常启动

2短:常规错误。解决方法:重设BIOS

1长1短:RAM或主板出错

1长2短:显示器或显示卡错误

1长3短:键盘控制器错误

1长9短:主板FLASH RAM 或EPROM错误,BIOS损坏

不停地响(长声):内存条未插紧或损坏

不听地响:电源、显示器未和显卡连接好

重复短响:电源有问题

无声音无显示:电源有问题

AWI BIOS:

1短:内存刷新失败。解决方法,更换内存条

2短:内存ECC效验错误。解决方法:进入CMOS设置,将ECC效验关闭

3短:系统基本内存(第一个64KB)检查失败

4短:系统时钟出错

5短:CPU错误

6短:键盘控制器错误

7短:系统实模式错误,不能切换到保护模式

8短:显存错误

9短:ROM BIOS检验和错误

1长3短:内存错误

1长8短:显示测试错误

1短:系统启动正常

1短1短1短:系统加点自检初始化失败

1短1短2短:主板错误

1短1短3短:CMOS或电池错误

1短1短4短:ROM BIOS效验失败

1短2短1短:系统时钟错误

1短2短2短:DMA初始化失败

1短2短3短:DMA页寄存器错误

1短3短1短:RAM刷新错误

1短3短2短:基本内存错误

1短4短1短:基本内存地址线错误

1短4短2短:基本内存效验错误

1短4短3短:EISA时序器错误

1短4短4短:EASA NMI口错误

2短1短2短到2短4短4短(即所有开始为2短的声音的组合):基本内存错误

3短1短1短:从DMA寄存器错误

3短1短2短:主DMA寄存器错误

3短1短3短:主中断处理寄存器错误

3短1短4短:从中断处理寄存器错误

3短2短4短:键盘控制器错误

3短3短4短:显示卡内存错误

3短4短2短:显示错误

3短4短3短:未发现显示只读存储器

4短2短1短:时钟错误

4短2短2短:关机错误

4短2短3短:A20门错误

4短2短4短:保护模式中断错误

4短3短1短:内存错误

4短3短3短:时钟2错误

4短3短4短:实时钟错误

4短4短1短:串行口错误

4短4短2短:并行口错误

4短4短3短:数字协处理器错误

兼容BIOS:

1短:系统正常

2短:系统加电自检(POST)失败

1长:电源错误,如果无显示,则为显示卡错误

1长1短:主板错误

1长2短:显卡错误

1短1短1短:电源错误

3长1短:键盘错误

计算机硬件故障分析及维护方法

计算机硬件故障分析及维护方法

随着电子科技信息的不断发展和进步,用户对于计算机的硬件也产生了更高的要求,使计算机的硬件不断的更新和丰富。下面是我为大家搜索整理的关于计算机硬件故障分析及维护方法,欢迎参考阅读,希望对大家有所帮助!想了解更多相关信息请持续关注我们应届毕业生培训网!

1 计算机硬件维护原则

1.1 检测前进行必要的环境清洁

计算机的工作环境在很大程度上影响着硬件的工作,很多硬件的故障都是因为环境差引起的。湿度大或灰尘大的环境都会损伤计算机硬件,减短其使用寿命。因此,在计算机硬件的维护以及故障检查中,首先要清洁计算机外和机内的工作环境,防止环境原因引起计算机硬件发生故障。

1.2 注意硬件维护的顺序

首先,维护时要先进行计算机外设的维护,计算机外设的故障可以进行快速的分析和排除,计算机会针对外设的故障进行报错,因此可以根据计算机信息依次检查计算机的外部设备工作情况。然后在针对较为复杂的主机进行故障分析和日常维护。第二,在进行计算机的维护中,要注意先进行计算机电源部件的维护和检修。电源功率的不足,会影响到计算机的正常工作,而电源部件的维护经常会被用户忽略。第三,硬件维护时要先在计算机断电状态下进行硬件检查,进行必要的测量,然后再将计算机通电,进行相关的检查,防止硬件故障的扩大。第四,在进行硬件故障分析和排除时,要首先考虑到硬件的共性故障,进行通常的维修,再针对特别的故障进行具体分析和维修。

2 计算机硬件的故障维护

2.1 计算机硬件故障的分类

计算机硬件的故障分为先期、中期和后期故障,指计算机保修期前、使用三年左右和使用数年以后计算机发生的故障。不同时期的故障有不同的特点。先期故障主要是工艺性的故障,其次是计算机硬件的质量故障,中期故障大多数是由于硬件的元器件质量不好造成的,可通过元器件的更换进行故障排除,中期故障主要是电源故障,电源在使用时间较长后会发生故障。后期故障主要是设备的老化而产生的,表征不明显,需要较高水平的专业人员进行故障的排除。

2.2 计算机硬件故障的.原因分析

计算机硬件故障分为内部原因、外部原因和人为原因。内部原因是指计算机硬件的质量不好、性能不良等原因,决定了计算机硬件的使用寿命。外部原因是指用户使用计算机硬件的外部环境和条件的原因,如电压的不稳定会造成对计算机电源的损害,同时导致元件的老化,影响其性能。人为原因是指计算机由于人为的装拆改造的原因,造成硬件的损伤。

2.3 计算机硬件故障的维修方法

(1)对硬件进行常规观察。进行观察时,首先打开硬件设备的后盖,观察设备中是否出现了损伤、断线、变形、烧坏的现象,然后将设备通电,在动态条件下观察设备内是否有异味、打火等情况。断线现象,主要是电源线的断裂,线路板的断裂,以及保险丝的熔断,晶体管脱焊等;短路故障,常见的是线路和芯片引线之间短路和电路板上油垢等造成的短路现象,另外,金属底板和散热板等接触也会造成短路现象;漏电现象,通常是指人体感官能够观察到的漏电,如电容发热,高压元器件漏电,电解液外流等现象,主要原因是线路间和引线间有水气物、尘埃等,造成漏电和打火等现象。

(2)故障现象的观察。对于故障直接的表现进行观察,首先要熟悉计算机硬件的电路结构及其特点。电压法是通过设备电路的端点电压和工作电压的测量,并将测量值和正常值进行对比和分析,判断出故障的原因,利用电压法进行故障排除时,要结合动态分析和静态分析,对故障原因进行准确的判断。电阻法是用万用表对电路中的可疑故障点和元件,以及芯片引脚对地电阻值进行测量,并与正常值进行比较分析,确定电路故障点。

(3)硬件的插拔替换进行故障排除。首先,根据计算机硬件出现的问题,对故障进行初步的判断,将可疑故障部件拆下,安装到运行正常的计算机上,如果该计算机上的硬件不能正常工作,则可疑部件就是故障部件,如果可以正常工作则需要继续对故障计算机的其他硬件进行分析和替换,最后找到故障部件进行排除。

(4)运用系统最小化方法进行硬件检查。这种方法将能使计算机进行开机和运行的硬件和软件系统最小化,进行维修判断。对于计算机硬件系统,最小化的系统是由电源、CPU和主板组成的。在这个硬件最小化的系统中,只有计算机电源和主板的电源有连接,可以通过计算机的内扬声器的声音判断该系统的组成部分的故障部分。

(5)软件检测法。用专门的硬件检测软件,可以快速的查出硬件故障的原因。专门的诊断软件不仅能够对系统的各个部件的运行情况进行检查,也可以检查计算机系统的运行稳定性和系统的工作性能。诊断软件在发现故障和问题后,会显示报告信息,以便进行故障原因的分析和故障排除。

(6)其他方法。计算机硬件出现软故障时,可以用振动和干扰的方法查出故障。运用示波器可以对于硬件的信号进行检测,对于信号的波形进行测量分析故障原因。根据对正常计算机和故障计算机进行在相同运行状况下比较,通过不同的表现可以判断故障部件和故障原因。

3 计算机硬件的日常维护

3.1 保证良好的工作环境

计算机的工作环境在很大程度上影响着计算机硬件的使用情况和使用寿命。在电源方面,计算机硬件要有稳定的电源和较好的接地系统,同时防止计算机的突然断电对计算机硬件部分造成的损伤;在计算机的工作温度方面,计算机的工作温度应控制在10~35℃的范围内,防止计算机在高温条件下运行而产生的硬件故障;在计算机的工作湿度方面,应将环境湿度控制在30%~80%的范围内,湿度过小会产生静电,湿度过大会影响计算机硬件的性能发挥,有短路的可能性。另外,计算机硬件的工作环境应隔离电磁干扰,磁场环境会影响计算机硬件的正常工作。计算机的工作环境应注意清洁,灰尘的积累会造成短路等现象。 计算机的工作环境影响着计算机硬件的使用寿命和硬件的性能发挥,保证适合的温度和湿度,以及清洁的工作环境,才能防止由于灰尘污垢等原因导致的硬件短路等现象。

3.2 保持合理的使用方式

一方面,在计算机的开机和关机方面,要根据顺序正常的开机和关机,不要过于频繁的开机和关机,也不能在计算机进行处理工作时进行关机,这些都会造成计算机硬件的损伤。另一方面,在计算机进行硬件的更换时,要切断电源,使计算机自身的静电释放后再进行造作,防止电路的损坏。另外,计算机应当避免在工作时移动,防止硬件受到损坏。

保持合理的使用方式,是计算机硬件日常维护的重要方面,只有养成良好的使用习惯,才能避免长期使用计算机对于硬件的损伤,防止计算机硬件出现故障。

3.3 加强计算机硬件的日常维护

对于计算机的显示器的维护,要注意显示器的防尘和防潮,要将显示器放在较为宽敞的空间,以便于显示器的有效散热,同时,应当避免由于显示器的频繁开关所造成的显示器晶体管损坏,同时,显示器应远离电磁干扰,防止显示器性能的破坏。计算机的内存和适配卡等,在保修期内不要人为拆卸,保修期后,要对其进行清洁,防止其短路和老化。计算机的键盘、鼠标等硬件也要进行日常维护,计算机键盘要保持清洁,远离液体,减少对键盘和鼠标的过度使用,防止撞击等情况。在进行键盘鼠标等硬件的更换时,要切断电源,以保护计算机其他相关部件,并保证键盘和数遍的寿命。

计算机日益成为人们生活和工作的主要用具,随着计算机设备使用时间的增长或使用不当和意外的受损,计算机硬件不可避免的出现故障。维护人员应当能够准确迅速的找到硬件的故障,分析故障原因,并排除故障,这就要求维护人员具有专业的检修技术和维护方法,能够应对任何情况下的故障。同时,计算机硬件的维护还要从硬件的日常良好的使用习惯和清洁的使用环境为主,这样才能在最大程度上发挥计算机硬件的良好性能。

;

关于硬件方面告警分析和硬件故障处理的方法的介绍到此就结束了,不知道你从中找到你需要的信息了吗 ?如果你还想了解更多这方面的信息,记得收藏关注本站。 硬件方面告警分析的介绍就聊到这里吧,感谢你花时间阅读本站内容,更多关于硬件故障处理的方法、硬件方面告警分析的信息别忘了在本站进行查找喔。
上一篇:none 和 host 网络的适用场景 - 每天5分钟玩转 Docker 容器技术(31)
下一篇:突发事件应急管理试卷(突发事件应急管理培训课件)
相关文章

 发表评论

暂时没有评论,来抢沙发吧~