CN113821364B 内存故障的处理方法、装置、设备及存储介质 (华为技术有限公司)_第1页
CN113821364B 内存故障的处理方法、装置、设备及存储介质 (华为技术有限公司)_第2页
CN113821364B 内存故障的处理方法、装置、设备及存储介质 (华为技术有限公司)_第3页
CN113821364B 内存故障的处理方法、装置、设备及存储介质 (华为技术有限公司)_第4页
CN113821364B 内存故障的处理方法、装置、设备及存储介质 (华为技术有限公司)_第5页
已阅读5页,还剩51页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

KR20060094592A,2006.08.30US2019340080A1,2019质本申请实施例公开了一种内存故障的处理2根据所述内存当前的故障分析结果启动对所述内根据所述历史故障信息获得第一统计特征,所述第一统计特征表示将所述历史故障信息输入故障分析模型,获得所述内存当前的故6.如权利要求1-4任一项所述的方法,其特征在于,所述故障分析结果还包含故障级在所述故障模式为所述内存行故障且所述故障级别为高风险级根据所述历史故障信息获得第二统计特征和/或第三统计特征,所述第二统计特征表3在交互界面上显示风险模式选项,所述风险模式选项包括内存如果从所述冗余行上读取出的数据为错误数据,则对所述分析子模块,用于将历史故障信息输入故障分析模型,获4第一修复子模块,用于在所述故障模式为所述第二修复子模块,用于在所述故障模式为所述内存行根据所述历史故障信息获得第二统计特征和/或第三统计特征,所述第二统计特征表交互模块,用于在交互界面上显示风险模式选模式选项和内存低风险模式选项。如果从所述冗余行上读取出的数据为错误数据,则对所述26.如权利要求14-17任一项所述的装置,其特征在第三修复子模块,用于在所述故障模式为所述内存bank故计算机程序被处理器执行时实现权利要求15障日志中记录的该故障行上发生的可纠正错误(correctederror,CE)类型的内存故障的次数是否达到阈值,如果达到阈值,则确定当前满足启动硬封装后修复(hardpost6析历史故障信息的一种实现方式,计算机设备也能够通过其他实现方式分析历史故障信分析模型或者通过其他方式获得故障分析结果的实现信息获得第一统计特征,第一统计特征表示历史时间段内第一内存行出现的故障位的数结果启动对内存的故障修复包括:在故障模式为内存行故障且故障级别为高风险级别时,得第二统计特征和/或第三统计特征,第二统计特征表示历史时间段内第一内存行出现的每种故障类型的故障数量,第三统计特征表示历史时间段内第一内存行出现的纠错数量;7分析模型根据历史故障信息获得第二统计特CE类型等。故障纠错信息包括对每次发送的内存故障进行纠错的纠错数据量(也称为纠错8[0038]前述介绍了在通过分析历史时间段内第一内存行的故障信息获得故障分析结果且故障级别为高风险级别时,启动对内存的故障修复,故障修复为用冗余bank替换故障信息得到故障分析结果,该实施例是以bank的粒度来分析历史故障信息得到故障分析结9[0060]根据历史故障信息获得第二统计特征和/或第三统计特征,第二统计特征表示历模式选项和内存低风险模式选项。算机程序被计算机设备运行时实现上述第一方面所提供的存故障的处理方法所涉及的数据。所述处理器被配置为用于执行所述存储器中存储的程[0093]图1是本申请实施例提供的一种内存故障的处理方法的流程图,该方法应用于计[0095]在本申请实施例中,内存(如动态随机存取存储器(dynamicrandomaccess[0096]内存发生故障以后,内存本身有纠错算法(如错误检查和纠错(errorcheckingandcorrecting,ECC))来纠正错误,被纠正的错误称为可纠正错误(correctederror,析历史故障信息的一种实现方式,计算机设备也能够通过其他实现方式分析历史故障信设备通过故障分析模型或者通过其他方式获得故障分析结果的实现方式故障信息获得第二统计特征和/或第三统计特征,第二统计特征表示历史时间段内第一内CE类型等。故障纠错信息包括对每次发送的内存故障进行纠错(如ECC纠错)的纠错数据量定需要统计的第一内存行的有多种情况,与前述介绍的统计得到第一统计特征的过程中,统计得到一个内存行对应的数据,将统计得到的数据直接作为第二统计特征和/或第三统应的第二统计特征大于第二阈值和/或第三统计特征大于第三阈值时,确定该内存行为故及统计第一时间间隔内针对第一内存行上每种故障类型的内存故障的最大纠错数据量和选择故障级别。[0155]可选地,本申请实施例中在线进行内存故障行替换的技术包括软封装后修复内存颗粒数据错误纠正(singledevicedatacorrction,SDDC)等)对冗余行上的数据进[0163]图2是本申请实施例示出的一种通过读操作修复冗余行上数据的方法示意图。参[0182]可选地,上述执行模块为计算机设备包括的处理器中的内存控制器(如双倍速率同步动态随机存储控制器(doubledataratedynamicrandomaccessmemo障识别模块也可以增加在计算机设备包括的任[0183]图4是本申请实施例提供的又一种内存故障的处理方法的流程图。在图3的基础[0184]其中,错误上报的过程包括:在执行模块检测到发生内存故障时,硬件纠错(如ECC),并上报本次发生内存故障的故障信息(包括故障时间和故障位置)给故障识别模块,以及将该故障信息上报给用于记录内存故障日志的模块,以记录本次内存故障的故障信[0197]可选地,历史故障信息包括历史时间段内发生的内存故障的故障位置和故障时的内存故障的故障类型和/或故障纠错信息。计算机设备根据历史故障信息获得第五统计特征和/或第六统计特征,第五统计特征表示历史时间段内第二bank出现的每种故障类型[0201]可选地,历史时间段的时长和/或第四阈值和/或第五阈值和/或第六阈值为根据[0205]需要说明的是,在该实施例中,与上述图1实施例不同的是,该实施例中的第二[0228]根据历史故障信息获得第二统计特征和/或第三统计特征,第二统计特征表示历[0237]产生模块604,用于从冗余行上读取出的数据为错误数据之后,产生可纠正错误图5实施例中的内存故障的处理方法。具体实现方式参照前述图1至图5所示方法实施例中算机设备包括一个或多个处理器901、通信总线902、存储器903以及一个或多个通信接口件(complexprogrammablelogicdevice,CPLD),现场可编程逻辑门阵列(field-[0257]可选地,存储器903为只读存储器(read-onlymemory,ROM)、随机存取存储器(randomaccessmemory,RAM)、电可擦可编程只读存储器(electricallyerasableprogrammableread-onlymemory,EEPROM)、光盘(包括只读光盘(compactdiscread-接口等。可选地,以太网接口为光接口、电接口或其组合。无线通信接口为无线局域网算机设备能够通过处理器901以及存储器903中的程序代码910,来实现上文图1或图5实施存控制器包括图3所示的执行模块和故障识别模块,通过执行模块和故障识别模块实现上理器901之外的其他处理设备,其他处理设备中存储有执行本申请方案的另一部分程序代器共同实现上文图1或图5实施例提供的内存故障的(digitalversatiledisc,DVD))或半导体介质(例如:固态硬盘(solidstate

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论