版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
1、 RAC集群搭建ASM和私网网卡问题分析 一、项目背景此项目所有主机资源、网络环境、存储资源都是由XX方提供,都是在云上资源的划分,本文分析XX方一系列问题导致搭建集群失败,后续经过调整,集群成功搭建的过程。在搭建前的准备和搭建中一共遇到了两个很重要的问题,在此分享给大家,以后如果有需要搭建集群环境的项目应该注意。单块ASM磁盘不能超过2T大小,即裸LUN的分配要注意不超过2T私网网卡在虚机上配置不要加地址绑定限制和HAIP的相关问题二、ASM磁盘的BUG刚到项目,进行环境检查时发现两个节点挂载的是一块15T的裸LUN,就想到了去年搭建某市教育云时遇到的ASM磁盘组的BUG,这些细节地方确实前
2、期很容易被忽视。早期的集群是通过各存储厂家的存储技术实现的,直到10G之后,oracle公司研究出ASM磁盘的技术,将集群技术进行统一。ASM是一个卷管理器,Oracle数据库文件的一个文件系统,ASM支持单实例和集群配置,它是oracle推荐的存储方案,为传统卷管理器,文件系统,裸设备提供一个选择。2.1 每块ASM磁盘不大于2TASM磁盘有一定限制:单块ASM的磁盘不能大于2T,不然创建磁盘组就会报错ORA-15196 WITH ASM DISKS LARGER THAN 2TB。联系XX云平台的相关人员进行处理,其反馈了两个问题:- 15T裸LUN得重新划分需要先将其格式化,15T大小的
3、磁盘格式化时间大约8个小时;- 15T的裸LUN要划分成每块盘不大于2T,至少需要7个LUN来进行划分,但是目前的云平台是不支持划分这么多数量的,无法保证云平台的稳定。由于ASM磁盘的限制问题,和XX方表示,LUN的重新划分必须要进行,后进行沟通,按照我们提出的需求XX方进行处理,但是由于前期对资源没沟通到位,确实对项目的推进效率造成了一定的影响。2.2 ASM - Scalability and Limits参考MOS文档:文档 ID 370921.1ASM磁盘共有如下一些限制:1、 63 disk groups in a storage system代表一个存储系统最多只能有63各磁盘组,
4、但是一般我们只需要3到四个磁盘组即可:CRS、ARCH、DATA。2、 10,000 ASM disks in a storage system代表一个存储系统最多1万个ASM盘文件,假设我们单块磁盘2T,那我们有2*10000=2万T的空间,这已经很大了,绰绰有余。3、 2 terabyte maximum storage for each ASM disk即上文提到的每个ASM磁盘不超过2T,代表我们在挂裸LUN的时候,单个lUN要注意大小。4、 1 million files for each disk group代表每个磁盘组最多100万个文件5、 2.4 terabyte maxim
5、um storage for each file每个文件的最大存储容量2.4T,参考一下即可,我们单块磁盘都不超过2T,没意义的限制。当然,以上限制到12.1版本之后有所更改,比如只能有63个磁盘组增加到511个,2T磁盘限制也有所修改,具体可以参考文档 ID 370921.1。三、私网网卡相关问题在安装Grid集群时候,有一步要在两个节点分别执行root.sh,类似的操作如果有安装过数据库的小伙伴也应该有经历过。那在Grid安装的这一步会出现各种莫名奇妙的问题,这个时候就需要有查看日志进行解决的能力了。、3.1 私网网卡上绑定的HAIP无法通信在一节点上执行root.sh成功后,在二节点执行
6、root.sh时报错,截取了oraagent_grid.log一段最初的报错信息,除此之后没有其他的报错信息:截取的这一段日志比较重要,可以看到第一行开始InstAgent,然后进行clsdmc_respget检查(对此我的理解是两个节点上私网网卡绑定的HAIP进行通信检查),可以看出多次通信未成功,然后报错ORA-03113: end-of-file on communication channel,直接把和ASM信息的数据库断开,然后开始清除InstAgent的信息,至此节点2执行root.sh失败,意味着集群搭建失败。对于这个错误我的初步判断是XX分配的私网网卡有问题。和XX方负责人沟通
7、后,并未得到想要的答案,其表示正常的私网网卡,使用没有问题。没办法,只能去找确凿的证据,来告诉XX方其私网网卡确实有问题。经过一天的排查下来,最终在MOS文档上Doc ID 1383737.1找到证据。3.1.1 Symptoms如果这个问题出现在安装Grid Infrastructure执行root.sh脚本时,表现出以下症状:-root script screen output$GRID_HOME/cfgtoollogs/crsconfig/rootcrs_.logFor 12.1.0.2, the root.sh on the 2nd node could report:可以看出我们正好
8、符合症状1,执行root.sh脚本出现ORA-03113: end-of-file on communication channel错误。3.1.2 Details*case 1:link local IP (169.254.x.x) is being used by other adapter/network *169.254.X.X这个IP时执行root.sh脚本时候,会自动绑定一个HAIP的信息到私网网卡上,如果这个IP正好被其他设备占用,那当然会绑定失败,最简单的检查办法是通过ifconfig -a进行检查是否存在169.254.X.X相关信息。Case2: firewall exis
9、ts between nodes on private network (iptables etc)两节点之间的private network之间存在防火墙等问题,比如iptables,ipmon等等。HAIP is up on some nodes but not on allHAIP只在一个节点上绑定了,但是并不是所有节点都绑定了HAIP,在两个节点都进行ifconfig检查,就会发现eth1网卡(私有网卡)下面多了一个169.254.X.X格式的HAIPCase4: HAIP is up on all nodes but some do not have route info虽然所有节点
10、上都有HAIP的信息,但是路由表上没有相关信息。检查路由表,发现两个节点都是有对应的路由信息,应该也不是这个问题Case5. HAIP is up on all nodes and route info is presented but HAIP is not pingable虽然HAIP在每个节点上都有绑定,而且路由表上也有对应IP信息,但是无法ping通。在项目现场,用两个16.254.X.X的IP进行互相ping,发现两个IP无法ping通,于是将此问题和XX方沟通,告知其肯定是私网的问题,希望其进行排查,最终XX方给了回复,确实是私网出现了问题。由于拿出了十足的证据告诉XX方确实是他们
11、方面出现了问题,所以后面问题的解决也比较快。这儿告诉XX方问题确实出现了eth1这个网卡上。原来XX方面做了对应网卡的地址绑定,每块网卡写死IP就只有对应IP能通信,坑.3.2 root.sh Fails to Start HAIP as Default Gateway is Configured for Private Network VLAN参考文档 ID 1366211.1在XX方将对应地址绑定配置修改掉后,重新搭建集群,每次重新搭建集群就得将所有文件删掉,将存储dd清空,非常麻烦。本以为这次应该可以大功告成了,没想到跑一节点的root.sh就直接报错,真是尴尬和烦!报错信息:这次有了私网的经验,直接检查HAIP,发现根本没有绑定HAIP,于是直接将情况和XX方进行沟通,XX方应该也意识到时自己的问题,这次对方配合很迅速。告知XX方,eth1网卡无法绑定IP信息原来问题是由于他们CAS配置只改了一半,没改完全,导致无法绑定IP信息,真是坑.四、总结还好,最后将集群搭建的事宜圆满完成了。简单总结下吧:1.ASM磁盘不能大于2T在项目上以后很常见吧,现在存储空间都很大,动辄就是申请15T的资源,那么前期沟通,应该就要知晓裸LUN不能大于2
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 种子发芽率检测方案
- 经络疏通按摩标准服务流程
- 职业病危害因素检测报告制度
- 小儿推拿调理标准流程
- 足疗按摩技法教学标准化指引
- 肺功能检查报告解读规范
- 高血压高血脂饮食指南
- 足底反射疗法操作规范
- 春茶采摘嫩度分级技术标准
- 高毒作业场所卫生防护措施
- 2025年福建省福州市辅警协警笔试笔试真题(附答案)
- 构建人类命运共同体+课件-2025-2026学年高中政治统编版选择性必修一
- 2025年善意的谎言辩论会材料及流程
- 2025年辽宁卷历史高考试卷(原卷+答案)
- 检验科个人防护培训课件
- 小儿骨科课件
- 2025年不动产登记业务知识试题及答案
- 2025年内部审计人员考试题库
- 电液伺服阀知识讲解,电液伺服阀组成和工作原理
- 2026届湖南省雅礼教育集团中考物理模拟试题含解析
- 高等职业学校智能控制技术专业实训教学条件建设标准
评论
0/150
提交评论