扫二维码与项目经理沟通
我们在微信上24小时期待你的声音
解答本文疑问/技术咨询/运营咨询/技术建议/互联网交流
1、案例现象
创新互联-专业网站定制、快速模板网站建设、高性价比涧西网站开发、企业建站全套包干低至880元,成熟完善的模板库,直接使用。一站式涧西网站制作公司更省心,省钱,快速模板网站建设找我们,业务覆盖涧西地区。费用合理售后完善,10余年实体公司更值得信赖。
在root用户下,su切换到一个普通用户oracle下,却发生了如下错误:
oracle数据库意外宕机的分析处理案例
于是,尝试直接通过oracle用户登录系统,发现此时的oracle用户也无法登录了,出现与上面同样的错误。
2、解决思路
从上面错误提示可知是权限出现了问题,那么可以从权限入手进行排查,基本思路如下:
用户目录/home/oracle权限问题;
su程序执行权限问题;
程序依赖的共享权限问题;
selinux问题导致;
系统根空间问题。
3、排查问题
根据上面的思路,我们进行逐一检查,考虑到su在切换到oracle用户时会读取oracle目录下的环境变量配置文件,因此,首先检查/home/oralce目录的权限是否存在问题,
[root@loaclhost home]# ls -al/home|grep oracle
drwx---- 4 oralce oinstall 4096 01-31 10:45 oracle
从输出可知,/home/oracle目录的属主是oracle用户,oracle用户对这个目录有“rwx”权限,因此,oracle用户目录的权限设置是正确的,可以排除掉这个问题了。
接着检查su执行权限问题:
[root@loaclhost home]# 11 /bin/su
-rwsr-xr-x 1 root root 24120 2007-11-30 /bin/su
可见su命令执行权限也没有问题,这个也排除了。
继续检查su依赖的共享库权限,使用ldd命令检查su命令依赖的共享库文件,如下图
oracle数据库意外宕机的分析处理案例
根据上面的操作,依次检查su命令依赖的每个库文件的权限,发现也都是正常的,因此,共享库的问题也排除了。
根据上面的思路,绩效检查SELinux的设置。
oracle数据库意外宕机的分析处理案例
由输出可知,SELinux处于关闭状态,这个原因也排除了。
到这来为止,问题变得朴素迷离,到底是哪里出现问题了呢?作为Linux运维,例行检查系统根分区状态是非常必要的,那么首先检查一个根分区的磁盘空间大小,发现剩余空间还有很多,空间问题也排除了。既然报的错误是权限有问题,那么只要以权限为线索,不偏离这个核心就没错,于是继续尝试检查/home目录下各个用户的权限,如下图。
oracle数据库意外宕机的分析处理案例
从输出看每个用户的目录权限,都是“rwx----”,即“700”,完全没有问题,可是我发现我错了,我的目光一直在用户对应的目录上,而忽略了其他输出信息,而问题就藏在我没有关注的信息中。在这个命令输出的前两行中,第一行权限对应的目录是“.”,代表当前目录,也就是/home目录,权限为“rwxr-xr-x”,第二行权限对应的目录是“..”,也就是根目录,权限却为“rw-rw-rw-”,即“666”,此时,问题终于查找到了,原来是根目录权限问题。
4、解决问题
知道了问题产生的原因,解决问题就非常简单,执行如下命令:
[root@localhost~]#chmod 755 /
然后就可顺利执行su切换命令。
经验分享
这个问题主要是由于根目录没有执行权限,而Linux下所有的操作都是在根目录下进行的,进而导致/home/oralce目录没有执行权限。其实根目录权限的丢失对于系统中运行的每个用户存在同样的影响。因此,在权限出现问题时,一定要注意根目录的权限。
原因很多,内部原因外部原因都有可能。
外部原因:比如服务器宕机,系统错误,温度过高宕机(比如机房空调坏了),临时断电,内存错误等等这些都有可能,电压不足等等。
内部原因:比较常见的有undo文件损坏,数据文件错误(遇到过一次,最后用补0的方法扩大了数据文件才好,不过现在用asm存储,这个应该不怎么可能了),时间调整错误(向后调,改动时间过长,比如00:00改为01:00,那么就两个情况都占,未必一定宕机,不过可能性很大),核心进程错误(这个比较少见,不过真的有,有时是有人误杀了),程序错误导致(见过一个因为某程序错误,导致锁表,而后锁表导致某进程一直占用内存,后来的进程根本进不了该表,然后越滚越大最后宕机,还是后来查出来的,相当于蝴蝶扇翅膀变成飓风,所以有错误要及时发现才行),存储错误,io争用(持续时间长)等等。
这么说吧,很多的ora错误都可能引起宕机(并不是全部ora错误都会引起宕机),真要说的话要很长时间,如果想不宕机那么就要有监测检查制度,早发现早解决,也就不会有什么问题了。
修改oratab文件,使数据库自动启动
#vi /etc/oratab
sid:/opt/app/ora10g/oracle/product/10.2.0/db_1:Y -----即把原来的N修改为Y。
不管是单机、双机热备份(HA系统)、RAC(Oracle
Real
Application)环境,如果数据库出现异常宕机,并且无法重新启动,那你可能面对了极为严重的问题。
检查Oracle的alert文件可能可以获得更为详细的故障信息,当您的技术力量无法判断或解决故障时,可以联系重庆思庄科技协助解决和处理。
不用的时候可以停掉oracle服务,设置开机不自动启动就可以了。 第一步:右击“我的电脑”选择“管理”,之后找到“服务和应用程序”中的“服务”。 第二步:将Oracle的选项全部设置为“手动”,用的时候在服务项上右击“启动”就可以了。
我们在微信上24小时期待你的声音
解答本文疑问/技术咨询/运营咨询/技术建议/互联网交流