VMware故障总结 下载本文

内容发布更新时间 : 2025/4/21 7:25:48星期一 下面是文章的全部内容请认真阅读。

Vmware vSphere常见问题及解决办法

日期:2012-6-29来源:51cto

Vmware vSphere

11

1. 虚拟机文件被锁,无法正常 power on 故障状态:

启动虚拟机时95%,停顿并且进程中断,提示:ubable to access files since it is locked。 祸根:HA 解决方法:

(1)首先将cluster中的HA功能关闭。如果该功能不关闭,容易造成死锁,,VM不断跳动,,不断再不同的ESX内循环被锁,徒劳而无功。

(2)磁盘文件被锁,要解决,必须要知道到底是哪台ESX把他给锁住了,这是关键。

方法:看/var/log/vmkernel但是,在做这些前, 再准备些别的工作。 (3)在VC中,把被锁的VM从Inventory中remove掉。原因很简单,这是一个 unregister的过程。

(4)根据/var/log/vmkernel,搜索owner,可以找到类似以下的语句: Oct 19 04:23:33 esx-hostname vmkernel: 3:06:29:47.992 cpu6:1656)FS3: 1975: Checking if lock holders are live for lock [type 10c00001 offset 52008960 v 380, hb offset 3554304 Oct 19 04:23:33 esx-ho

stname vmkernel: gen 17, mode 1, owner 48f5f637-462688bc-fd28-0e1a6434b6f8 mtime 38112]

OK,owner后面的48f5f637-462688bc-fd28-0e1a6434b6f8就是你的target了。 因为他就是锁住VM 的宿主.。

(5)根据以下命令,,找出到底哪台ESX的UUID是 48f5f637-462688bc-fd28-0e1a6434b6f8

[root@esxhostname root]# esxcfg-info |grep -i 'system uuid' (6)找到目标主机后,当然是杀死他锁住VM的进程。之所以会被锁,原因就是HA 把VM从别的HOST迁移过来,但是又没有unregister和register的过程,所以在第3步的时候,你查看VM的Summary的时候,host ip还是属于出问题的 host。 但是VM又被新的host霸王硬上功的power on,注册都没注册, 又怎么启动呢。找到 PID 用下面的命令: ps -efwww|grep virtualmachine.vmx 找到 PID 后, kill -9 PID

(7)这时候,还要确定一件事情, .vswp文件的事情。这个是给台客处理问题时吸取的经验。就因为忽略了这个,所以在杀掉迚程后,重新注册VM,还说没有 SWAP文件,启动还是失败。

在 VM 启动时会自动生成SWAP,没有SWAP文件,其实就是因为 SWAP 存在了, 因为重名而导致无法正常生成。

进入到/vmfs/volumes/lunid/vm_path/下,vmkfs -d virtual_machine.vswp 或者进入Datastore Browser,在里面把SWAP文件删除也可。

(8)完全之策,你还可以进入到VM的SETTINGS--OPTIONS--SWAPFILE LOCATION, 对该保存的位置做下设置。

(9)重新注册VM。进入Datastore Browser,找到VM.vmx,add to inventory。

(10)启动 VM. Good Luck。

2. 忽视掉ESXi/vCenter Server提示SSH事件的方法 (1) vSphere Client连接到VC或者ESXi服务器;

(2) 在Home -> Inventory -> Hosts and Clusters里展开选中你的ESX服务器;

(3) 右边选择Configuration,然后点击Software栏目里的Advanced Settings;

(4) 在Advanced Settings里选择左边列表中的UserVars;

(5) 选中左边列表中的UserVars后,在右边拖到最下面,将UserVars.SuppressShellWarning的值改为1即可,不需要重启。

3. 尝试迁移一台带USB设备的VM失败 故障状态: