我最近构建了 2 台相同的英特尔 i7 Ubuntu 10.04 32 机器,并且出现了桌面或 gnome 会话消失的问题。
例如,如果我将计算机放在桌面上(实际上我很确定即使我将它放在登录屏幕上也会出现同样的问题),在某个时间点(可能 1-3 天)当我返回时,它将只显示桌面的彩色图案。没有图标,没有菜单栏,什么都没有。单击、移动鼠标、按下键盘上的键都不起作用。
通过 vnc 或 team viewer 访问机器时我看到了同样的事情!
有几次我也遇到过机器似乎非常慢或几乎无响应的情况。有几次我仍然能够 ssh 进入机器并重新启动它。有一次我甚至无法 ssh 进入,我不得不关闭电源再打开它。
除了全新安装的基本操作系统外,我还安装了 backuppc、crashplan、teamviewer、tightvncserver、open ssh 服务器,并设置了带有 3 个驱动器的 mdadm 软件 raid 5。我还启用了 pae (?),这样 ubuntu 32 就能看到完整的 4 GB 内存。
请注意,我有一台基本相同的第三台旧机器,没有任何问题。我认为唯一真正的区别是硬件 - 这是一台英特尔 i5 机器。
下次冻结时我应该尝试或查看什么?我查看了我的 dmesg 日志,但什么也没看到。
更新:我上周将所有机器更新到 ubuntu 11,看看是否有帮助。不幸的是,今天早上我打开显示器,发现桌面几乎一片空白。没有菜单栏或时钟 - 我唯一拥有的就是桌面上通常存在的两个图标。Alt-F2 似乎没有任何作用。不过,机器在其他方面反应灵敏 - 我可以访问 samba 服务器和 ssh,但 gnome 桌面不行。
这次当我输入“dmesg”时,我确实看到了很多奇怪的信息 - 这只是一个小样本 - 我如何查看所有信息?:
[425794.900377] CPU 7: hi: 186, btch: 31 usd: 0
[425794.900382] active_anon:747275 inactive_anon:207413 isolated_anon:0
[425794.900383] active_file:349 inactive_file:618 isolated_file:0
[425794.900384] unevictable:0 dirty:0 writeback:1 unstable:0
[425794.900385] free:28156 slab_reclaimable:4790 slab_unreclaimable:15168
[425794.900387] mapped:194 shmem:311 pagetables:2724 bounce:0
[425794.900393] DMA free:7292kB min:64kB low:80kB high:96kB active_anon:0kB inactive_anon:0kB active_file:0kB inactive_file:0kB unevictable:0kB isolated(anon):0kB isolated(file):0kB present:15800kB mlocked:0kB dirty:0kB writeback:0kB mapped:0kB shmem:0kB slab_reclaimable:28kB slab_unreclaimable:44kB kernel_stack:0kB pagetables:0kB unstable:0kB bounce:0kB writeback_tmp:0kB pages_scanned:0 all_unreclaimable? yes
[425794.900399] lowmem_reserve[]: 0 869 4031 4031
[425794.900407] Normal free:104852kB min:3736kB low:4668kB high:5604kB active_anon:289524kB inactive_anon:289684kB active_file:1316kB inactive_file:1780kB unevictable:0kB isolated(anon):0kB isolated(file):0kB present:890008kB mlocked:0kB dirty:0kB writeback:4kB mapped:468kB shmem:400kB slab_reclaimable:19132kB slab_unreclaimable:60628kB kernel_stack:3848kB pagetables:1472kB unstable:0kB bounce:0kB writeback_tmp:0kB pages_scanned:4964 all_unreclaimable? yes
[425794.900413] lowmem_reserve[]: 0 0 25299 25299
[425794.900422] HighMem free:480kB min:512kB low:3908kB high:7308kB active_anon:2699576kB inactive_anon:539968kB active_file:80kB inactive_file:692kB unevictable:0kB isolated(anon):0kB isolated(file):0kB present:3238372kB mlocked:0kB dirty:0kB writeback:0kB mapped:308kB shmem:844kB slab_reclaimable:0kB slab_unreclaimable:0kB kernel_stack:0kB pagetables:9424kB unstable:0kB bounce:0kB writeback_tmp:0kB pages_scanned:1216 all_unreclaimable? yes
[425794.900427] lowmem_reserve[]: 0 0 0 0
[425794.900431] DMA: 13*4kB 13*8kB 14*16kB 14*32kB 11*64kB 11*128kB 9*256kB 4*512kB 0*1024kB 0*2048kB 0*4096kB = 7292kB
[425794.900441] Normal: 545*4kB 3738*8kB 1954*16kB 421*32kB 130*64kB 42*128kB 34*256kB 7*512kB 2*1024kB 0*2048kB 0*4096kB = 104852kB
[425794.900451] HighMem: 146*4kB 2*8kB 0*16kB 0*32kB 0*64kB 0*128kB 0*256kB 0*512kB 0*1024kB 0*2048kB 0*4096kB = 600kB
[425794.900461] 7359 total pagecache pages
[425794.900463] 6028 pages in swap cache
[425794.900465] Swap cache stats: add 76118, delete 70090, find 8162246/8166421
[425794.900467] Free swap = 0kB
[425794.900469] Total swap = 93180kB
[425794.910862] 1310704 pages RAM
[425794.910865] 1082370 pages HighMem
[425794.910866] 283533 pages reserved
[425794.910868] 1832 pages shared
[425794.910869] 996924 pages non-shared
[425794.910873] Out of memory: kill process 13783 (lshw) score 31039 or a child
[425794.910877] Killed process 13783 (lshw) vsz:124156kB, anon-rss:105456kB, file-rss:0kB
[433508.955028] CE: hpet increased min_delta_ns to 56952 nsec
更新:
我发现可能存在几个问题。到目前为止,我已经解决了:
当机器重新启动时,它在关机过程中卡在自动更新行附近。我已打开此功能,所以我将其关闭,我认为这样更好 - 不再卡住。
在其中两台机器上,我没有使用专有的 nvidia 驱动程序。安装该驱动程序似乎在视频效果方面有所改善,而且我也没有像启动时那样遇到小部件错误。希望它也能有助于提高稳定性。
我正在运行 CrashPlan 进行备份。我安装了 OpenJDK 版本的 Java。我昨天注意到机器非常慢,于是我关闭了 CrashPlan。它变得更快了。所以要么是 crashplan 有问题,要么是 java 有问题。根据过去的糟糕经历,我卸载了 OpenJDK 并安装了 Sun(Oracle?)Java,看看会发生什么。
我拥有的其中一台机器运行了 Ubuntu 11 更新。但是我猜它从未完成,因为我检查了更新并注意到它说我可以更新到 ubuntu 11!在尝试更新软件时,我遇到了各种错误。我感觉系统可能处于软件版本之间的某种奇怪的中间状态。我正在完成更新并升级到 unbntu 11,看看是否能清理很多。这是抛出上述所有奇怪错误的机器。
答案1
这句话令人震惊:
内存不足:终止进程 13783 (lshw) 得分 31039 或子进程
您打开了太多程序(未完成的 cron、未关闭的 VNC 客户端),或者您遇到了严重的内存泄漏。
如果您安装了该htop
程序 ( sudo apt-get install htop
),您可以快速概览占用内存最多的程序。开始htop
并按F6设置列表排序的列。使用箭头键选择MEM%
并按Enter。
您可能会看到很多重复的进程(实际上是共享内存的线程),要隐藏它们,请按F2。导航到显示选项使用 进入菜单Arrow Down,使用 跳转到下一个字段Arrow Right。选中“隐藏用户线程”并按F10保存此首选项。