我在 AWS/EC2 中有一台服务器,它运行着一个 MSSQL 数据库,有许多应用程序访问它。有时,一些 Cobol 批处理进程也会针对它运行。一段时间以来,这些进程运行良好,然而在过去几天里,其中一个进程占用了所有的 CPU 并运行了几个小时(事实上,我们总是会失去耐心并终止它)。
问题是,我们很难排除故障,因为我们无法在实例运行时对其进行任何操作 - 我们无法使用 RDP 进行连接,我们为监控处理器使用情况而运行的任何程序似乎都暂停了。到目前为止,我们发现的唯一恢复方法是 Sys Internals PS Suspend 或 PS Kill。
我还尝试了许多实用程序来对进程执行相当于 Unix 的“nice”操作(BES、Process Lasso、Process Tamer),但似乎都不起作用。我还尝试过更改进程亲和性(从正常到低),但这似乎也没有什么区别。我是不是做错了什么?
非常感谢您的任何建议。
(Windows 2008R2 数据中心)