qdel 删除了我的所有作业

qdel 删除了我的所有作业

我在服务器上使用 Sun GridEngine(Rocks Cluster)来运行远程作业。

当我尝试使用 删除作业时qdel,它通常按预期工作,但时不时它会删除它找到的几乎所有内容。

例如,今天某个时候,我有 77 个正在运行的作业:

[znorg@server MD]$ qstat
作业 ID 先前名称 用户状态 提交/开始于队列槽 ja-task-ID
-----------------------------------------------------------------------------------------------------------------
   7711 0.55500 shg_oAll_c znorg dr 2012 年 10 月 30 日 13:49:07[电子邮件保护]           1        
   7712 0.55500 shg_oCAB_c znorg dr 2012 年 10 月 30 日 13:49:07[电子邮件保护]           1        
   7873 0.55500 a1h3l_prdA znorg r 2012 年 11 月 8 日 13:37:22[电子邮件保护]            1        
   7874 0.55500 a1t8k_obsA znorg r 2012 年 11 月 8 日 13:37:22[电子邮件保护]           1        
   7875 0.55500 a1t8k_prdA znorg r 2012 年 11 月 8 日 13:37:37[电子邮件保护]           1        
   7877 0.55500 a3zr8_prdA znorg r 2012 年 11 月 8 日 13:37:37[电子邮件保护]           1        
   7878 0.55500 b1nez_obsA znorg r 2012 年 11 月 8 日 13:37:52[电子邮件保护]           1        
   7880 0.55500 b2j73_obsA znorg r 2012 年 11 月 8 日 13:37:52[电子邮件保护]           1        
(...)
   7955 0.55500 b2qcp_prdE znorg r 2012 年 11 月 8 日 13:44:07[电子邮件保护]           1        
   7956 0.55500 c3o2e_obsE znorg r 2012 年 11 月 8 日 13:44:22[电子邮件保护]           1        
   7960 0.55500 c3zzp_obsE znorg r 2012 年 11 月 8 日 13:44:37[电子邮件保护]           1        
   7995 0.55500 s1enh_prdA znorg r 2012 年 11 月 22 日 16:06:24[电子邮件保护]           1        
   7996 0.55500 s1igd_prdA znorg r 2012 年 11 月 22 日 16:06:39[电子邮件保护]           1        
   7997 0.55500 s1ixs_prdA znorg r 2012 年 11 月 22 日 16:06:39[电子邮件保护]           1        
(...)
   8008 0.55500 s1igd_prdD znorg r 2012 年 11 月 22 日 16:07:39[电子邮件保护]            1        
   8009 0.55500 s1ixs_prdD znorg r 2012 年 11 月 22 日 16:07:39[电子邮件保护]           1        
   8010 0.55500 s1shg_prdD znorg r 2012 年 11 月 22 日 16:07:39[电子邮件保护]           1        

我想删除最后 16 个作业,因此我输入了:

[znorg@server MD]$ qdel 7995 7996 7997 7998 7999 8000 8001 8002 8003 8004 8005 8006 8007 8008 8009 8010

返回:

znorg 已注册作业 7995 以供删除
znorg 已注册作业 7996 以供删除
znorg 已注册作业 7997 以供删除
znorg 已注册作业 7998 以供删除
znorg 已注册作业 7999 以供删除
znorg 已注册作业 8000 以供删除
znorg 已注册作业 8001 以供删除
znorg 已注册作业 8002 以供删除
znorg 已注册作业 8003 以供删除
znorg 已注册作业 8004 以供删除
znorg 已注册作业 8005 以供删除
znorg 已注册作业 8006 以供删除
znorg 已注册作业 8007 以供删除
znorg 已注册作业 8008 以供删除
znorg 已注册作业 8009 以供删除
znorg 已注册作业 8010 以供删除

到目前为止一切顺利,看起来一切进展如预期。

但当我再次检查时,几乎所有其他工作都消失了:

[znorg@server MD]$ qstat
作业 ID 先前名称 用户状态 提交/开始于队列槽 ja-task-ID
-----------------------------------------------------------------------------------------------------------------
   7712 0.55500 shg_oCAB_c znorg dr 2012 年 10 月 30 日 13:49:07[电子邮件保护]           1        
   7893 0.55500 a1t8k_prdB znorg r 2012 年 11 月 8 日 13:39:07[电子邮件保护]           1        
   7929 0.55500 a1t8k_prdD znorg r 2012 年 11 月 8 日 13:42:07[电子邮件保护]           1        

我做错了什么吗?这里可能发生了什么?

答案1

看来工作已经完成了。我看不出你的奎德尔命令。从最后得到的数字来看,似乎不是奎德尔操作。您可以通过以下方式查看一些工作信息:

  qacct -o znorg -j Job-ID

相关内容