|
目前我的pbs系统已经基本配置好了,server叫hansen,一个节点叫poisson。
在server我自己的目录下可以正常qsub提交,返回id号,但是qstat列出的任务
状态先是R、Q,最后是E。
还受到了PBS自动发的邮件,
PBS Job Id: 13.hansen.cse.unsw.EDU.AU
Job Name: sample.sh
Post job file processing error; job 13.hansen.cse.unsw.EDU.AU on host poisson/0
Unable to copy file 13.hansen.c.OU to
hansen.cse.unsw.EDU.AU:/home/hfeng/PBS.stdout
>>> error from copy
hansen.cse.unsw.EDU.AU: Connection refused
ion
>>> end error output
Output retained on that host in: /usr/spool/PBS/undelivered/13.hansen.c.OU
查看了poisson下的/usr/spool/PBS/undelivered/13.hansen.c.OU,确实任务
已经运行完,看上去像结果文件没法拷贝回来。
感觉问题出在server和node间的通讯上,我想用ssh方式,安装pbs时configure里
选择了--with-scp。因为一共也就两个人用,ssh配置应该比较简单。
我已经在node和server上的autorithed_key里添加了各自的pub key,现在都可以
做到scp不用输入密码。但是好像pbs还是没法正常拷贝。
现在我不太了解pbs是否是采用各个机器的root帐号进行文件拷贝,还是普通用户?
是不是还有其他地方关于ssh的设置? |
|