@Purpose
2017-03-13T08:28:48.000000Z
字数 1438
阅读 1536
linux笔记
在Centos7下跑mpi的时候,除了出现要你敲-allow-run-as-root 这样有长又烦人的语句之外,还有一个令人抓狂的地方是,你每次运行都提示你一个xxx找不到,识别不了,你必须要等十五秒才可以正常运行程序......
经过我多番百度谷歌之后,终于在Red Hat的社区里找到了有用的解决方案(不愧是centos的老大)
#Reproducer:[root@rdma-qe-06 ~]$ rpm -qf $(which fi_info)libfabric-1.3.0-3.el7.x86_64 #据说就是这个1.3.0版本的锅,自带bug[root@rdma-qe-06 ~]$ fi_infordma-qe-06.56339hfi_wait_for_device: The /dev/hfi1_0 device failed to appear after 15.0 seconds: Connection timed out #就是这行东东,每次你都要等十五秒,程序才会运行verbs: IB-0x80feversion: 1.0type: FI_EP_MSGprotocol: FI_PROTO_RDMA_CM_IB_RCverbs: IB-0x80feversion: 1.0type: FI_EP_RDMprotocol: FI_PROTO_IB_RDMUDP: UDP-IPversion: 1.0type: FI_EP_DGRAMprotocol: FI_PROTO_UDPsockets: IPversion: 1.0type: FI_EP_MSGprotocol: FI_PROTO_SOCK_TCPsockets: IPversion: 1.0type: FI_EP_DGRAMprotocol: FI_PROTO_SOCK_TCPsockets: IPversion: 1.0type: FI_EP_RDMprotocol: FI_PROTO_SOCK_TCP#Verification:[root@rdma-qe-06 ~]$ rpm -q libfabriclibfabric-1.4.1-1.el7.x86_64 #升级到了1.4.1之后就没有这个问题了[root@rdma-qe-06 ~]$ time fi_infoprovider: verbs #看,没有了那烦人的十五秒等待fabric: IB-0x80fedomain: mlx5_0version: 1.0type: FI_EP_MSGprotocol: FI_PROTO_RDMA_CM_IB_RCprovider: UDPfabric: UDP-IPdomain: udpversion: 1.0type: FI_EP_DGRAMprotocol: FI_PROTO_UDPprovider: UDPfabric: UDP-IPdomain: udpversion: 1.0type: FI_EP_DGRAMprotocol: FI_PROTO_UDP
然而,,你知道了要升级也没有用……因为,目前阿里云,中科大,163等常见的yum源里都没有1.4.1版本,只有这个罪恶的1.3.0(130也不算老,去年12月份的好像)
所以你要自个跑去下载,传送门在此
进去选择1.4.1下载,然后上传到虚拟机中(你喜欢也可以用wget)
要用 yum remove命令手动卸载掉老旧版本先
然后rpm -ivh命令安装rpm文件
然后重新yum安装无辜的openmpi
这个时候那个烦人的十五秒就没有啦~