高算平台配置本地pytorch1.6及cuda环境搭建
发布人:张子卓  发布时间:2022-03-13   浏览次数:1407

1.工作环境:(去网上下载)

XshellFinalShellXftp等。

2.软件及下载列表:

Anaconda3(服务器上的版本是Anaconda3-2020.11-Linux-x86_64.sh 528M 里面带的python版本是3.8的)

Cuda(cuda_10.0.130_410.48_linux.run 1.8G) 服务器上的没有.run,自己加上就行。

Cudnn(cudnn-10.0-linux-x64-v7.4.1.5.tgz 403M)

这里安装的是cuda10.0版本的。其安装程序在/apps/soft/installpkg目录中有,可以不用再去网上下载,网上下载也可以。不管是服务器上的还是网上下载的,都要放到自己的家目录下才能安装。


Pytorh版本:1.6.0,对应cuda10.0,注意依赖包之间版本的对应关系。

pytorch-1.6.0-py3.8_cuda10.1.243_cudnn7.6.3_0.tar.bz2

torchvision-0.9.0-py38_cu101.tar.bz2

cudatoolkit-10.1.243-h6bb024c_0.tar.bz2

安装时要拷贝到自己的家目录下才能安装。注意这里的版本号,python要用3.8的,cudatoolkit可以使用10.1的,虽然前面cuda用的是10.0的。

3.安装顺序:

先安装Anaconda3,这一步基本没什么问题

再安装cudacudnn,然后在线安装pytorch, torchvision, cudatoolkit这三个就行了。以下两张截屏可以参考:最后那两个命令是验证是否安装正确:


4.安装命令参考

注意:Linux是区分大小写的,如果文件名是小写,命令中一定要小写文件名。

1)安装anaconda3的命令:

bashanaconda3-2020.11-Linux-x86_64.sh

2)安装cuda的命令:

chmod+x cuda_10.0.130_410.48_linux.run

./cuda_10.0.130_410.48_linux.run

具体内容看显示说明就行,也可以参考网上资源说明,没什么难点。

3)安装cudnn的命令

tar-xzvf cudnn-10.0-linux-x64-v7.4.1.5.tgz

上述命令是解压命令,解压完了以后要拷贝到相应的cuda目录中去,可以用linux命令,也可以用xftp,这个上网查一下就好。

Linux拷贝命令举例:

cp/data/users/CHDHPC/lwmnpop/cudnn/include/cudnn.h/data/users/CHDHPC/lwmnpop/cuda-10.0 /include/

cp/data/users/CHDHPC/lwmnpop/cudnn /lib64/libcudnn*/data/users/CHDHPC/lwmnpop/cuda-10.0/lib64

chmoda+r /data/users/CHDHPC/lwmnpop/cudnn /include/cudnn.h/data/users/CHDHPC/lwmnpop/cuda-10.0/lib64/libcudnn*

命令格式:cp原文件目标文件

命令中间是有空格的。

这三个命令都要执行,执行前把我的目录换成你的目录就行了,就是那个lwmnpopCudnn的解压目录一定要是cudnnCuda的安装目录一定要是cuda-10.0,如果不是,换成你自己的。

注意:安装完成后,修改bashrc文件,这个是个隐藏文件,需要打开xftp设置里的显示隐藏文件才能看见,这样才能在xftp下进行编辑,当然,如果用命令直接编辑,就无所谓了。Xftp编辑完了以后,可以重启xshell,就不用执行source~/.bashrc命令了,它会重新加载环境变量。

这是命令编辑方式:

nano~/.bashrc

#进入后在最后两行加入以下内容

exportPATH=$HOME /data/users/CHDHPC/lwmnpop/cuda-10.0/bin:$PATH

exportLD_LIBRARY_PATH=$LD_LIBRARY_PATH:$HOME/data/users/CHDHPC/lwmnpop/cuda-10.0/lib64/

#修改之后使环境变量生效

source~/.bashrc


4)安装pytorch的命令

condainstall --offlinepytorch-1.6.0-py3.8_cuda10.1.243_cudnn7.6.3_0.tar.bz2

5)安装torchvision的命令

condainstall --offline torchvision-0.9.0-py38_cu101.tar.bz2

6)安装cudatoolkit的命令

condainstall --offline cudatoolkit-10.1.243-h6bb024c_0.tar.bz2


 
copyright@2022长安大学 | 高性能计算平台