国庆假期,闲来犯贱忽然想起了要给 ASUS 笔记本 U303LNB 来装个Nvidia 的显卡驱动。然后,就有了后面的这一出记录。
根据折腾结果,回来总结的内容,与实际发生的先后顺序有所不同。
按照网上提供的各种套路,在 sudo update-initramfs -u 期间冒出下面的提示,由于不明白对于成功安装Nvidia驱动会有什么不良后果,就开启了关于 update-initramfs 的各种依赖安装。
如果选择 deb (local),则使用下面的命令安装:
说明GPU已经被调用,并开始计算。
确认以下显卡的驱动等情况;
一般情况下,NVIDIA显卡需要手动启动。
使用小齿轮测试显卡性能:
一般应该是直接连上网线就能用,我用的园区有线网络,需要配置ipv4网址和个人账户登陆,我的wifi连接有问题。
上面的设置完了基本就能使了,有网络安装东西或查阅资料都很方便。接下来解释部署环境了。
首先是安装显卡驱动,这里有点玄学,我一时也没搞明白,但最后是能用了。
一开始在命令行输入nvidia-smi是没有结果的,说明没有安装显卡驱动,于是开始安装:
安装过程有点复杂,搞了好几个小时都没正常解决,一开始在终端安装,提示
查询后说是目前界面占用了显卡程序,需要关闭显卡服务后安装,按 ctrl + alt +F1或F2可切换,进入一个黑色界面后,登陆用户,关闭显卡服务,进行驱动安装:
"安装好驱动程序后再重启"进入下载好驱动的文件夹,进行安装(对应自己的版本)
不幸的是,我这里总是出问题,搜索出现的问题还没有很好的解决办法,这里提供几个认为帮助比较大的博客:
我后面也是发现我有一个系统内核问题,headers和devel的版本有问题,于是根据上述博客不断更新刷新,后面还是报错,没有正常装完。
我退出黑色界面后,进入桌面的命令行终端,输入nvidia-smi,结果显示了显卡驱动的版本,于是就尝试往下装cuda等环境,验证调用显卡竟然成功了。所以过程有点曲折,主要是显卡驱动安装,结果还是莫名其妙能用了。
执行上述命令不成功的原因主要是没能查找到 解析cuda版本 的命令,可用如下方法解决:
"添加如下两行命令到文件末尾即可" "保存退出后执行如下命令"在解决联网和显卡驱动安装后,环境部署涉及的cuda、cudnn和环境安装、框架编译记录如下:
其中关于cuda安装:
我直接根据硬件版本查询到的cuda版本是最新版本,但是显卡驱动最大支持的版本是11.4,于是就不能装这个。
其实可以直接查询以前的版本,或者直接朝你需要的版本,比如我想装cuda11.1,直接找就可以
此外,查询到的版本提供的安装命令是,没有其他提示:
这个时候可以直接打开第一条命令wget后面的网址,这时就会直接下载这个文件,而不是命令行下载安装,也可以预防命令行下载失败,使用文件离线安装。
下载后解压,拷贝到cuda的文件夹下:
"进入到解压后的文件夹执行下述命令:"