惯性聚合 高效追踪和阅读你感兴趣的博客、新闻、科技资讯
阅读原文 在惯性聚合中打开

推荐订阅源

SecWiki News
SecWiki News
I
InfoQ
The Cloudflare Blog
人人都是产品经理
人人都是产品经理
博客园 - Franky
T
Tailwind CSS Blog
让小产品的独立变现更简单 - ezindie.com
让小产品的独立变现更简单 - ezindie.com
量子位
博客园_首页
罗磊的独立博客
V
V2EX
李成银的技术随笔
大猫的无限游戏
大猫的无限游戏
钛媒体:引领未来商业与生活新知
钛媒体:引领未来商业与生活新知
T
True Tiger Recordings
Vercel News
Vercel News
Cyberwarzone
Cyberwarzone
Cisco Talos Blog
Cisco Talos Blog
F
Fox-IT International blog
D
Darknet – Hacking Tools, Hacker News & Cyber Security
M
Microsoft Research Blog - Microsoft Research
Know Your Adversary
Know Your Adversary
爱范儿
爱范儿
The Register - Security
The Register - Security
G
Google Developers Blog
The Hacker News
The Hacker News
Malwarebytes
Malwarebytes
S
Securelist
博客园 - 三生石上(FineUI控件)
Jina AI
Jina AI
T
Threat Research - Cisco Blogs
T
The Exploit Database - CXSecurity.com
S
SegmentFault 最新的问题
博客园 - 叶小钗
F
Fortinet All Blogs
Apple Machine Learning Research
Apple Machine Learning Research
宝玉的分享
宝玉的分享
博客园 - 聂微东
T
Threatpost
博客园 - 【当耐特】
D
Docker
P
Privacy & Cybersecurity Law Blog
www.infosecurity-magazine.com
www.infosecurity-magazine.com
G
GRAHAM CLULEY
V
Visual Studio Blog
C
Cisco Blogs
IT之家
IT之家
S
Security Archives - TechRepublic
Latest news
Latest news
阮一峰的网络日志
阮一峰的网络日志

西行妖

T618冷门平板刷机从入门到理赔 12700h es新all in Boom折腾记录 Kde6 Electron程序在wayland模式下无法运行终极解决方案 蜗牛星际NAS再次折腾记录 2023年度总结 CS61B最后的总结:比较排序与基数排序 工程机,我劝你别买 为thinkbook14p G3更换高刷屏幕 专有名词笔记 时间轴 谷歌域名即将被收购,如何薅到最后一波羊毛 人在囧途——记录我的日本之行 记一次衣服被子被偷的离谱经历 关于本站迁移的公告 java的某些常用特性 python3将对象作为线程使用 在Chromebook上使用Windows是什么体验?记录我到目前为止用过的Chromebook Chromebook刷bios解除企业锁折腾记录 Vue3的computed计算属性传参 在Docker容器中运行服务 将操作系统从Windows转向Linux [预告]固态硬盘太贵?试试看自己做一个吧 Ai绘画体验——利用校徽生成对应虚拟形象 AutoWhitelist诈尸更新dev&新的未来计划 它很好,但对我来说不够好——关于华硕无双15.6 [推广]蓝易云暑期大采购活动 Potplayer+SVP4插帧看番体验——24帧日漫轻松提升至60帧 AList搭建教程&网盘迁移至AList公告 Autowhitelist介绍&我对mc白名单的研究 还是v2ex大神多,记一次遇到bug被大佬拯救 关于MC服务器毁档重开 对于本站消失的回应 利用蹩脚的 js 知识写了一个统计真实访客数量的脚本 谈谈我高中时用过的手机 高考前夕,再谈我的想法 轻松搭建gitlab私人代码库 每周灵感 - 01 每周灵感 - 00 heroku使用教程——真正的零成本搭建PHP动态博客 关于tencent-push项目的总结&后续计划 我们已经失去了辩论能力吗?关于我对“拉黑”的看法 似乎更不好的近况 不怎么好的近况 记一次我与某网课系统的对抗 高考96天倒计时,我想说的话&以后的一些计划 关于最近俄乌局势我的看法 本站打算做出的一些改变&我对网左/键政的看法 [转发]我是衡水桃城中学的一名学生 关于西安节点合作商“昔年”跑路的公告 什么才是年轻人需要的文化?我对于“抵制洋节”的看法 平顶山刘玉坤事件接力 友情链接 关于本站数据丢失&抢救 关于我 关于我新搭建的oneindex网盘(附教程) [纯教程]如何搭建QQ微信转发服务器 关于我新买的LG V50&如何搭建QQ第三方推送服务器 三胎政策的出台,是否意味着政府已经急了?关于我对生育率的思考 网站更新&迟来的4月总结 如何看待“网抑云”这一现象的流行 如何用阿里云服务器开一个我的世界皮肤站
A卡深度学习服务器折腾&踩坑记
2022-11-06 · via 西行妖

作为一个并不上进的带学生,在听说隔壁人工智能专业寒假有旁听网课时,我便立刻报名参加并顺利通过了申请。但这门课有个很坑的地方:设备必须自带。想起我那跑ai绘画分辨率一拉高都能崩的垃圾电脑,在得到家人支持后,我便开始了服务器的组建。

最开始的配置是这样的:

  • CPU:D1581
  • 显卡:Tesla P40
  • 内存:32G DDR4

但当配置确定下来没几天后,也许是家里人被我并不存在的上进心感动了,把服务器的配置全面升级了一番:

  • CPU:13700KF
  • 显卡:3070
  • 内存:32G DDR5

不过伴随配置升级带来的兴奋感还没到半天,家里人就表示配置可能要”稍微”降级一下。虽然我对此表示情绪稳定,但在了解实际配置后我的情绪马上就不稳定了:CPU确实是稍微降级了一点,变成了13600KF,少了4个大核,不过价格降了不少,还能说是因为性价比。至于显卡方面,则是换成了AMD的MI50运算卡。

虽然我没研究过深度学习,但我对AMD玄学兼容性的恶名早有耳闻,不由得犹豫了起来。但在我稍微百度了一遍后,发现AMD早在几年前就发布了ROCm技术以对标CUDA。看着描述里的“支持pytorch和tensorflow”,我便开始动心了,马上就同意了换成A卡。在现在领会到AMD的恶名后,我发现这真是我做过最后悔的决定。

铺垫的已经够了,废话少说,下面是完整折腾过程:

在安装驱动时,我本来还不以为意:这有什么难的?但在安装过程中,我足足换了大概3个系统:

  1. Ubuntu 22.10
  2. Ubuntu 22.04 带GUI
  3. Windows10 LTSC 2019
  4. Ubuntu 22.04

而在折腾过程中,我也是足足掉进了不少坑里,也积累了不少经验,下面就按时间顺序总结一下:

1.系统最高只支持Ubuntu 22.04。为什么这点如此重要呢?因为AMD提供的ROCm安装程序依赖库及其老旧,高版本apt源并没有这类依赖库,因此会报无法安装。

2.在使用amdgpu-install安装时,必须要带上—no-dkms参数,因为默认的dkms模式会将驱动安装至内核,而由于只支持4.x版本的老旧内核,因此在较新的内核安装时会遇到dkms一直提示无法安装的情况。

3.一定不要用Windows,因为ROCm并不支持Windows使用,意味着你只能用这张卡打游戏以及跑渲染和剪辑。

遇到的这些坑虽然看起来很少,但我却研究了好几天才成功,只能说AMD在深度学习方面打不过N不是没用原因的。

当你看到这里时,我终于安装成功了。在google以及amd官方人员的帮助下,我终于装好了显卡驱动并成功运行了ai-benchmark。

以下是安装时用到的教程链接:

https://askubuntu.com/questions/1429376/how-can-i-install-amd-rocm-5-on-ubuntu-22-04 https://github.com/RadeonOpenCompute/ROCm/issues/1852#event-7730462672

以下是当前系统概览:

  • 系统:Ubuntu server 22.04.1
  • 内核:5.15
  • Rocm版本:5.1.1

当我折腾完这一切后,再回过头看,发现我的努力并没有白费:这张卡的ai-benchmark分数在P100和3070之间,而这两张卡价格都远超现在的这一张。再加上16G显存,在性价比方面的确有更为显著的优势。

要是AMD能够完善相关驱动支持的话,我觉得A卡还是很值得买的,性价比方面的巨大优势的确吸引了我这类穷学生。换个方面说,多亏了AMD,我总算用上了便宜的N卡和IU(逃)。

2022.11.15