【0号教程】书写代码的必要前置工作 登录注册账号 1、在校外登录需要先下载连接重邮vpn(https://vpn.cqupt.edu.cn) 2、登录jumpserver web端(server.ddwtop.team),输入账号密码进入如下界面
记录一次GPU集群的存储崩溃 集群架构:整个GPU集群由4台GPU服务器、一台CPU服务器、一个存储阵列(大概200T)组成。存储阵列是通过一个万兆交换机连接到这个Node00管理节点。其它计算设备都是走的管理节点的映射。
进入此电脑,右键添加网络位置 一直下一步,直到添加指定网址的位置,输入\share.ddwtop.team\ddwgroup
服务器基础环境安装 保证服务器的系统版本是20.04及其以上 在线升级的教程,服务器默认是无网络连接环境,网络配置参考教程 1. sudo apt update # 如果遇到apt下载问题,自行换源,参考(https://mirrors.tuna.tsinghua.edu.cn/help/ubun
大模型加速方法 accelerate Accelerate支持使用DeepSpeed在单个/多个GPU上进行训练 安装包 pip install accelerate 代码部分 初始化accelerator对象
Gitea是一个轻量级的子托管Git服务。使用Gitea可以帮助团队更好地管理代码,进行版本控制,协作开发,并且可以在自己的服务器上进行部署和管理,从而保护代码的安全性和隐私性。 提示: Q1:使用VSC自带的git工具无法正常推送本地仓库到gitea怎么办?或者报错怎么办? A:用终端使用git
配置IB网卡的IP 1.查看IB网卡接口名称 ip a 可以查看到ib开头的接口就是当前IB网卡的接口名称。 2.创建一个新的网络配置文件 <