课题组服务器修理¶
约 751 个字 5 行代码 1 张图片 预计阅读时间 3 分钟
Manager 服务器实拍图:
Manager¶
介绍¶
-
Manager 在断电重新来电时,节点不会重启,需到 312 机房手动重启
-
下方(node1-10)和最上方(node11)的是计算节点,中间的是 Manager 节点,也是计算节点,Manager 和 node1-10 均有 8 核,node11 有 12 核,共 100 核;将任务提交到 node11 的命令是
gsub
,提交到其他节点的命令为submit -n 8 vasp
,无法指定具体节点进行计算 -
node1-10 和 node11 的总开关在右侧,Manager 的开关在左侧
-
node1-10 中有两个按钮,上方按钮是 node 开关按钮,下方按钮切换到该 node 屏幕显示按钮,按该按钮后会变成蓝色,正常都是绿色。若某节点上方按钮变成红色,说明该节点处于 down 状态,按该按钮将其重启,修理较为简单;若 Manager 节点处于 down 状态,则较难处理,建议找孔老师
-
node1-10 中,其中 6 号节点经常 down,一般不修(目前共 node2,6,7,8 经常 down,其他偶尔会 down)
-
一般电脑屏幕的信号线(VGA 线 1 根,现在连在 Master 上,因此 Manager 上无法用屏幕查看 node 节点状态,后侧)和鼠标线(1 根蜂窝口,后侧)插在 Manager 上,键盘线(2 根,一根 USB 口(前侧),一根蜂窝口(后侧))分别插在 Manager 和 node1-10 上。检查 Manager 相关节点状态时需将信号线、鼠标线和键盘线插在对应的节点接口上(node1-10 公用一个接口线)
-
最下方的是硬盘,不用管
重启 SSH¶
- 服务器 SSH 登录严重卡顿时,可在 Manager/Master 上重启 SSH 服务
/dev/null 相关报错¶
- 出现
/dev/null bad permissions
报错
su manager # 切换为 manager 用户,需输入 manager 用户密码
ls -l /dev/null # 查看 /dev/null 权限信息(此时大概率为 600)
sudo chmod 666 /dev/null # 修改 /dev/null 权限,需输入 manager 用户密码
关闭、重启 Manager¶
关闭 Manager 操作:
-
先关闭 node1-10(节点全部关闭后再按其右侧的总开关)和 node11(node11 没有鼠标,通过键盘快捷键
Ctrl+F10
关闭),再关闭 Manager 节点 -
关闭对应节点需在图形界面上进行操作(需将相关的线连到对应的节点接口上,可将 Master 上的 VGA 线拔下来插到 Manager 上)
重启 Manager 操作:
-
先重启 Manager,再重启 node1-10 和 node11,顺序相反
-
直接按开关即可,可以在图形界面上检查是否重启成功(非必要操作)
Master¶
-
Master 在断电重新来电时,节点会自动重启
-
在计算节点中进出不会导致服务器负载过高而崩溃
-
VSCode 远程连接 Manager(机子较老,10 余年历史),有时会导致其负载过高而崩溃,不建议长时间连接;VSCode 远程连接 Master(2023 年 5 月配置)暂无相关问题
办公室打印机¶
-
306 办公室 HP 打印机 WiFi:DIRECT-da-HP M232 LaserJet
-
新连接密码查看方式:按打印机旁边的
i
按钮,会打印其自身的一些信息,其中包括 'Wi-Fi Direct Password',值为新的 WiFi 密码(破折号也是密码的一部分)