Ubuntu操作系统
NFS(Network File System)网络文件系统,它允许网络中的计算机之间共享资源。在集群调度场景下,需要依赖NFS环境实现训练任务或推理任务的正常运行。NFS可以安装在服务器端或者客户端,用户可以根据需要进行选择。
在服务器端安装
- 使用管理员帐号登录存储节点,执行以下命令安装NFS服务端。
apt install -y nfs-kernel-server
- 根据实际情况固定NFS相关端口并配置相关端口的防火墙。
- 执行以下命令,创建一个共享目录(如“/data/atlas_dls”)并修改目录权限。
mkdir -p /data/atlas_dls chmod 750 /data/atlas_dls/
- 在“/etc/exports”文件末尾追加以下内容,根据需要配置允许的IP地址并加固相关权限设置。
/data/atlas_dls 业务IP地址(配置必要的权限)
- 执行以下命令,启动rpcbind。
systemctl restart rpcbind.service systemctl enable rpcbind
- 执行以下命令,查看rpcbind是否已启动。
systemctl status rpcbind
出现以下回显,说明服务正常。
root@ubuntu:/data/xxx# service rpcbind status ● rpcbind.service - RPC bind portmap service Loaded: loaded (/lib/systemd/system/rpcbind.service; enabled; vendor preset: enabled) Active: active (running) since Fri 2021-01-08 16:39:03 CST; 6 days ago Docs: man:rpcbind(8) Main PID: 2952 (rpcbind) Tasks: 1 (limit: 29491) CGroup: /system.slice/rpcbind.service └─2952 /sbin/rpcbind -f -w Jan 08 16:39:03 ubuntu-211 systemd[1]: Starting RPC bind portmap service... Jan 08 16:39:03 ubuntu-211 systemd[1]: Started RPC bind portmap service.
- rpcbind启动后,执行以下命令,启动NFS服务。
systemctl restart nfs-server.service systemctl enable nfs-server
- 执行以下命令,查看NFS服务是否已启动。
systemctl status nfs-server.service
出现以下回显,说明服务正常。
root@ubuntu:/data/xxx# service nfs-kernel-server status ● nfs-server.service - NFS server and services Loaded: loaded (/lib/systemd/system/nfs-server.service; enabled; vendor preset: enabled) Active: active (exited) since Fri 2021-01-08 16:39:03 CST; 6 days ago Main PID: 3220 (code=exited, status=0/SUCCESS) Tasks: 0 (limit: 29491) CGroup: /system.slice/nfs-server.service Jan 08 16:39:03 ubuntu-211 systemd[1]: Starting NFS server and services... Jan 08 16:39:03 ubuntu-211 exportfs[3181]: exportfs: /etc/exports [1]: Neither 'subtree_check' or 'no_subtree_check' specified for export "*:/data/atlas_dls". Jan 08 16:39:03 ubuntu-211 exportfs[3181]: Assuming default behaviour ('no_subtree_check'). Jan 08 16:39:03 ubuntu-211 exportfs[3181]: NOTE: this default has changed since nfs-utils version 1.0.x Jan 08 16:39:03 ubuntu-211 systemd[1]: Started NFS server and services.
- 执行以下命令,查看共享目录(如“/data/atlas_dls”)挂载权限。
cat /var/lib/nfs/etab
出现以下回显,说明服务正常。
root@ubuntu:~# cat /var/lib/nfs/etab /data/atlas_dls *(rw,...会显示配置的对应权限)
在客户端安装
使用管理员帐号登录其他服务器,执行以下命令安装NFS客户端。
apt install -y nfs-common
父主题: 安装NFS