算力与分布式存储 - tencentmusic/cube-studio GitHub Wiki

算力统筹/均衡

面临的问题：

解决方案：

在这里插入图片描述

面临问题：

解决方案：

平台在开发notebook，数据文件处理训练pipeline，以及模型服务化中挂载相同的分布式存储，同时不同用户会挂载不同的子目录。同一个用户在平台的各个环节部分/mnt/$username下面都是个人的工作目录。

在这里插入图片描述

pvc挂载，例如：kubeflow-user-workspace(pvc):/mnt/，会自动将pvc下的$username子目录，挂载到容器目录的$username子目录下面
hostpath挂载，例如：/data/kubeflow/k8s/kubeflow/pipeline/workspace/group1(hostpath):/mnt1，会将主机目录挂载到容器目录，一般用于多人共享编辑同一个目录使用
configmap挂载，例如：kubernetes-config(configmap):/root/.kube，会将configmap挂载到容器目录，一般用于将特殊配置文件挂载到容器
内存挂载，例如： 4G(memory):/dev/shm，会将内存挂载到容器，一般用于处理k8s 共享内存的问题

可以使用juicefs作为分布式文件系统(不需要挂载到每台机器就可以实现多个Pod直接共享统一目录)，

执行cd install/kubernetes/juicefs/ && sh start_juicefs.sh;

执行前请阅读install/kubernetes/juicefs/README.md,

并记得修改install/kubernetes/juicefs/.env的JUICEFS_HOST_IP为本节点的ip，保证/data目录有足够的空间

并注意配置好开机自动挂载避免在机器重启后挂载失效