产品介绍 - tencentmusic/cube-studio GitHub Wiki

平台简介:

cube studio开源云原生一站式机器学习/深度学习AI平台,支持sso登录,多租户/多项目组,数据资产对接,notebook在线开发,拖拉拽任务流pipeline编排,多机多卡分布式算法训练,超参搜索,推理服务VGPU,多集群调度,边缘计算,serverless,标注平台,自动化标注,数据集管理,大模型一键微调,llmops,私有知识库,AI应用商店,支持模型一键开发/推理/微调,私有化部署,支持国产芯片

image

产品对比

主要功能介绍-算力/存储/用户管理

image

MLOPS-一站式开发工具

  • 系统多租户/多实例管理,在线交互开发调试,无需安装三方控件,只需浏览器就能完成开发。
  • 支持vscode,jupyter,Matlab,Rstudio等多种在线IDE类型
  • Jupyter支持cube-studio sdk,Julia,R,python,pyspark多内核版本,

image

  • 支持c++,java,conda等多种开发语言,以及tensorboard/git/gpu监控等多种插件
  • 支持ssh remote与notebook互通,本地进行代码开发
  • 在线镜像构建,通过Web Shell方式在浏览器中完成构建;并提供各种版本notebook,inference,gpu,python等基础镜像

image

MLOPS-可视化数据标注

  • 支持图/文/音/多模态/大模型多种类型标注功能,用户管理,工作任务分发
  • 对接aihub模型市场,支持自动化标注;对接数据集,支持标注数据导入;对接pipeline,支持标注结果自动化训练

image

MLOPS-拖拉拽建模流程

image

分布式多机多卡训练

image

MLOPS-模板自定义

  • 和非模板开发相比,使用模板建立应用成本会更低一些,无需开发平台。
  • 迁移更加容易,通过模板标准化后,后续应用迁移迭代只需迁移配置模板,简化复杂的配置操作。
  • 配置复用,通过简单的配置就可以复用这些能力,算法与工程分离避免重复开发。

image

MLOPS-流水线调试

  • Pipeline调试支持定时执行,支持,补录,并发限制,超时,实例依赖等。
  • Pipeling运行,支持变量在任务间输入输出,全局变量,流向控制,模板变量,数据时间等
  • Pipeling运行,支持任务结果可视化,图片、csv/json,echart源码可视化

image

MLOPS-超参搜索

  • 界面化呈现训练各组数据,通过图形界面进行直观呈现。
  • 减少以往开发调参过程的枯燥感,让整个调参过程更加生动具有趣味性,完全无需丰富经验就能实现更精准的参数控制调节。

image

MLOPS-自动化零代码推理部署

  • 支持模型管理注册,灰度发布,版本回退,模型指标可视化,以及在piepline中进行模型注册
  • 推理服务支持多集群,多资源组,异构gpu环境,平台资源统筹监控,VGPU,服务流量分流,复制,sidecar
  • 支持0代码的模型发布,gpu推理加速,支持训练推理混部,服务优先级,自定义指标弹性伸缩。

image

MLOPS-监控报警体系

image